• AI Brew
  • Posts
  • OpenAI Sora, Gemini 1.5 Pro

OpenAI Sora, Gemini 1.5 Pro

Et aussi : que va devenir le "busywork" avec toutes ces IA ?

Bonjour đź‘‹,

Cette semaine l’actualité IA a été une nouvelle fois très marquée par Google et OpenAI.

Les deux géants de l’IA s’affrontent à coups d’annonces sur des technologies toutes plus révolutionnaires les unes que les autres :

  • Google a annoncĂ© Gemini 1.5 Pro, un nouveau modèle qui sera capable d’analyser des volumes de donnĂ©es colossaux, jusqu’à 700 000 mots ou des vidĂ©os d’une heure. Ă€ titre indicatif, GPT-4 Turbo d’OpenAI peut analyser l’équivalent de 300 pages de texte “seulement” !

  • OpenAI a frappĂ© très fort avec des communications sur leur prochain modèle text-to-vidĂ©o nommĂ© Sora. Ce modèle est sans doute le plus avancĂ© Ă  ce jour sur la gĂ©nĂ©ration de vidĂ©os. Plus performant que Runway ML et Pika dont nous avons dĂ©jĂ  parlĂ©.

Exciting times! comme ils disent…

đź”® Focus : OpenAI prĂ©sente Sora, une rĂ©volution dans la gĂ©nĂ©ration de vidĂ©os par IA

Image : OpenAI

OpenAI a annoncé l’arrivée prochaine de Sora, un modèle d'intelligence artificielle avant-gardiste capable de transformer du texte en vidéos. Ce modèle marque un jalon significatif dans le domaine de l'intelligence artificielle générative. Les démos présentées ont prouvé des capacités impressionnantes pour créer des scènes réalistes et créatives.

Sora est capable de générer des vidéos d'une durée allant jusqu'à une minute, avec une attention méticuleuse aux détails. Vous trouverez ici et là des exemples de vidéos générés avec Sora… C’est assez bluffant. Je vous encourage vivement à les regarder, car elles permettent de comprendre instantanément le potentiel de tels outils.

Le modèle excelle dans la transformation d'images fixes en vidéos et dans l'extension ou le remplissage de vidéos existantes. Il comprend la nature des objets et des personnages, permettant de générer des personnages expressifs et de capturer des émotions.

Cependant Sora a encore quelques difficultés dans la simulation précise de la physique et la compréhension de la cause à effet dans des scènes complexes.

Si vous pensiez pouvoir tester Sora, sachez qu’il va falloir patienter… Pour le moment il est très difficile d’accéder à Sora. Le produit est encore en cours de conception et des équipes de red teamers sont actuellement en train d’évaluer les risques de désinformation et de contenu haineux. Un système de métadonnées sera aussi mis en œuvre afin d’identifier les vidéos générées par Sora. Néanmoins, ces mesures pourraient s’avérer assez faibles par rapport au risque de désinformation que Sora présente, surtout à l’approche des élections aux États-Unis.

Au delà des vidéos, Sora pourrait ouvrir la voie à de nouveaux types de technologies. Imaginez par exemple ce à quoi les jeux vidéos de demain pourraient ressembler en y intégrant davantage d’IA.

Quoi qu’il en soit, on devrait en savoir davantage prochainement. Il y a fort à parier qu’on entende de nouveau parler des agents autonomes, de la recherche en ligne, ou encore de modèles orientés text-to-action.

🧑‍💻 ACTUS TECH & IA

Le nouveau modèle Gemini 1.5 de Google peut analyser une vidéo d'une heure, ou l’équivalent de 700000 mots

Image: Google

Google a annoncé la sortie prochaine de Gemini 1.5 Pro, un nouveau modèle de son système d'intelligence artificielle GenAI. Gemini 1.5 Pro peut traiter jusqu'à 700 000 mots ou 11 heures de contenu audio, ou 1 heure de vidéo. Cependant, seuls les développeurs approuvés en aperçu privé ont accès à cette version expérimentale. Le modèle offre une fenêtre de contexte allant jusqu'à 1 million de tokens, et son architecture utilise des modèles experts pour des résultats de qualité similaire à Gemini Ultra.

OpenAI serait en train de créer sa propre application de recherche pour rivaliser avec Google

Le géant de l'IA OpenAI développe une application de recherche pour concurrencer Google. Alimenté par Microsoft Bing, le moteur de recherche AI de ChatGPT pourrait être plus rapide que ChatGPT lui-même. OpenAI et Microsoft cherchent à détrôner Google, qui a vu ses revenus de recherche baisser. La montée en puissance de l'IA dans la recherche en ligne est une menace sérieuse pour Google.

Google ouvre un centre consacré à l’intelligence artificielle à Paris

Un nouveau centre dédié à l'intelligence artificielle a été inauguré par Google à Paris. Ce lieu regroupe 300 chercheurs et ingénieurs travaillant sur des projets liés à l'IA. L'objectif est de renforcer la collaboration avec les acteurs français de la recherche en IA et de former 100 000 professionnels d'ici 2025.

Comment les poursuites judiciaires sur le droit d'auteur de l'IA pourraient faire disparaître toute l'industrie

Les poursuites en matière de droit d'auteur liées à l'IA pourraient entraîner l'extinction de toute l'industrie. Les grandes entreprises médiatiques intentent des procès contre les entreprises d'IA, affirmant qu'elles volent leur travail. Le concept de fair use est utilisé comme défense, mais les décisions des tribunaux restent incertaines et les enjeux sont élevés pour l'avenir de l'industrie de l'IA.

🎙️ OPINIONS

IA VS. Busywork

Dans cet article très intéressant, l'auteur défend l'idée que le travail répétitif et sans importance peut avoir une valeur et être satisfaisant à certains égards. Il souligne que le "busywork" peut soulager la charge cognitive et permettre de se reposer mentalement. Il met en garde contre le risque de surcharge de travail si le "busywork" est éliminé sans offrir de véritable activité mentale en remplacement. L'auteur suggère qu'un équilibre entre travail répétitif et tâches plus stimulantes est souhaitable… Qu’on partage cet avis ou non, l’exploration de cette idée a le mérite d’être enrichissant.

🙏 Merci de nous lire. Ă€ la prochaine ! 

Pierre + 🤖