AI Brew
Posts
Claude 3 Opus surclasse GPT-4 dans plusieurs tests

Claude 3 Opus surclasse GPT-4 dans plusieurs tests

Et aussi : Klarna et son bot (trop) puissant, Stability AI, et Elon qui poursuit OpenAI en justice

Pierre Rognion
7th mars 2024

Bonjour 👋,

Vous allez dire que je me répète, mais semaine après semaine, une nouveauté IA vient tout chambouler et fait tourner les têtes.

Il y a deux semaines c’était OpenAI avec son futur modèle Sora.
La semaine dernière c’était le français Mistral AI avec son modèle Large, son chat et son partenariat avec Microsoft.
Cette semaine, c’est le grand retour d’Anthropic avec Claude 3, sa nouvelle série de modèles, dont le plus puissant serait supérieur à GPT-4.

Depuis cette annonce d’Anthropic, c’est un véritable torrent de curiosité et d'excitation que l’on observe dans la communauté IA. Alors Claude 3 sera notre focus de la semaine.

🔮 Anthropic dévoile Claude 3… et il semblerait bien qu’il soit supérieur à GPT-4

Résumé rapide :

Lancement officiel de Claude 3 par Anthropic, comprenant trois modèles : Haiku, Sonnet, et Opus.
Claude 3 Opus se distingue en surpassant des concurrents comme GPT-4 d'OpenAI et Gemini 1.0 Ultra de Google dans divers tests.
Les modèles de Claude 3 visent à établir de nouvelles références dans l'industrie pour une gamme variée de tâches cognitives.
Capacités multilingues améliorées et traitement multimodal des entrées textuelles et visuelles.
Focus sur la sécurité et la réduction des biais, disponibles via l'API d'Anthropic et des offres grand public comme Claude.ai.

Image : Anthropic

Anthropic a officiellement lancé Claude 3, une nouvelle gamme de modèles d'IA, marquant une avancée significative dans le paysage technologique de l'IA.

Ce lancement présente trois modèles distincts : Claude 3 Haiku, Claude 3 Sonnet et Claude 3 Opus, chacun conçu pour répondre à différents niveaux de complexité et besoins en performance.

Image : Anthropic

Claude 3 Opus, le modèle le plus avancé de la série, est mis en avant pour ses capacités exceptionnelles, surpassant des concurrents tels que GPT-4 d'OpenAI et Gemini 1.0 Ultra de Google dans divers examens de référence. Claude 3 Opus se positionne comme une solution de pointe pour gérer des tâches cognitivement complexes, telles que l'analyse financière détaillée.

Des améliorations notables sur les tâches cognitives complexes

La famille Claude 3 est conçue pour établir de nouveaux standards dans l'industrie pour une large gamme de tâches cognitives, incluant le raisonnement, la connaissance experte, les mathématiques et la maîtrise linguistique.

Ces modèles démontrent des niveaux de compréhension et de fluidité quasi humains sur des tâches complexes. Les capacités multilingues ont aussi bénéficié d’améliorations, offrant une meilleure fluidité en langues non anglaises telles que l'espagnol, le japonais et le français, ce qui élargit leur applicabilité dans la création de contenu mondial et les services de traduction.

Claude 2 fonctionnait déjà très bien sur le français et je le trouvais déjà meilleur que GPT-4 pour du copywriting, donc Claude 3 pourrait être une excellente surprise.

Des capacités multimodales

Claude 3 bénéficie aussi de capacités multimodales, permettant aux modèles de traiter et d'analyser à la fois les entrées textuelles et visuelles.

Cette fonctionnalité ouvre la porte à de nouveaux cas d'utilisation, tels que l'analyse de graphiques, de graphes et de diagrammes techniques, rendant Claude 3 particulièrement précieux pour les entreprises possédant des bases de connaissances en formats visuels.

Il est à noter que si Claude 3 peut analyser des images, il n'a pas la capacité de les générer, choix motivé par une demande moins importante en génération d'images de la part des entreprises.

D’ailleurs, les capacités de vision de Claude 3 sont plutôt très bonnes comme on peut le voir sur ce benchmark, ainsi que cette démonstration vidéo sur des données financières que je trouve assez bluffante :

Image : Anthropic

Sécurité, réduction des biais et hallucinations

Anthropic met l'accent sur la sécurité et la réduction des biais dans les modèles Claude 3, démontrant une réduction des biais par rapport aux versions antérieures et respectant une politique de développement responsable.

Les modèles sont conçus pour être plus précis et moins enclins aux erreurs, avec des capacités améliorées pour comprendre et répondre aux questions complexes et factuelles.

Cette attention portée à la sécurité et à la fiabilité est cruciale alors que les modèles d'IA sont de plus en plus intégrés dans divers aspects des affaires et de la société.

Qu'en est-il de la disponibilité ?

Les modèles Claude 3 sont disponibles via l'API d'Anthropic et des offres grand public comme Claude.ai, avec les modèles Sonnet et Opus accessibles dans 159 pays dès le lancement.

Haiku, décrit comme le modèle le plus rapide et le plus compact pour une réactivité quasi instantanée, sera bientôt disponible.

La collaboration stratégique d'Anthropic avec Amazon Bedrock a également rendu Claude 3 Sonnet disponible sur la plateforme, soulignant la dirigeabilité accrue du modèle et les nouvelles capacités de vision image-texte.

Et donc, on en pense quoi ?

En résumé, le lancement de Claude 3 par Anthropic est une réussite pour le moment. Anthropic offre ici des modèles de pointe avec un bel équilibre entre intelligence, rapidité et efficacité des coûts.

Avec des avancées dans les capacités multilingues, le traitement des entrées multimodales et un fort accent sur la sécurité et la réduction des biais, les modèles Claude 3 viennent titiller GPT-4 et Gemini Ultra et offrent une alternative intéressante et qui pourraient séduire pour de nombreux cas d’usages.

Cela va sûrement pousser OpenAI à accélérer le tempo avec GPT-5... et à baisser ses coûts. Ce qui est potentiellement une excellente nouvelle pour les clients.

Bonus : Claude.ai vous permet de tester la version Sonnet gratuitement. Si vous êtes en France, il vous sera peut-être nécessaire de passer par un VPN localisé aux US pour y accéder.

Image : Capture de Claude.ai

🧑‍💻 ACTUS TECH & IA

L'assistant IA de Klarna gère les deux tiers des chats du service clientèle dès son premier mois

L'assistant IA de Klarna gère les deux tiers des chats de service client au cours de son premier mois. Il a eu 2,3 millions de conversations, équivalent au travail de 700 agents à plein temps. Il améliore la satisfaction client, résout les problèmes rapidement et est disponible dans 23 marchés en 35 langues. Il est estimé qu'il apportera une amélioration de 40 millions de dollars US de profit à Klarna en 2024. Alors oui c’est assez impressionnant, mais non le timing pas très bon : Klarna avait fait une annonce peu de temps avant en annonçant se séparer de 10% de ses effectifs.

Source

Stability AI vient de présenter une nouvelle technologie qui génère des objets 3D à partir d’images

TripoSR est un nouveau modèle de génération d'objets 3D rapide à partir d'images. Il suffit de lui donner une image en entrée pour qu’il génère un modèle 3D. Ce nouveau modèle offre des performances de rendu qui semblent très intéressantes sur le papier. Le modèle et le code sont disponibles sur GitHub et Hugging Face.

Source

🧐 MAIS AUSSI…

Elon Musk poursuit OpenAI pour avoir abandonné sa mission de bénéficier à l'humanité

Elon Musk poursuit OpenAI pour avoir abandonné sa mission de bénéficier à l'humanité en se concentrant sur les bénéfices. Musk allègue que le partenariat entre OpenAI et Microsoft a transformé l'organisation en une filiale de Microsoft, fermée et axée sur la maximisation des profits. Il demande à OpenAI de respecter son accord fondateur et de revenir à sa mission initiale de développer une IA générale bénéfique à l'humanité. OpenAI a d’ailleurs répondu à Elon, emails internes à l’appui… sortez le pop-corn !

Source

Le Chat" de Mistral AI, “un assistant conversationnel français avec une culture européenne”

Le Chat, un assistant conversationnel développé par la start-up française Mistral AI, vise à démontrer les capacités de l'IA générative. Avec son modèle Mistral Large, la société met l'accent sur la neutralité et la personnalisation, cherchant à offrir une alternative européenne à ses concurrents américains. Mistral AI a également établi un partenariat avec Microsoft pour la distribution de son modèle destiné aux entreprises. Le co-fondateur, Arthur Mensch, souligne les avantages de l'IA générative dans des domaines tels que le journalisme, la santé et l'éducation.

Source

Partenariat entre Mistral AI et Microsoft, pourquoi ça coince ?

Mistral AI, entreprise française de l'IA, a signé un partenariat avec Microsoft, suscitant des controverses. Certains députés se sentent trahis, tandis que Mistral abandonne son modèle open source. La décision de Mistral remet en question l'indépendance européenne et soulève des préoccupations sur la recherche en IA pour le bénéfice de l'humanité.

Source

Notion AI (lien d’affiliation)

🙏 Merci de nous lire. À la prochaine !

Pierre + 🤖