- AI Brew
- Posts
- Les nouveaux modèles optimisés de Meta, Microsoft et Apple
Les nouveaux modèles optimisés de Meta, Microsoft et Apple
Llama 3, Phi-3 et OpenELM
Hello 👋
Cette semaine a été très fortement marquée par la sortie de plusieurs modèles ouverts, “miniatures” (pour la plupart), et optimisés pour un usage local.
Concrètement qu’est-ce que cela change ?
Premièrement, cela signifie que plusieurs acteurs, dont Meta, Anthropic, Google et Mistral AI, entre autres, arrivent à frôler voire surpasser la puissance de GPT-4, le modèle le plus puissant d’OpenAI, sur plusieurs benchmarks. Plusieurs de ces modèles sont open-weight, ce qui signifie pour les entreprises que ce sont moins des “boîtes noires” et que l’on peut donc plus facilement altérer leur fonctionnement.
Mais la grande nouveauté introduite avec les plus petits modèles optimisés, c’est que l’on peut désormais imaginer de nouveaux usages sur des appareils mobiles (j’en parlais ici il y a 4 mois déjà). Pour avoir eu l’occasion de tester Phi-3 sur mon smartphone, et Llama-3 8B sur mon ordinateur portable, je dois avouer que le résultat est assez bluffant.
Surtout quand on considère qu’Apple est en train de peaufiner de futurs modèles qui prennent en compte notre contexte d’utilisation sur le téléphone (apps, pages ouvertes, interactions…) afin d’apporter des réponses encore plus pertinentes et personnalisées.
2024 est, à n’en pas douter, une année encore pleine de surprises en IA générative.
Nous allons donc revenir sur :
Phi-3, la série de nouveaux modèles compacts de Microsoft
La sortie par Meta de nouveaux modèles Llama 3
OpenELM, une série de 8 modèles open-source que Apple vient de sortir
Bonne lecture !
🔮 Focus de la semaine : les nouveaux modèles de Meta et Microsoft
Microsoft Phi-3 : Un modèle d'IA compact et puissant, parfait pour le quotidien
Image : Microsoft
Microsoft a introduit un nouveau modèle d'intelligence artificielle, Phi-3, qui allie puissance et compacité. Conçu pour être une alternative plus accessible et moins onéreuse aux modèles IA de grande envergure tels que GPT-4 et Llama 3, Phi-3 est idéal pour les utilisateurs et les entreprises qui n'ont pas besoin de toutes les fonctionnalités avancées des modèles plus grands.
Le Phi-3 est disponible en trois versions : Mini (3.8b), Petit (7b) et Moyen (14b). La version Mini a prouvé qu'elle pouvait surpasser le modèle Llama 3 8B de Meta sur plusieurs benchmarks importants, ce qui est remarquable compte tenu de sa taille réduite. Cette petite taille permet également une réduction significative des coûts, rendant ce modèle particulièrement attrayant pour des tâches simples ou pour une utilisation en local.
J'ai personnellement expérimenté la version Mini 3.6B 4K du modèle Phi-3 sur mon iPhone en utilisant l'application Private LLM. L'inférence s'exécute de manière tout à fait confortable, ce qui démontre l'efficacité et l'adaptabilité de ce modèle AI dans des conditions d'utilisation quotidienne. Je reviendrais sans doute dessus dans une prochaine newsletter car il y a beaucoup à dire. En bien !
Meta publie Llama 3, prétend que c'est l'un des meilleurs modèles ouverts disponibles
Image : Meta
Meta a lancé les modèles d'IA générative Llama 3, avec 8 milliards et 70 milliards de paramètres respectivement. Ils surpassent d'autres modèles ouverts sur plusieurs benchmarks. Meta affirme que les modèles Llama 3 offrent une meilleure précision. Meta a également développé des outils pour filtrer les données et détecter les vulnérabilités de sécurité. Les modèles Llama 3 seront bientôt disponibles sur plusieurs plateformes cloud. Vous pouvez notamment les retrouver ici sur HuggingFace. Si vous souhaitez tester l’un de ces modèles, je vous recommande la version 8B Instruct, et de passer par un outil comme LM Studio ou Jan qui sont d’excellentes applications gratuites et disponibles sur Mac/PC.
Meta dit que Llama 3 70B bat la plupart des autres modèles, y compris Gemini
Image : Meta
Llama 3, le nouveau modèle d'intelligence artificielle de Meta, surpasse la plupart des autres modèles, y compris Gemini dans certains benchmarks. Il offre des réponses textuelles améliorées, une plus grande diversité, et une meilleure capacité de raisonnement. Llama 3 a également obtenu de meilleurs résultats lors des évaluations humaines. Bien que les tests de référence soient imparfaits, Llama 3 s'est démarqué face à d'autres modèles. Plusieurs versions plus grandes de Llama 3 sont en cours de développement.
Apple lance OpenELM, de nouveaux modèles qui ne nécessitent que la puissance d’un smartphone pour fonctionner
Apple a surpris beaucoup de monde ces derniers jours avec le lancement d'OpenELM, une famille de modèles linguistiques conçue pour fonctionner directement sur des appareils comme les iPhones et les Macs. Ce développement représente un changement significatif pour la société, qui s'oriente vers des solutions logicielles ouvertes et plus respectueuses de la vie privée.
Points clés :
Optimisation sur appareil : Les huit modèles OpenELM varient en taille, de 270 millions à 3 milliards de paramètres, tous optimisés pour minimiser la dépendance aux serveurs cloud.
Confidentialité renforcée : En traitant les données directement sur l'appareil, OpenELM élimine le besoin de transférer des informations personnelles vers le cloud.
Accès open source : Apple a rendu OpenELM et sa bibliothèque CoreNet disponibles en open source, permettant à la communauté de développeurs d'adapter et d'améliorer ces outils.
Performance compétitive : Malgré une consommation réduite de données d'entraînement, OpenELM surpasse des modèles open-source similaires dans plusieurs benchmarks.
Bref… ça donne plutôt de très bons indices sur ce que Apple prépare pour iOS 18 et qui sera annoncé dans les prochaines semaines à la WWDC.
Avec cette initiative, Apple ne se contente pas de suivre la tendance de l'IA légère et efficace, mais établit de nouvelles normes pour l'intégration de l'intelligence artificielle dans nos appareils quotidiens, tout en maintenant un fort engagement envers la protection de la vie privée. Pour les spécialistes ML qui voudraient tester, ça se passe ici. Personnellement, je ne sais pas ce qui m’impressionne le plus, entre ces nouveaux modèles d’un côté, et le changement de stratégie d’Apple sur la GenAI, avec cette ”ouverture” soudaine. Hâte de voir si cette dynamique va être porteuse…
📢 News
Le combat de Meta avec ChatGPT commence maintenant
Image : Meta
Meta lance son assistant d'IA, intégré à Instagram, Facebook, WhatsApp et Messenger. Avec Llama 3, Meta vise à rivaliser avec ChatGPT. L'assistant intègre des résultats de recherche en temps réel de Bing et Google. Meta prévoit de le rendre accessible dans plusieurs pays. De plus grandes versions de Llama 3 sont à venir. Meta ambitionne d'être "l'assistant IA le plus intelligent au monde". Une concurrence effrénée dans le domaine de l'IA se profile.
Meta ajoute son chatbot IA, alimenté par Llama 3, à la barre de recherche sur l'ensemble de ses applications
Image : Meta
Meta intègre son chatbot alimenté par Llama 3 à la barre de recherche de ses principales applications (Facebook, Messenger, Instagram et WhatsApp). Rollout progressif vous l’imaginez bien, et ça va sans doute mettre un peu de temps avant d’arriver en France. Le chatbot utilise Llama 3, et offre des fonctionnalités telles que la génération d'images plus rapide et l'accès aux résultats de recherche sur le web. L'objectif de Meta est de devenir un acteur majeur dans le domaine de l'IA générative.
Le gracieux robot Atlas de Boston Dynamics n'est pas mort : il revient avec une version électrique
Image : Boston Dynamics
Boston Dynamics présente une nouvelle version électrique de son robot humanoïde Atlas, capable de mouvements dépassant les capacités humaines. Il dispose d'articulations pivotantes et peut s'attaquer à des tâches ennuyeuses, sales et dangereuses. La société envisage sa commercialisation et collabore avec Hyundai pour tester ses capacités. Le développement de robots humanoïdes s'accélère, avec des collaborations dans l'industrie automobile. L'intelligence artificielle générative pourrait également apporter de nouvelles avancées dans ce domaine.
Les grands modèles linguistiques approchent le niveau d'expertise clinique et le raisonnement en ophtalmologie : une étude transversale en tête-à-tête
Les modèles de langue de grande taille (LLM) tels que GPT-4 peuvent approcher les connaissances et les compétences de raisonnement des ophtalmologistes experts en ophtalmologie. Une récente étude a montré que les performances de GPT-4 étaient comparables voire supérieures à celles des médecins en formation et des médecins juniors non spécialisés. Les LLMs pourraient donc fournir des conseils médicaux utiles lorsque l'accès à des ophtalmologistes experts est limité.
Après son partenariat avec Microsoft, Mistral AI veut montrer patte blanche vis-à-vis de l’écosystème open source
Mistral AI réaffirme son attachement à l’open source en lançant un nouveau modèle de langage, Mixtral 8x22B, en alternative à OpenAI. Malgré le partenariat avec Microsoft, la startup française maintient son engagement envers l'open source et cherche à rassurer les critiques sur la souveraineté numérique européenne.
La société française Mistral veut lever des centaines de millions d'euros
Mistral AI prévoit de lever des centaines de millions de dollars lors de sa prochaine levée de fonds, ce qui augmenterait sa valorisation à environ 5 milliards de dollars. Avec des investisseurs tels que Microsoft, Mistral AI se positionne comme un acteur majeur dans le domaine de l'IA générative. Sa plateforme propose des modèles de langage innovants, dont le modèle Mixtral 8x7B, qui offre des performances remarquables en termes de compréhension et de résolution de problèmes.
🙏 Merci de nous lire. À la prochaine !
Pierre + 🤖