Techonologie

IA générative : Sakana AI lance un modèle capable de mener des recherches scientifiques

Le modèle, développé en partenariat avec les universités d’Oxford et de Colombie-Britannique, peut générer des idées, réaliser des expérimentations et rédiger des articles scientifiques. Lors de la phase de tests, le système a même suggéré de nouvelles techniques pour les grands modèles de langage.

Sakana AI, start-up japonaise d’intelligence artificielle, a dévoilé le 13 août dans un article universitaire son nouveau modèle, intitulé « The AI Scientist ». Ce dernier, élaboré conjointement avec les universités d’Oxford et de Colombie-Britannique, a été conçu pour réaliser des recherches scientifiques. Selon Sakana AI, il peut automatiser certaines étapes nécessaires à une découverte scientifique.

15 dollars l’article scientifique, affirme Sakana AI

“The AI Scientist” est basé sur de grands modèles de langage (LLM) qui peuvent reproduire le processus de découverte scientifique. Il peut ainsi générer une idée et évaluer à quel point elle est nouvelle et inédite. Le modèle modifie ensuite une base de code open source disponible sur GitHub à l’aide d’outils de génération de code. Vient alors la phase d’expérimentation, au cours de laquelle il collecte des données numériques et des résumés visuels.

À l’aide de ces éléments, le modèle rédige un rapport en langage LaTeX (très utilisé par la communauté scientifique), avec des résultats justifiés et contextualisés. Sakana exploite l’outil Semantic Scholar, développé par l’Allen Institute for AI, afin de trouver de manière autonome des articles pertinents et étayer le rapport. La start-up a enfin mis en place un générateur de révision automatisée, afin d’affiner le modèle et de créer une boucle ouverte

Sakana AI affirme qu’il est possible de produire un article scientifique pour seulement 15 dollars (13,73 euros), selon les ressources informatiques utilisées. Lors de la phase de tests, l’outil a proposé de nouvelles techniques pour les modèles de langage basés sur une architecture de transformers (modèles auto-attentifs) et pour les modèles de diffusion.

Un premier modèle du genre qui présente quelques limites

Un tel modèle pourrait accélérer la recherche dans de nombreux domaines, notamment dans la science des matériaux, la découverte de nouveaux médicaments ou les sciences environnementales. Il reste toutefois de nombreuses étapes à franchir pour que le modèle rivalise avec ce que font les humains.

En plus de se limiter au développement de logiciels d’IA, “The AI Scientist” nécessite obligatoirement une base de code pour chaque expérimentation, ce qui peut remettre en cause sa capacité à créer de nouvelles idées. Sakana précise aussi que le modèle ne dispose pas de fonctionnalités de computer vision, ce qui peut créer quelques bugs lors de la génération de contenus visuels pour les articles scientifiques.

Sakana AI développe trois autres modèles

Sakana AI a été fondée l’année dernière par deux anciens chercheurs de Google. La start-up mise sur le développement de modèles plus petits et plus spécialisés, plutôt que de concevoir des LLM nécessitant de grandes capacités de traitement et étant plus énergivores.

Elle a déjà mis au point un modèle linguistique japonais de raisonnement mathématique (EvoLLM-JP), un modèle de vision-langage couplant la compréhension visuelle aux capacités linguistiques (EvoVLM-JP) et un modèle de génération d’images optimisé pour l’inférence rapide (EvoSDXL-JP). Après une levée de fonds en seed de 30 millions de dollars, la start-up est entrée en négociations pour lever 125 millions de dollars supplémentaires, portant ainsi sa valorisation à 1,1 milliard de dollars (1,01 milliard d’euros).

Source : usine-digitale.fr