Techonologie

GenAI : OpenAI planche sur une nouvelle approche pour le développement de ses modèles

Anciennement connu sous le nom de Q*, le projet désormais baptisé Strawberry pourrait représenter une percée significative dans le développement de modèles d’IA à l’avenir. Peu de détails ont fuité, mais il semble que le modèle pourrait naviguer sur Internet de manière autonome pour mener ce qu’OpenAI appelle des « recherches approfondies ».

La recherche ne prend pas de vacances. Alors que le modèle GPT-4o n’a que quelques mois d’existence, OpenAI planche déjà sur un autre projet. L’ambition est de pousser une autre approche de développement de ses grands modèles de langage. Nom de code : « Strawberry ». C’est Reuters qui a rapporté la nouvelle en premier, affirmant avoir vu une copie d’un document interne récent d’OpenAI en mai. L’agence de presse n’a pas pu déterminer la date exacte du document, mais ce dernier détaille un plan d’utilisation de Strawberry par OpenAI pour la recherche.

Ainsi, les modèles Strawberry – via une interface – ne se contenteraient pas seulement de générer des réponses à des requêtes, mais pourraient également planifier suffisamment à l’avance pour naviguer sur Internet de manière autonome et fiable afin d’effectuer ce qu’OpenAI appelle de la « recherche approfondie ». Un aspect qui, jusqu’à présent, n’aurait pas été intégré dans les modèles développés existants sur le marché.

Pousser les modèles d’IA à réfléchir comme des humains

Un porte-parole de la société d’IA a déclaré à Reuters : « Nous voulons que nos modèles d’IA voient et comprennent le monde davantage comme nous le faisons. La recherche continue de nouvelles capacités d’IA est une pratique courante dans l’industrie, avec la conviction partagée que ces systèmes amélioreront leur raisonnement au fil du temps ». Le projet ne date pas d’hier. En réalité, ces recherches ont déjà été évoquées l’année dernière, sous le nom de Q*, mais ont été interrompues – ou du moins mises sur pause – lorsque Sam Altman a été évincé puis réintégré au bout de quelques jours au sein de l’entreprise.

L’objectif de ce projet est de pousser les modèles à répondre à des questions scientifiques et mathématiques délicates, hors de portée des modèles commerciaux actuels. A date, les grands modèles de langage peuvent déjà résumer des documents de plusieurs centaines de pages et rédiger des textes sous différents styles bien plus rapidement que n’importe quel humain. Cependant, l’IA est encore loin d’être en capacité à résoudre des problèmes de bon sens, dont les solutions semblent intuitives pour l’homme. Les erreurs relevées, plus connues sous le nom d’hallucinations, ont la peau dure.

Source : usine-digitale.fr