Techonologie

“Des dispositifs portables à bas coût” : Generalist sort un modèle d’IA pour la robotique entraîné sur 500 000 heures de données réelles

Fondée par d’anciens salariés de Google et Boston Dynamics, Generalist entraîne ses modèles sur des données de mouvements humains à partir de capteurs fixés sur des dispositifs portables. La start-up espère ainsi mettre au point un modèle polyvalent permettant aux robots d’effectuer de nombreuses tâches de manipulation, que ce soit dans l’automobile, la logistique ou pour la maison.

Oublier la téléopération pour entraîner ses modèles robotiques sur des mouvements réalisés par des humains, en se basant sur des dispositifs portables : c’est le credo de la start-up américaine Generalist. Elle a présenté le 2 avril Gen-1, pour lequel elle revendique une exécution de tâches trois fois plus rapide que son précédent modèle, dévoilé il y a cinq mois.

Une heure d’exécution pour obtenir de premiers résultats

L’objectif ? Créer un modèle polyvalent adaptable à de nombreux robots et pour un large éventail de tâches. Pour ce faire, la jeune pousse basée à San Francisco est repartie de zéro et a constitué un dataset de 500 000 heures de données réelles. “Les modèles généraux précédents en robotique (…) reposaient sur d’énormes ensembles de données de téléopération, coûteux et difficiles à mettre à l’échelle, explique Generalist dans un communiqué. À l’inverse, pour Gen-0 et Gen-1, le modèle est entraîné sans aucune donnée robotique ; il utilise plutôt des données provenant de dispositifs portables à bas coût, portés par des humains réalisant des millions d’activités.”

La start-up assure qu’elle peut obtenir de premiers résultats avec seulement une heure de données robotiques. Elle montre comment des bras robotisés équipés de son modèle ont pu sans intervention mettre des pièces automobiles en kit pendant plus d’une heure, plier 86 t-shirts, entretenir 200 aspirateurs robots ou encore emballer des téléphones 100 fois de suite. Sur cette dernière tâche, le robot obtient un taux de réussite de 99%, bien supérieur aux 62% de son prédécesseur.

Concurrencer Physical Intelligence

Generalist entend se positionner en concurrent direct d’autres start-up spécialisées dans la mise au point de modèles polyvalents, comme Physical Intelligence. “Gen-0 et π0 ont utilisé des boîtes identiques et ont pris environ 34 secondes à la plier, de manière similaire à π0.6 sur une boîte comparable mais différente. En revanche, Gen-1 est 2,8 fois plus rapide, capable de réaliser des pliages de boîte en environ 12 secondes.” Le modèle π0 de Physical Intelligence est sorti en octobre 2024, tandis que π0.6, basé en grande partie sur des techniques d’apprentissage par renforcement (RL), a été dévoilé en novembre 2025.

La start-up peut se targuer d’une équipe expérimentée : Pete Florence, CEO de Generalist, et Andy Zeng, cofondateur, ont tous les deux travaillé pendant cinq ans chez Google DeepMind. Andrew Barry, cofondateur et CTO, a de son côté exercé en tant que roboticien chez Boston Dynamics. Generalist a levé l’année dernière 140 millions de dollars (121 millions d’euros). Selon PitchBook, Nvidia et Bezos Expeditions, family office du fondateur d’Amazon, figureraient parmi les investisseurs.

La capture de mouvements humains et d’habitudes réelles devient de plus en plus courante pour les sociétés de robotique humanoïde. La start-up Sunday, à l’origine du robot domestique Memo, a par exemple mis au point un gant breveté déployé dans 500 foyers.

Source : usine-digitale.fr