Thinking Machines signe un contrat de plusieurs milliards de dollars avec Google Cloud pour accéder aux GB300 de Nvidia
Thinking Machines va étendre son utilisation de Google Cloud pour accéder à davantage de GPUs. Un contrat stratégique pour la start-up face à des concurrents comme Anthropic et OpenAI, qui s’arrachent les ressources de calcul.
Profitant de toute la lumière tournée vers lui, Google Cloud a multiplié les annonces avec ses clients, anciens comme nouveaux. Parmi eux, Thinking Machines Lab, la start-up montée de toutes pièces par Mira Murati, l’ancienne CTO d’OpenAI, et déjà cliente de l’hyperscaler depuis 2025.
Via cet accord, la start-up entend accélérer ses activités de recherche, le développement de sa plateforme et l’entraînement de modèles de pointe grâce à l’AI Hypercomputer. Pour profiter des fameux TPU ? Non ! Elle utilisera les instances A4X Max basées sur l’architecture Nvidia Blackwell, devenant l’un des premiers clients à exploiter la solution GB300 NVL72.
Même si aucun montant n’est communiqué, accéder à des infrastructures avancées à grande échelle implique des coûts très élevés. Le média américain Techcrunch rapporte, citant une source proche du dossier, que cette extension de contrat se chiffrerait à plusieurs milliards de dollars.
Des tests jugés concluants
De premiers tests ont déjà eu lieu et ce sont avérés concluants. Thinking Machines a observé une vitesse d’entraînement et d’inférence deux fois supérieure à celle des GPU de génération précédente, selon les données partagées par Amin Vahdat, SVP and Chief Technologist, AI and Infrastructure chez Google Cloud.
En plus de la puissance de calcul fournie par les puces Nvidia, Thinking Machines bénéficie de la proximité avec le stack IA intégré et ouvert de Google Cloud, qui inclut entre autres Google Kubernetes Engine pour l’orchestration à très grande échelle, Spanner, Cluster Director, Cloud Storage et Anywhere Cache afin de développer ses modèles d’IA avancés et son produit de fine-tuning, Tinker.
“Google Cloud nous a permis d’être opérationnels à une vitesse record avec le niveau de fiabilité que nous exigeons”, a fait savoir Myle Ott, chercheur au sein de la start-up.
Un engagement auprès de Nvidia lui-même
Rappelons au passage que la start-up est déjà engagée avec Nvidia via un partenariat direct établi plus tôt cette année, en mars. A cette occasion, les deux parties ont annoncé qu’elles s’engageaient pour plusieurs années avec l’objectif de “déployer au moins un gigawatt de supercalculateurs de nouvelle génération (Vera Rubin) dédiés à l’entraînement de modèles d’IA”.
L’objectif est de construire une infrastructure massive qui servirait à la fois aux entreprises et à la recherche. Le partenariat inclut aussi un co-développement des systèmes d’entraînement et d’inférence optimisés pour l’architecture Nvidia. La firme de Jensen Huang investit aussi directement dans la start-up de Mira Murati – jusqu’alors valorisée 12 milliards de dollars – signe d’un engagement financier et stratégique fort.
Source : usine-digitale.fr
