OpenAI vient de poser un pied dans le silicium. Le 24 juin 2026, l'entreprise a dévoilé avec Broadcom sa toute première puce maison, baptisée Jalapeño, un accélérateur pensé de bout en bout pour faire tourner ses grands modèles de langage. Une étape qui vise un objectif clair : moins dépendre des cartes Nvidia, dont OpenAI est aujourd'hui l'un des plus gros clients.

Une puce taillée sur mesure pour l'inférence

Jalapeño n'est pas une carte graphique polyvalente. C'est un ASIC, un circuit gravé pour une seule mission : l'inférence, c'est-à-dire la phase où un modèle déjà entraîné répond aux requêtes des utilisateurs. C'est elle qui consomme l'essentiel des ressources quand des centaines de millions de personnes interrogent ChatGPT chaque jour.

OpenAI a conçu l'architecture autour de ce qui compte le plus pour ses modèles : la circulation des données en mémoire, le réseau et les schémas de calcul propres aux IA de pointe. Résultat affiché : une performance par watt nettement supérieure au matériel actuel de référence. Ces chiffres restent communiqués par OpenAI et n'ont pas été vérifiés de façon indépendante.

Neuf mois de conception, accélérés par l'IA

Le projet a été mené à un rythme inhabituel. OpenAI affirme avoir bouclé la conception en neuf mois, ce qu'elle présente comme le cycle de développement le plus rapide qu'elle connaisse pour une puce de cette catégorie. Ses propres modèles ont servi à accélérer le travail d'ingénierie. Le PDG de Broadcom Hock Tan et son président Charlie Kawwas ont remis la première galette de silicium à Sam Altman et Greg Brockman.

Des échantillons font déjà tourner des charges réelles en laboratoire, dont GPT-5.3-Codex-Spark, l'un des modèles de code d'OpenAI. Le déploiement à grande échelle est prévu pour la fin 2026, à l'échelle du gigawatt, avec Microsoft et d'autres partenaires.

Un trio pour fabriquer, un pari contre Nvidia

Chacun son rôle. OpenAI dessine la puce, Broadcom assure la fabrication et la partie réseau avec ses composants Tomahawk, et le sous-traitant Celestica monte les cartes, les racks et l'intégration des systèmes. Selon plusieurs sources, Microsoft se serait engagé à acheter 40 % du premier lot de production.

Un ASIC est moins souple qu'un GPU Nvidia : il fait moins de choses, mais il les fait à moindre coût et avec moins d'énergie. C'est justement le calcul d'OpenAI, qui cherche à maîtriser la facture colossale de l'inférence à mesure que ses produits se diffusent.

Ce que ça change

En gravant sa propre puce, OpenAI rejoint Google, Amazon et Meta, qui conçoivent déjà leurs accélérateurs maison. Pour Nvidia, dont la position quasi monopolistique repose sur des marges élevées, c'est un signal de plus : ses plus gros clients veulent reprendre la main sur leur matériel. Reste à voir si Jalapeño tiendra ses promesses une fois sortie des laboratoires.