Qu'est-ce que la puce Jalapeño d'OpenAI ?

C'est le premier processeur maison d'OpenAI, conçu avec Broadcom. Un ASIC pensé spécifiquement pour l'inférence des grands modèles de langage, dévoilé le 24 juin 2026.

Pourquoi OpenAI conçoit-elle sa propre puce ?

Pour réduire sa dépendance aux cartes Nvidia et mieux maîtriser le coût de l'inférence, qui explose à mesure que ChatGPT et ses autres produits se diffusent.

OpenAI grave sa propre puce et bouscule la suprématie de Nvidia

Q: Quand la puce Jalapeño sera-t-elle déployée ?

OpenAI vise un déploiement à grande échelle pour la fin 2026, à l'échelle du gigawatt, avec Microsoft et d'autres partenaires. Des échantillons tournent déjà en laboratoire.

OpenAI vient de poser un pied dans le silicium. Le 24 juin 2026, l'entreprise a dévoilé avec Broadcom sa toute première puce maison, baptisée Jalapeño, un accélérateur pensé de bout en bout pour faire tourner ses grands modèles de langage. Une étape qui vise un objectif clair : moins dépendre des cartes Nvidia, dont OpenAI est aujourd'hui l'un des plus gros clients.

Une puce taillée sur mesure pour l'inférence

Jalapeño n'est pas une carte graphique polyvalente. C'est un ASIC, un circuit gravé pour une seule mission : l'inférence, c'est-à-dire la phase où un modèle déjà entraîné répond aux requêtes des utilisateurs. C'est elle qui consomme l'essentiel des ressources quand des centaines de millions de personnes interrogent ChatGPT chaque jour.

OpenAI a conçu l'architecture autour de ce qui compte le plus pour ses modèles : la circulation des données en mémoire, le réseau et les schémas de calcul propres aux IA de pointe. Résultat affiché : une performance par watt nettement supérieure au matériel actuel de référence. Ces chiffres restent communiqués par OpenAI et n'ont pas été vérifiés de façon indépendante.

Neuf mois de conception, accélérés par l'IA

Le projet a été mené à un rythme inhabituel. OpenAI affirme avoir bouclé la conception en neuf mois, ce qu'elle présente comme le cycle de développement le plus rapide qu'elle connaisse pour une puce de cette catégorie. Ses propres modèles ont servi à accélérer le travail d'ingénierie. Le PDG de Broadcom Hock Tan et son président Charlie Kawwas ont remis la première galette de silicium à Sam Altman et Greg Brockman.

Des échantillons font déjà tourner des charges réelles en laboratoire, dont GPT-5.3-Codex-Spark, l'un des modèles de code d'OpenAI. Le déploiement à grande échelle est prévu pour la fin 2026, à l'échelle du gigawatt, avec Microsoft et d'autres partenaires.

Un trio pour fabriquer, un pari contre Nvidia

Chacun son rôle. OpenAI dessine la puce, Broadcom assure la fabrication et la partie réseau avec ses composants Tomahawk, et le sous-traitant Celestica monte les cartes, les racks et l'intégration des systèmes. Selon plusieurs sources, Microsoft se serait engagé à acheter 40 % du premier lot de production.

Un ASIC est moins souple qu'un GPU Nvidia : il fait moins de choses, mais il les fait à moindre coût et avec moins d'énergie. C'est justement le calcul d'OpenAI, qui cherche à maîtriser la facture colossale de l'inférence à mesure que ses produits se diffusent.

Ce que ça change

En gravant sa propre puce, OpenAI rejoint Google, Amazon et Meta, qui conçoivent déjà leurs accélérateurs maison. Pour Nvidia, dont la position quasi monopolistique repose sur des marges élevées, c'est un signal de plus : ses plus gros clients veulent reprendre la main sur leur matériel. Reste à voir si Jalapeño tiendra ses promesses une fois sortie des laboratoires.