La bataille de la vidéo générée par IA vient de gagner un concurrent sérieux. xAI, l'entreprise d'intelligence artificielle d'Elon Musk, a lancé le 17 juin 2026 Grok Imagine Video 1.5, un modèle qui transforme une simple image ou une phrase en clip vidéo sonore. Son argument : une qualité qui grimpe et un prix très inférieur à celui de Sora, le générateur d'OpenAI.

Du texte ou une image, et une vidéo sonore en sortie

Grok Imagine Video 1.5 accepte en entrée un texte, une image fixe, ou les deux, et produit un clip animé. Sa nouveauté la plus visible : le son. Bruitages, ambiance sonore et synchronisation des lèvres sont générés en une seule passe, sans étape séparée. Les vidéos en 720p sont calculées en 25 secondes environ, contre plus de 40 secondes pour la version précédente.

xAI propose aussi une variante « Video 1.5 Fast », pensée pour réduire encore le temps d'attente côté grand public. Elon Musk a confirmé le déploiement sur X peu après l'annonce officielle de l'entreprise.

Premier d'un classement de référence

Pour appuyer ses promesses, xAI met en avant un résultat : Grok Imagine Video 1.5 prend la première place de l'Image-to-Video Arena, un classement qui compare les générateurs de vidéo à partir d'images. Le modèle y gagne 52 points Elo par rapport à la version 1.0, un bond important sur ce type d'échelle.

Le prix comme arme

L'argument le plus frappant reste le tarif. xAI facture Grok Imagine Video 1.5 à 4,20 dollars la minute de vidéo, là où Sora 2 Pro d'OpenAI est annoncé à 30 dollars la minute. Soit une vidéo près de sept fois moins chère à produire. Le modèle est accessible via l'API Imagine (sous le nom grok-imagine-video-1.5), sur le site grok.com, ainsi que dans les applications iOS et Android.

Cette stratégie de prix vise clairement les créateurs et les entreprises qui veulent produire beaucoup de vidéos sans exploser leur budget. La vidéo par IA est en effet l'un des usages les plus gourmands en puissance de calcul, donc l'un des plus coûteux.

Ce que ça change

En quelques mois, la génération de vidéo est devenue le nouveau terrain d'affrontement entre les grands acteurs de l'IA. Avec un modèle bien classé, doté du son et vendu à prix cassé, xAI se pose en rival direct de Sora. Pour les créateurs de contenu, les studios et les marques, cette concurrence tire les prix vers le bas et accélère l'arrivée d'outils capables de produire des clips complets, image et son compris, en quelques secondes. Reste la question, commune à tout le secteur, du droit d'auteur et de la détection des contenus générés.