Anthropic a lancé Claude Opus 4.8, son modèle haut de gamme, à peine 41 jours après la version 4.7. Au programme : de meilleures performances en code, plus d'honnêteté sur ses propres limites, et un nouvel outil pour orchestrer des sous-agents en parallèle.
Plus fort, et plus lucide sur ses limites
Anthropic décrit un modèle au "jugement plus affûté", capable de travailler seul plus longtemps. Surtout, Opus 4.8 serait plus enclin à signaler quand il manque d'informations et moins enclin à avancer des affirmations non étayées. Une qualité précieuse quand on délègue des tâches sérieuses à une IA.
Des gains mesurés
Sur les tests partagés par Anthropic :
- codage agentique : de 64,3 % à 69,2 % ;
- raisonnement multidisciplinaire avec outils : de 54,7 % à 57,9 % ;
- travail de connaissance : de 1753 à 1890.
Des progrès réels mais incrémentaux, à l'image d'un marché où l'écart entre les meilleurs modèles se mesure en quelques points.
La vraie nouveauté n'est pas la puissance brute, c'est la fiabilité.
Un outil pour les gros chantiers
Anthropic ajoute "Dynamic Workflows", en aperçu, qui permet de gérer des tâches complexes réparties sur des centaines de sous-agents en parallèle, jusqu'à l'échelle de bases de code entières. Un panneau permet aussi de régler le niveau d'"effort" du modèle.
Ce que ça change pour toi
Si tu utilises Claude, tu profites des gains sans rien faire. Et la priorité donnée à l'honnêteté du modèle compte autant que les scores : une IA qui dit "je ne sais pas" est souvent plus utile qu'une IA qui invente avec assurance.
Point d'étape, juin 2026. La cadence décrite ici à 41 jours s'est maintenue. Le 10 juin, Anthropic a lancé Fable 5 et Mythos 5, ses nouveaux modèles de raisonnement avancé. Entre-temps, le 1er juin, l'entreprise a déposé son S1 auprès de la SEC en vue d'une introduction en bourse, avec une valorisation proche de 965 milliards de dollars. L'honnêteté revendiquée sur les limites du modèle reste la marque d'Anthropic, et c'est probablement ce qui attire des partenariats institutionnels de cette envergure.
