Claude Opus 4.8 est la nouvelle version du modèle haut de gamme d’Anthropic, annoncée le 28 mai 2026. Elle remplace Opus 4.7 au même prix, avec de meilleurs scores sur le code, les tâches agentiques et le travail professionnel. Si tu bosses déjà avec Claude au quotidien, voici concrètement ce qui bouge.
Opus 4.8 : les gains mesurés sur les benchmarks
Anthropic positionne Opus 4.8 comme un collaborateur plus fiable que son prédécesseur. Sur le benchmark Super-Agent, c’est selon Anthropic le seul modèle à boucler chaque cas de bout en bout, devant les versions précédentes d’Opus et à parité de coût avec GPT-5.5.
Côté agent navigateur, le modèle obtient un score de 84% sur Online-Mind2Web, ce qu’un testeur décrit comme « le modèle de computer-use et d’agent navigateur le plus solide que nous ayons testé ». Sur le Legal Agent Benchmark, Anthropic indique qu’Opus 4.8 est le premier modèle à dépasser 10% sur le standard « all-pass », celui où toutes les sous-tâches doivent passer.
L’efficacité tokens progresse aussi. Dans Genie, l’agent data de Databricks, Opus 4.8 raisonne directement sur des PDF, schémas et autres contenus non structurés pour un coût en tokens 61% inférieur à celui d’Opus 4.7, selon le témoignage cité par Anthropic.
Trois nouveautés qui accompagnent le modèle
Le contrôle de l’effort arrive à côté du sélecteur de modèle sur claude.ai et Cowork. Tu choisis combien d’effort Claude met dans sa réponse : sur un réglage élevé, il réfléchit plus souvent et plus profondément ; sur un réglage bas, il répond plus vite et consomme tes limites moins vite. Opus 4.8 part par défaut sur « high », et tu peux monter en « extra » (« xhigh » dans Claude Code) ou « max » pour les tâches difficiles. Cette option est dispo sur tous les plans.
Deuxième nouveauté, les « dynamic workflows » dans Claude Code, en research preview. Claude planifie le travail, lance des centaines de sous-agents en parallèle dans une seule session, puis vérifie ses sorties avant de te rendre la main. Anthropic donne un exemple parlant : des migrations à l’échelle d’une codebase, sur des centaines de milliers de lignes, du lancement au merge, avec la suite de tests existante comme barre de validation. La fonctionnalité est réservée aux plans Enterprise, Team et Max.
Le fast mode complète le tableau. Le modèle peut travailler à 2,5× la vitesse normale, et pour Opus 4.8 ce mode est trois fois moins cher qu’il ne l’était pour les modèles précédents. Anthropic ajoute aussi une mise à jour technique pour les développeurs : la Messages API accepte désormais des entrées « system » à l’intérieur du tableau de messages, ce qui permet de modifier les instructions de Claude en cours de tâche sans casser le cache de prompt.
Honnêteté et alignement : le vrai pari d’Anthropic
L’amélioration qu’Anthropic met le plus en avant, c’est l’honnêteté du modèle. Le problème classique des IA : elles sautent parfois aux conclusions et affirment avoir avancé alors que les preuves sont minces. Sur ce point, les évaluations d’Anthropic montrent qu’Opus 4.8 est environ quatre fois moins susceptible que son prédécesseur de laisser passer sans commentaire des failles dans le code qu’il a écrit.
Sur l’alignement, l’équipe d’Anthropic conclut qu’Opus 4.8 « atteint de nouveaux sommets sur nos mesures de traits prosociaux comme le soutien à l’autonomie de l’utilisateur ». Les taux de comportements mal alignés, comme la tromperie ou la coopération avec un usage malveillant, sont substantiellement plus bas qu’avec Opus 4.7, et proches de Claude Mythos Preview, présenté comme le modèle le mieux aligné d’Anthropic.
FAQ
Claude Opus 4.8 coûte-t-il plus cher qu’Opus 4.7 ?
Non. Anthropic indique qu’Opus 4.8 est disponible au même prix qu’Opus 4.7. Le fast mode, lui, est trois fois moins cher pour ce modèle que pour les versions précédentes.
Le contrôle de l’effort est-il réservé aux plans payants ?
Non. Le contrôle de l’effort est disponible sur tous les plans, sur claude.ai et Cowork. Opus 4.8 utilise le réglage « high » par défaut, que tu peux pousser en « extra » ou « max ».
Qu’est-ce que les dynamic workflows dans Claude Code ?
C’est une fonctionnalité en research preview qui laisse Claude lancer des centaines de sous-agents en parallèle dans une seule session pour traiter de très grosses tâches. Elle est limitée aux plans Enterprise, Team et Max.
