Claude Opus 4.8 : ce qui change vraiment pour toi
Actualités IA

Claude Opus 4.8 : ce qui change vraiment pour toi

· · 3 min de lecture

Claude Opus 4.8 est la nouvelle version du modèle haut de gamme d’Anthropic, annoncée le 28 mai 2026. Elle remplace Opus 4.7 au même prix, avec de meilleurs scores sur le code, les tâches agentiques et le travail professionnel. Si tu bosses déjà avec Claude au quotidien, voici concrètement ce qui bouge.

Opus 4.8 : les gains mesurés sur les benchmarks

Anthropic positionne Opus 4.8 comme un collaborateur plus fiable que son prédécesseur. Sur le benchmark Super-Agent, c’est selon Anthropic le seul modèle à boucler chaque cas de bout en bout, devant les versions précédentes d’Opus et à parité de coût avec GPT-5.5.

Côté agent navigateur, le modèle obtient un score de 84% sur Online-Mind2Web, ce qu’un testeur décrit comme « le modèle de computer-use et d’agent navigateur le plus solide que nous ayons testé ». Sur le Legal Agent Benchmark, Anthropic indique qu’Opus 4.8 est le premier modèle à dépasser 10% sur le standard « all-pass », celui où toutes les sous-tâches doivent passer.

L’efficacité tokens progresse aussi. Dans Genie, l’agent data de Databricks, Opus 4.8 raisonne directement sur des PDF, schémas et autres contenus non structurés pour un coût en tokens 61% inférieur à celui d’Opus 4.7, selon le témoignage cité par Anthropic.

Trois nouveautés qui accompagnent le modèle

Le contrôle de l’effort arrive à côté du sélecteur de modèle sur claude.ai et Cowork. Tu choisis combien d’effort Claude met dans sa réponse : sur un réglage élevé, il réfléchit plus souvent et plus profondément ; sur un réglage bas, il répond plus vite et consomme tes limites moins vite. Opus 4.8 part par défaut sur « high », et tu peux monter en « extra » (« xhigh » dans Claude Code) ou « max » pour les tâches difficiles. Cette option est dispo sur tous les plans.

Deuxième nouveauté, les « dynamic workflows » dans Claude Code, en research preview. Claude planifie le travail, lance des centaines de sous-agents en parallèle dans une seule session, puis vérifie ses sorties avant de te rendre la main. Anthropic donne un exemple parlant : des migrations à l’échelle d’une codebase, sur des centaines de milliers de lignes, du lancement au merge, avec la suite de tests existante comme barre de validation. La fonctionnalité est réservée aux plans Enterprise, Team et Max.

Le fast mode complète le tableau. Le modèle peut travailler à 2,5× la vitesse normale, et pour Opus 4.8 ce mode est trois fois moins cher qu’il ne l’était pour les modèles précédents. Anthropic ajoute aussi une mise à jour technique pour les développeurs : la Messages API accepte désormais des entrées « system » à l’intérieur du tableau de messages, ce qui permet de modifier les instructions de Claude en cours de tâche sans casser le cache de prompt.

Honnêteté et alignement : le vrai pari d’Anthropic

L’amélioration qu’Anthropic met le plus en avant, c’est l’honnêteté du modèle. Le problème classique des IA : elles sautent parfois aux conclusions et affirment avoir avancé alors que les preuves sont minces. Sur ce point, les évaluations d’Anthropic montrent qu’Opus 4.8 est environ quatre fois moins susceptible que son prédécesseur de laisser passer sans commentaire des failles dans le code qu’il a écrit.

Sur l’alignement, l’équipe d’Anthropic conclut qu’Opus 4.8 « atteint de nouveaux sommets sur nos mesures de traits prosociaux comme le soutien à l’autonomie de l’utilisateur ». Les taux de comportements mal alignés, comme la tromperie ou la coopération avec un usage malveillant, sont substantiellement plus bas qu’avec Opus 4.7, et proches de Claude Mythos Preview, présenté comme le modèle le mieux aligné d’Anthropic.

FAQ

Claude Opus 4.8 coûte-t-il plus cher qu’Opus 4.7 ?

Non. Anthropic indique qu’Opus 4.8 est disponible au même prix qu’Opus 4.7. Le fast mode, lui, est trois fois moins cher pour ce modèle que pour les versions précédentes.

Le contrôle de l’effort est-il réservé aux plans payants ?

Non. Le contrôle de l’effort est disponible sur tous les plans, sur claude.ai et Cowork. Opus 4.8 utilise le réglage « high » par défaut, que tu peux pousser en « extra » ou « max ».

Qu’est-ce que les dynamic workflows dans Claude Code ?

C’est une fonctionnalité en research preview qui laisse Claude lancer des centaines de sous-agents en parallèle dans une seule session pour traiter de très grosses tâches. Elle est limitée aux plans Enterprise, Team et Max.

Article relu le 29 mai 2026. Signaler une erreur.

Tristan Cavel

Développeur full-stack · Spécialiste APIs et agents IA

Tristan bidouille du code depuis le collège et construit des produits dessus depuis 2016. Il est passé par deux startups (une en edtech lyonnaise, une en fintech parisienne), et depuis 2022 il est freelance full-stack depuis Bordeaux, avec une spécialisation LLM et agents IA qui s'est imposée naturellement : c'était soit apprendre à utiliser l'API OpenAI, soit continuer à coder des formulaires de contact. Sa première intégration sérieuse d'un LLM date de janvier 2023, sur un prototype de bot de support pour une scale-up SaaS B2B lyonnaise. Depuis, il a poussé en prod chez huit clients différents : chatbots spécialisés, pipelines RAG avec bases vectorielles, agents autonomes avec n8n et LangChain, et récemment des intégrations Claude Code dans des workflows de dev. Il teste chaque nouvel outil dans son lab perso avant de le recommander à un client, c'est devenu son réflexe. Sur Zoom IA, il écrit les guides techniques qui ne trichent pas : API ChatGPT pour les vrais devs, comparatifs n8n vs Make avec le retour d'expérience honnête, installation d'agents autonomes, LangChain vs LangGraph sous l'angle ce qui pète en prod. Il signe aussi les benchmarks de modèles avec du code testé, pas des scores recopiés des papers. Son parti-pris éditorial : montrer le code, citer les versions exactes, donner les commandes qui marchent, et ne pas cacher ce qui est cassé dans les outils. Il maintient un repo GitHub perso avec les scripts qu'il partage.

Ne rate rien de l'actu IA

Le Brief IA, chaque semaine dans ta boite. Gratuit, concret, sans spam.