Claude Mythos : Anthropic dévoile un modèle qui trouve des failles zero-day vieilles de 27 ans

Anthropic a annoncé le mardi 7 avril 2026 Project Glasswing, une coalition qui réunit AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks autour d’un modèle non publié : Claude Mythos Preview. Et contrairement à l’habitude des annonces Anthropic, le pitch n’est ni sur le nombre de paramètres ni sur le contexte : c’est sur ce que le modèle trouve dans du code qui n’a pas bougé depuis 27 ans.

Note mise à jour 20/04/2026 : Anthropic a depuis annoncé Claude Opus 4.7 (16/04), avec des capacités intermédiaires entre Opus 4.6 et Mythos Preview. Mythos reste research-preview invitation-only, Opus 4.7 est le flagship GA grand public.

Ce qui distingue Mythos des Opus récents

Sur le papier, Claude Mythos Preview est un modèle frontier généraliste. Dans les chiffres, il écrase Claude Opus 4.6 sur les benchmarks de code et de raisonnement. Voici les chiffres comparatifs publiés par Anthropic :

Benchmark	Claude Mythos Preview	Claude Opus 4.6	Delta
SWE-bench Verified	93,9 %	80,8 %	+13,1 pts
Terminal-Bench 2.0	82 %	65,4 %	+16,6 pts
GPQA Diamond	94,6 %	—	N/A
CyberGym	83,1 %	66,6 %	+16,5 pts

Pour situer Mythos dans le paysage complet, notre guide de tous les modèles IA en 2026 recense les principaux acteurs avec leurs scores comparés.

Le delta le plus parlant est sur CyberGym, un benchmark de reproduction de vulnérabilités. En langage concret : le modèle est devenu capable, sans pilotage humain, de trouver et d’exploiter des failles dans du code de production.

Trois failles zero-day citées en exemple

Anthropic a rendu publiques trois vulnérabilités trouvées par Mythos Preview de manière entièrement autonome et désormais patchées :

Une faille vieille de 27 ans dans OpenBSD, un OS réputé pour son hardening sécurité, utilisé sur des firewalls d’infrastructure critique. Elle permettait de crash un serveur à distance avec une simple connexion.
Une faille de 16 ans dans FFmpeg, sur une ligne de code que les outils de fuzzing automatisés (type OSS-Fuzz) avaient selon Anthropic parcourue 5 millions de fois sans jamais détecter le problème.
Une chaîne d’exploits dans le noyau Linux qui permettait d’escalader d’un utilisateur standard jusqu’au contrôle total de la machine.

Sur les trois cas, Anthropic précise que le modèle a aussi développé les exploits associés. Les détails techniques sont sur le blog Frontier Red Team d’Anthropic.

Pourquoi le modèle ne sera pas public

C’est le vrai tournant de cette annonce. Anthropic a explicitement décidé de ne pas rendre Mythos Preview disponible en GA. Le system card publié justifie la décision par le niveau de capacité offensive atteint : un acteur malveillant avec accès au modèle pourrait industrialiser la découverte de zero-days à une vitesse incompatible avec le temps de réponse des mainteneurs.

Le modèle reste accessible à 40+ organisations partenaires pour du défensif, avec un tarif annoncé après la preview de 25 $ input / 125 $ output par 1M tokens sur l’API Claude, Amazon Bedrock, Google Vertex AI et Microsoft Foundry. À titre de comparaison, Claude Opus 4.6 est à 5 $/25 $. Mythos Preview est donc 5 fois plus cher, ce qui vaut aussi comme friction face aux usages abusifs.

Anthropic engage par ailleurs 100 M$ en crédits d’usage pour l’ensemble des participants Glasswing (12 launch partners + 40+ organisations supplémentaires), 2,5 M$ de dons à la Linux Foundation (Alpha-Omega + OpenSSF) et 1,5 M$ à l’Apache Software Foundation pour aider les mainteneurs open source.

Ce que ça change pour toi si tu codes ou tu déploies

Trois implications concrètes à court terme :

Le modèle économique du bug bounty va bouger. Si un modèle interne trouve des zero-days en quelques heures sur du code vieux de 20 ans, les chasseurs humains ne peuvent plus prétendre détenir le monopole de l’expertise. Les programmes vont intégrer de l’IA dans la boucle, et le prix des bounties sur failles triviales va baisser.
L’open source maintainers game change. Les mainteneurs qui ne disposaient pas de budget sécurité vont pouvoir, via le programme Claude for Open Source, accéder à des capacités qui étaient réservées aux grosses équipes. C’est une bonne nouvelle à court terme, mais ça crée aussi un fossé pour ceux qui ne sont pas éligibles.
La fenêtre entre découverte et exploitation se resserre brutalement. Elia Zaitsev, CTO de CrowdStrike, cité dans l’annonce partenaire, évoque un temps d’exploitation qui passerait de plusieurs mois à quelques minutes. Ceux qui déploient sans process de patch rapide sont exposés.

La question qui reste ouverte

Si Mythos est capable de ça dans sa preview, et si la concurrence (OpenAI GPT-5.4, Google Gemini 3.1 Pro) est à un niveau proche sur les benchmarks coding et raisonnement, combien de temps avant qu’un modèle équivalent finisse en open weights — chez DeepSeek, chez Qwen, ou en torrent ? Anthropic prépare des safeguards pour une prochaine génération Opus (et vient de sortir Opus 4.7 avec des capacités cyber volontairement réduites vs Mythos), mais l’industrie joue contre la montre : les capacités offensives voyagent plus vite que les défenses qu’on construit autour.

L’annonce Glasswing ressemble moins à un lancement produit qu’à une mise en ordre de bataille : les 12 partenaires ne sont pas là pour expérimenter, ils sont là pour durcir leur propre code avant que le modèle équivalent n’atterrisse ailleurs. Pour ma part, ce qui me frappe le plus dans ce dossier, ce n’est pas le chiffre des benchmarks, c’est la faille FFmpeg de 16 ans : un bout de code parcouru cinq millions de fois par des outils automatisés sans que rien ne tilte. Les devs qui ont eu le modèle en main ces dernières semaines ont trouvé ça en quelques minutes. Je ne dis pas qu’il faut paniquer, juste que les comparatifs entre agents de code IA ne peuvent plus se contenter de mesurer la productivité développeur : la capacité offensive en est devenue un critère à part entière. Pour tout dev qui maintient du code sensible en 2026, le bon réflexe n’est plus de chercher à être plus malin que les attaquants, c’est d’accepter que l’IA est des deux côtés et de mettre ses process à jour en conséquence.

FAQ Claude Mythos Preview

Claude Mythos Preview est-il disponible publiquement ?

Non. Anthropic a explicitement décidé de ne pas rendre Mythos Preview disponible en general availability (GA). L’accès est invitation-only, réservé à 40+ organisations partenaires pour des usages défensifs, dans le cadre de Project Glasswing.

Combien coûte Claude Mythos Preview ?

25 $ en input et 125 $ en output par million de tokens (après la phase preview) via API Claude, Amazon Bedrock, Google Vertex AI et Microsoft Foundry. C’est 5 fois plus cher que Claude Opus 4.6 (5 $/25 $), une friction délibérée face aux usages abusifs.

Qui sont les 12 partenaires de Project Glasswing ?

Les 12 launch partners sont Anthropic, AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks. 40+ autres organisations ont également accès à la preview pour des cas d’usage défensifs.

Quels sont les benchmarks de Claude Mythos vs Opus 4.6 ?

SWE-bench Verified : 93,9 % vs 80,8 %. Terminal-Bench 2.0 : 82 % vs 65,4 %. GPQA Diamond : 94,6 %. CyberGym : 83,1 % vs 66,6 %. Le gain le plus significatif (+16,5 pts) est sur CyberGym, le benchmark de reproduction de vulnérabilités.

Claude Mythos Preview et Claude Opus 4.7, quelle différence ?

Mythos Preview est un modèle research-preview non public, invitation-only, avec des capacités cyber offensives maximales. Claude Opus 4.7 est le flagship GA grand public d’Anthropic, avec des capacités cyber volontairement réduites par rapport à Mythos et des safeguards automatiques.