La fuite du modèle Mythos d’Anthropic déclenche une alarme en matière de cybersécurité

Maria

Anthropique

Une fuite de données au sein de la société d’intelligence artificielle (IA) Anthropic a révélé l’existence d’un nouveau modèle puissant doté de capacités avancées d’attaque de cybersécurité, ce qui a incité les experts en sécurité à avertir que l’IA franchit un seuil critique en matière de capacité de piratage offensif.

La fuite, qui a été révélée pour la première fois le 26 mars 2026, a révélé des projets d’articles de blog et près de 3 000 actifs non publiés du système de gestion de contenu d’Anthropic après qu’une erreur de configuration les ait rendus accessibles au public. Les projets ont révélé un nouveau modèle appelé Claude Mythos et Claude Capybara, qu’Anthropic a décrit en interne comme « plus grand et plus intelligent que nos modèles Opus, qui étaient, jusqu’à présent, nos plus puissants », obtenant « des scores considérablement plus élevés aux tests de codage logiciel, de raisonnement académique et de cybersécurité ».

Anthropic a confirmé l’existence du modèle après avoir été contacté par Fortune, affirmant qu’il développait « un modèle à usage général avec des avancées significatives en matière de raisonnement, de codage et de cybersécurité », le décrivant comme un changement radical dans ses capacités. La société a déclaré qu’elle adoptait une approche de déploiement prudente en raison du coût et des capacités du modèle, en commençant par un petit groupe d’utilisateurs à accès anticipé.

Cette révélation a alarmé les professionnels de la cybersécurité. Jonathan Zanger, directeur technologique de Check Point Software Technologies, a déclaré que ce développement signale deux changements structurels majeurs dans le paysage mondial des menaces : la démocratisation des capacités d’attaque avancées et l’industrialisation des cyberattaques.

« Les capacités qui nécessitaient autrefois des acteurs d’élite ou des équipes d’États-nations bien financées seront accessibles aux acteurs peu qualifiés tirant parti de l’aide de l’IA », a prévenu Zanger. Il a noté que la convergence de ces forces réduirait à un niveau proche de zéro le temps entre la découverte et l’exploitation des vulnérabilités, créant ce qu’il a décrit comme une ère d’« usines d’attaques d’IA ».

Les observateurs de la sécurité ont également noté l’ironie du fait qu’un modèle décrit comme doté de capacités de cybersécurité sans précédent a lui-même été révélé par une erreur de configuration élémentaire, une publication notant que « le modèle qui promet des capacités de cybersécurité sans précédent a été exposé par une faille de sécurité élémentaire ».

Zanger a exhorté les organisations à réévaluer immédiatement leur posture de sécurité, en particulier en ce qui concerne la protection Zero Day, les cycles de correctifs, la segmentation du réseau et l’exposition des systèmes existants. Il a averti que le fait qu’une organisation ait adopté ou non l’IA n’a pas d’importance, dans la mesure où les acteurs de la menace ont poussé et continueront à pousser ces capacités plus loin.

Anthropic n’a pas confirmé de date de publication publique du modèle et la société a supprimé l’accès public au magasin de données après le signalement de la fuite.