Cet agent IA a résisté à plus de 6 000 tentatives de hack ciblées sans jamais céder
Un développeur a testé la résistance au hack de son agent IA en appelant quiconque le souhaitait à tenter de le pirater en utilisant la méthode des injections de prompt. Résultat : après plus de 6 000 attaques enregistrées, aucune n’a réussi à extraire le fichier ciblé.
« Pensez-vous être capable de compromettre un agent OpenClaw ? »
La prolifération des agents IA sur Internet pousse les hackers à tenter de profiter de leurs failles afin de soutirer des données sensibles ou les fonds qu'ils gèrent, comme lorsque un petit malin a réussi à détourner l’équivalent de 200 000 dollars détenus par Grok à l'aide d'une simple requête envoyée... en morse.
Une technique d'attaque connue sous le nom « injection de prompt », que l'on pourrait résumer à une sorte d'abus de confiance ciblant des agents IA, identifiée comme l'une des principales menaces de sécurité actuelles à leur encontre. De quoi motiver le développeur Fernando Irarrázaval à tenter de trouver une parade, en lançant une expérience inédite.
👉 Pour aller plus loin – Découvrez nos guides et tutos pour acheter des actions
En effet, il a volontairement publié la boîte de réception de son assistant OpenClaw - basé sur Claude Opus 4.6 d'Anthropic - sur le célèbre site Hacker News avec un objectif simple : tenter de pousser Fiu (le nom de son agent IA) à divulguer des informations confidentielles contenues dans un fichier secrets.env, généralement utilisé par les développeurs pour stocker des données sensibles, comme des clés d'API et des mots de passe.
Lancez-vous dans le prop trading avec Kraken et conservez jusqu'à 90 % de vos profits![]()
HackMyClaw est en ligne ! 100 dollars à la personne qui réussira à tromper mon assistant IA pour qu'il divulgue le fichier secrets.env. Les règles : votre seule arme est l'e-mail ([email protected]), Fiu relève sa boîte de réception toutes les heures, une simple attaque par injection de prompt ne suffira pas. Pensez-vous être capable de compromettre un agent OpenClaw ?
Plus de 6 000 attaques enregistrées, sans succès
Une demande en apparence plutôt restreinte à quelques hackers qui va rapidement attirer des milliers de postulants, au point de générer plus de 6 000 attaques destinées à tenter de pousser le fameux Fiu à exécuter une instruction malveillante allant à l'encontre de ses consignes de sécurité, visiblement résumées à quelques lignes de code.
Malgré le nombre important de tentatives de hacks enregistrées, parfois plusieurs en quelques minutes, l'assistant OpenClaw de Fernando Irarrázaval n'a visiblement pas fléchi. C'est en tout cas la conclusion de son expérience, finalement suspendue
📰 Le géant de l'IA OpenAI pourrait reporter son IPO à l'année prochaine
Et pour cause, les conséquences collatérales de cette attaque se sont rapidement révélées plus problématiques que les tentatives de hack elle-mêmes, comme par exemple la suspension du compte Gmail de Fiu durant plus de trois jours suite au déclenchement d'une alerte de fraude ou les coûts d'utilisation des API qui ont rapidement dépassé les 500 dollars.
![]()
L'expérience a été passionnante, mais le coût de l'infrastructure en production et de l'utilisation des modèles d'IA était trop élevé pour être maintenu indéfiniment.
L'absence de hack de cet assistant IA permet d'espérer une meilleure sécurité à venir face au problème des injections de prompt, présenté fin 2025 par OpenAI comme un problème « peu susceptible d'être totalement résolu un jour », avec des attaques qui réussissent encore dans 80 % des cas.
50 € en BTC offerts pour un dépôt de 100 € sur Bybit EUSources : HackMyClaw, Fernando Irarrázaval
La Newsletter crypto n°1 🍞
Recevez un récapitulatif de l'actualité crypto chaque jour par mail 👌
Certains contenus ou liens dans cet article peuvent être de la publicité ou de l'affiliation. L'investissement dans les actifs numériques présente un risque de perte en capital totale ou partielle. Les performances passées ne préjugent pas des performances futures. N'investissez que ce que vous êtes prêts à perdre.