Cet agent IA a résisté à plus de 6 000 tentatives de hack ciblées sans jamais céder

Un développeur a testé la résistance au hack de son agent IA en appelant quiconque le souhaitait à tenter de le pirater en utilisant la méthode des injections de prompt. Résultat : après plus de 6 000 attaques enregistrées, aucune n’a réussi à extraire le fichier ciblé.

Cet agent IA a résisté à plus de 6 000 tentatives de hack ciblées sans jamais céder

« Pensez-vous être capable de compromettre un agent OpenClaw ? »

La prolifération des agents IA sur Internet pousse les hackers à tenter de profiter de leurs failles afin de soutirer des données sensibles ou les fonds qu'ils gèrent, comme lorsque un petit malin a réussi à détourner l’équivalent de 200 000 dollars détenus par Grok à l'aide d'une simple requête envoyée... en morse.

Une technique d'attaque connue sous le nom « injection de prompt », que l'on pourrait résumer à une sorte d'abus de confiance ciblant des agents IA, identifiée comme l'une des principales menaces de sécurité actuelles à leur encontre. De quoi motiver le développeur Fernando Irarrázaval à tenter de trouver une parade, en lançant une expérience inédite.

👉 Pour aller plus loin – Découvrez nos guides et tutos pour acheter des actions

En effet, il a volontairement publié la boîte de réception de son assistant OpenClaw - basé sur Claude Opus 4.6 d'Anthropic - sur le célèbre site Hacker News avec un objectif simple : tenter de pousser Fiu (le nom de son agent IA) à divulguer des informations confidentielles contenues dans un fichier secrets.env, généralement utilisé par les développeurs pour stocker des données sensibles, comme des clés d'API et des mots de passe.

blockquote icon

HackMyClaw est en ligne ! 100 dollars à la personne qui réussira à tromper mon assistant IA pour qu'il divulgue le fichier secrets.env. Les règles : votre seule arme est l'e-mail ([email protected]), Fiu relève sa boîte de réception toutes les heures, une simple attaque par injection de prompt ne suffira pas. Pensez-vous être capable de compromettre un agent OpenClaw ?

Fernando Irarrázaval

Lancez-vous dans le prop trading avec Kraken et conservez jusqu'à 90 % de vos profits
Publicité - Investir comporte des risques (en savoir plus)

Plus de 6 000 attaques enregistrées, sans succès

Une demande en apparence plutôt restreinte à quelques hackers qui va rapidement attirer des milliers de postulants, au point de générer plus de 6 000 attaques destinées à tenter de pousser le fameux Fiu à exécuter une instruction malveillante allant à l'encontre de ses consignes de sécurité, visiblement résumées à quelques lignes de code.

Malgré le nombre important de tentatives de hacks enregistrées, parfois plusieurs en quelques minutes, l'assistant OpenClaw de Fernando Irarrázaval n'a visiblement pas fléchi. C'est en tout cas la conclusion de son expérience, finalement suspendue

📰 Le géant de l'IA OpenAI pourrait reporter son IPO à l'année prochaine

Et pour cause, les conséquences collatérales de cette attaque se sont rapidement révélées plus problématiques que les tentatives de hack elle-mêmes, comme par exemple la suspension du compte Gmail de Fiu durant plus de trois jours suite au déclenchement d'une alerte de fraude ou les coûts d'utilisation des API qui ont rapidement dépassé les 500 dollars.

blockquote icon

L'expérience a été passionnante, mais le coût de l'infrastructure en production et de l'utilisation des modèles d'IA était trop élevé pour être maintenu indéfiniment.

Fernando Irarrázaval

L'absence de hack de cet assistant IA permet d'espérer une meilleure sécurité à venir face au problème des injections de prompt, présenté fin 2025 par OpenAI comme un problème « peu susceptible d'être totalement résolu un jour », avec des attaques qui réussissent encore dans 80 % des cas.

50 € en BTC offerts pour un dépôt de 100 € sur Bybit EU
Publicité - Investir comporte des risques (en savoir plus)

Sources : HackMyClaw, Fernando Irarrázaval

La Newsletter crypto n°1 🍞

Recevez un récapitulatif de l'actualité crypto chaque jour par mail 👌

Certains contenus ou liens dans cet article peuvent être de la publicité ou de l'affiliation. L'investissement dans les actifs numériques présente un risque de perte en capital totale ou partielle. Les performances passées ne préjugent pas des performances futures. N'investissez que ce que vous êtes prêts à perdre.

guest
0 Commentaires
Inline Feedbacks
View all comments
Voir plus
Tout voir

Cryptoast

Le site qui explique tout de A à Z sur le Bitcoin, la blockchain et les crypto-monnaies. Des actualités et des articles explicatifs pour découvrir et progresser dans ces secteurs !


Les articles les plus lus

Chute de l'or : quelles sont les raisons et est-ce une opportunité d'achat ?

Chute de l'or : quelles sont les raisons et est-ce une opportunité d'achat ?

Quitter Binance avant le 1er juillet : le guide pour migrer vos cryptomonnaies

Quitter Binance avant le 1er juillet : le guide pour migrer vos cryptomonnaies

Arrêt de Binance en France : voici les meilleures alternatives pour vos cryptomonnaies

Arrêt de Binance en France : voici les meilleures alternatives pour vos cryptomonnaies

Vers une crise financière mondiale ? Ces signaux qui inquiètent

Vers une crise financière mondiale ? Ces signaux qui inquiètent