Guides pratiques pour vous protéger — vous, votre famille et votre entreprise — contre les arnaques liées à l'IA, les deepfakes et les nouvelles menaces cyber.
Un chercheur en sécurité nommé Aonan Guan, avec deux chercheurs de Johns Hopkins University, a démontré qu'un seul motif de prompt injection peut détourner trois des agents IA de coding les plus déployés sur GitHub — Claude Code Security Review d'Anthropic, Gemini CLI Action de Google et GitHub Copilot Agent — et exfiltrer les clés d'API et tokens d'accès du dépôt qui les héberge.
L'attaque a été divulguée publiquement le 15 avril 2026 et mise à jour le 4 mai 2026 après qu'Anthropic a terminé sa remédiation. C'est la première démonstration publique d'un même motif de prompt injection qui touche trois grands éditeurs d'agents IA en même temps.
Guan appelle la technique Comment and Control — un clin d'œil à l'infrastructure command-and-control dont les malwares classiques ont besoin. Ici, toute la boucle tourne à l'intérieur de GitHub. L'attaquant écrit un commentaire, l'agent IA le lit, l'agent exécute les instructions qui y sont enfouies, et l'agent commit ou commente les identifiants volés dans GitHub où l'attaquant peut les récupérer. Aucun serveur externe nécessaire.
Les trois cas confirmés :
Chaque couche de défense que les éditeurs avaient construite autour de ces agents — garde-fous au niveau du modèle, instructions au niveau du prompt, filtrage d'environnement, secret scanning, allowlists réseau — a été contournée de la même manière : en utilisant les capacités prévues de l'agent contre lui. L'attaquant n'a pas exploité un bug de parsing. Il a mis du texte dans le champ que l'agent est conçu pour lire.
C'est ça, le problème structurel. Un agent IA en CI doit lire des entrées non fiables (titres de PR, corps d'issues, commentaires) pour faire son travail. Le même agent doit détenir des secrets de production pour faire son travail. Mettre les deux dans le même runtime, c'est faire de toute prompt injection qui atterrit une fuite de credentials. Guan donne la bonne analogie : c'est du phishing, mais pour des machines.
Par défaut, GitHub Actions n'expose pas les secrets aux pull requests provenant de forks. Mais le trigger pull_request_target, lui, le fait — comme le font les workflows sur les événements issues ou issue_comment, qui se déclenchent sur l'entrée de n'importe quel utilisateur GitHub. Les dépôts qui ont câblé une revue IA automatique sur ces triggers ont livré la vulnérabilité avec.
Les données du workflow que l'agent doit lire sont aussi celles que l'attaquant contrôle. Tant que les agents IA en CI détiendront des secrets de production dans le même runtime qui traite les pull requests et les issues, Comment and Control continuera de fonctionner — seule la surface d'injection changera. Traitez chaque agent de coding comme un prestataire avec accès shell : need-to-know sur les secrets, moindre privilège sur les outils, et partez du principe que tout texte qu'il lit depuis Internet a été écrit pour le tromper.


