Guides pratiques pour vous protéger — vous, votre famille et votre entreprise — contre les arnaques liées à l'IA, les deepfakes et les nouvelles menaces cyber.
Le 20 mai 2026, l'AI Red Team de Microsoft — l'unité interne qui met à l'épreuve les systèmes IA de l'entreprise — a publié deux outils de sécurité sur GitHub : RAMPART, un framework pytest-native pour red-teamer en continu des agents IA dans la CI, et Clarity, un outil structuré de revue de design qui pousse à interroger les décisions d'architecture avec lesquelles un agent est figé. Les deux sont gratuits. Les deux ont été utilisés en interne chez Microsoft avant la sortie.
La sortie compte parce que, jusqu'à cette semaine, le workflow de red team IA de Microsoft était surtout inaccessible à toute personne extérieure à Microsoft.
RAMPART — Risk Assessment and Measurement Platform for Agentic Red Teaming — s'appuie sur PyRIT, la bibliothèque open source de red teaming d'IA générative que Microsoft a publiée en 2024. Là où PyRIT s'adresse à des chercheurs en sécurité qui sondent un système fini, RAMPART s'adresse aux ingénieurs qui en livrent un. Les tests sont écrits sous forme de cas pytest, chacun décrivant un scénario adverse — cross-prompt injection, exfiltration de données, régression comportementale — et routés vers l'agent via un adaptateur léger. Les résultats pass/fail conditionnent le build CI exactement comme le ferait un test d'intégration. Ram Shankar Siva Kumar, fondateur de l'AI Red Team de Microsoft, raconte que l'équipe response de l'entreprise a utilisé RAMPART pour générer 100 variantes d'une seule vulnérabilité signalée et vérifier les mitigations contre chacune — un travail qui aurait pris des semaines aux experts Microsoft, achevé en quelques heures.
La surface d'attaque des agents IA a été documentée dans des incidents rien que ce mois-ci : le worm npm Mini Shai-Hulud qui a touché Mistral AI et TanStack, le zero-day de contournement de 2FA conçu par IA que le Threat Intelligence Group de Google a intercepté en environnement réel, le motif de prompt injection Comment and Control qui a détourné Claude Code, Gemini CLI et Copilot Agent la même semaine. Le motif commun à tous ces incidents : les capacités prévues d'un agent — lire un titre de PR, exécuter un outil, appeler une API — deviennent la surface d'attaque. Les workflows AppSec statiques ne captent pas ça. Les modes d'échec sont probabilistes et comportementaux, pas déterministes.
RAMPART transforme le test de red team en test de régression. Clarity déplace la revue de sécurité vers la gauche, au moment où les décisions sont encore peu coûteuses à modifier. Aucune de ces idées n'est nouvelle en soi — c'est comme ça que l'AppSec mature fonctionne pour du code traditionnel. Ce qui est nouveau, c'est que le workflow interne de red team IA d'un éditeur majeur est désormais un artefact open source que toute équipe qui construit des agents peut adopter dès cet après-midi.
Jusqu'ici, la méthode défensive pour les agents IA, c'était : embaucher une red team, espérer qu'elle attrape les choses avant les attaquants. Microsoft vient de publier un moyen d'intégrer ce travail dans la pull request. L'outillage ne règle pas la prompt injection — rien ne la règle, pour le moment — mais il sort la sûreté des agents d'une revue ponctuelle pour la transformer en artefacts vivants que les ingénieurs maintiennent à chaque commit. Pour les équipes qui livrent des agents en production, c'est l'amélioration de contrôle la moins coûteuse disponible cette semaine.


