Fuites de secrets dans les prompts : eviter l'incident

Un developpeur fatigue colle 200 lignes de code dans Cursor pour debugger une erreur. Ces 200 lignes contiennent un fichier .env avec une cle API AWS de production. Le contenu part chez le fournisseur LLM, est utilisé pour l'entrainement potentiel, et reste dans les logs pour des semaines ou mois. Cette histoire n'est pas hypothetique : elle s'est produite des dizaines de fois en 2024-2025 dans des organisations qui croyaient avoir des disciplines correctes. Le cout typique d'un tel incident en 2026 va de 10 000 a 100 000 euros (rotation des secrets, audit, eventuelle notification reglementaire). Cet article detaille les vecteurs typiques de fuites, les defenses qui marchent, et la discipline qui protege durablement.

Le scenario du developpeur honnete

La majorite des fuites de secrets via prompts LLM ne sont pas malicieuses. Elles viennent de developpeurs honnetes qui ne realisent pas ce qui se passe.

Le scenario du copier-coller. Un developpeur copie un bloc de code pour le coller dans Claude ou ChatGPT en demandant une explication ou une correction. Le bloc inclut sans qu'il s'en apercoive un secret hard-codé, un commentaire avec credentials, ou des donnees sensibles dans un dump. Une fois colle, c'est trop tard.

Le scenario du fichier joint. Plusieurs interfaces (ChatGPT desktop, Claude Projects) acceptent l'upload de fichiers. Un developpeur uploade un dossier de logs pour analyse. Les logs contiennent des PII clients ou des cles API tracees lors d'incidents. La fuite est massive et silencieuse.

Le scenario du contexte automatique. Un editeur agentique (Cursor, Claude Code) inclut automatiquement des fichiers dans le contexte de chaque interaction. Si la configuration n'exclut pas les .env, secrets.yaml, ou les fichiers de configuration sensibles, ils sont envoyes regulierement.

Le scenario du logging applicatif. Une application qui utilise un LLM pour traiter des requetes utilisateurs peut envoyer involontairement des donnees PII ou des secrets dans les prompts si la sanitization des entrees est insuffisante.

Ces quatre scenarios couvrent la majorite des fuites observees en 2025-2026. Aucun n'implique de mauvaise intention. Tous demandent discipline et outils pour etre evites.

Les categories de secrets a proteger

Toutes les donnees ne sont pas egales. La discipline de protection s'applique a plusieurs categories.

Les credentials et cles API : AWS, GCP, OVH, GitHub tokens, OAuth secrets. Ces secrets, une fois exposes, permettent une exploitation directe par tout attaquant qui les obtient. La rotation immediate est obligatoire en cas de fuite.

Les donnees personnelles (PII) : noms, emails, adresses, numeros de telephone, identifiants nationaux. La fuite de PII declenche des obligations RGPD : notification a la CNIL, eventuellement notification aux personnes concernees, fines potentielles.

Les donnees clients confidentielles : details contractuels, informations financieres, contenus produits non publics, donnees medicales. La fuite peut produire un dommage commercial direct et des consequences contractuelles.

Le code source proprietaire : algorithmes confidentiels, business logic differenciante, code soumis a NDA. La fuite peut compromettre un avantage concurrentiel.

Les donnees techniques sensibles : architecture detaillée de l'infrastructure, schemas de base de donnees, configurations de securite. Ces informations peuvent faciliter des attaques ulterieures meme si elles ne sont pas directement exploitables.

Le contrat avec les fournisseurs

Une discipline preliminaire est de comprendre ce que les fournisseurs LLM font des donnees envoyees. Cette comprehension oriente le niveau de protection necessaire.

Les plans grand public (ChatGPT Plus, Claude Pro, Gemini Advanced) utilisent generalement les conversations pour ameliorer les modeles, sauf opt-out explicite. Toute donnee envoyee peut potentiellement reapparaitre dans des reponses futures a d'autres utilisateurs.

Les plans Enterprise (OpenAI Enterprise, Anthropic Enterprise, Google Workspace AI) offrent contractuellement la garantie que les donnees ne sont pas utilisees pour l'entrainement. Cette garantie est essentielle pour les contextes professionnels.

Les API directes (api.openai.com, api.anthropic.com) ont des conditions intermediaires. Generalement, les donnees ne sont pas utilisees pour l'entrainement par defaut, mais cette politique peut evoluer. Les conditions specifiques doivent etre verifiees.

Les proxies internes (LiteLLM, Helicone self-hosted) ajoutent une couche de controle. Notre [guide de gouvernance des agents IA en entreprise](/budget-gouvernance-agents-ia-entreprise/) detaille les patterns d'usage de proxies.

Defense 1 : detection automatique pre-envoi

La premiere ligne de defense est la detection automatique des secrets avant envoi a un LLM.

Plusieurs outils en 2026 offrent cette capacite. Truffleog et detect-secrets sont les outils open source de reference pour identifier les secrets dans le code. Leur integration dans les workflows IA evite que les secrets sortent de l'environnement.

Le pattern qui fonctionne est le pre-commit hook combiné a un proxy LLM filtrant. Le pre-commit hook empeche les secrets d'arriver dans le code commit. Le proxy LLM scanne les prompts envoyes vers les API externes et bloque ou redact les secrets detectes.

Cette approche en deux niveaux cree une defense en profondeur. Meme si un secret echappe au premier niveau (commit), le second niveau (proxy) l'intercepte avant la fuite externe.

Defense 2 : redaction automatique des PII

Pour les donnees personnelles, la detection seule n'est generalement pas suffisante : il faut redacter pour preserver l'usabilite du contenu.

Plusieurs outils proposent cette redaction en 2026. Microsoft Presidio est un framework open source pour la detection et redaction de PII dans le texte. Il identifie noms, emails, telephones, numeros de carte, et les remplace par des tokens generiques avant envoi au LLM.

Le pattern qui fonctionne est la redaction selective. Les PII sont remplaces par des marqueurs tokenises ([NAME_1], [EMAIL_1]). Le LLM travaille sur le contenu redacté. La reponse est ensuite demaskée pour l'utilisateur final. Cette technique preserve la fonctionnalite tout en protegant les donnees.

L'implementation se fait generalement dans le proxy interne. Cette centralisation evite que chaque application duplique la logique de redaction.

Defense 3 : configuration restrictive des outils

Les editeurs et agents IA ont des configurations qui peuvent inclure ou exclure des fichiers. Une configuration restrictive est une defense passive efficace.

Pour Cursor, le fichier .cursorignore exclut les fichiers du contexte. Une configuration recommandee inclut .env*, *.pem, secrets/*, *.key, et tout repertoire contenant des donnees sensibles. Cette discipline empeche l'inclusion accidentelle.

Pour Claude Code, le fichier .claudeignore ou les regles dans CLAUDE.md jouent un role similaire. La discipline est la meme : exclure les patterns sensibles.

Pour les serveurs MCP qui exposent le filesystem, la configuration des permissions doit limiter l'acces aux repertoires sensibles. Notre [guide MCP en entreprise](/mcp-entreprise-securite-gouvernance/) detaille les patterns de configuration.

L'audit periodique de ces configurations est important. Les nouveaux types de fichiers ou repertoires sensibles peuvent emerger sans que les configurations soient mises a jour. Une review trimestrielle evite la derive.

Defense 4 : formation des developpeurs

Au-dela des outils, la formation des developpeurs est la defense la plus durable.

Les elements essentiels a transmettre incluent la comprehension du contrat avec les fournisseurs (ce qui est fait des donnees envoyees), les patterns typiques de fuite (les quatre scenarios decrits plus haut), les outils disponibles pour se proteger, et la discipline de validation avant copier-coller.

Une formation initiale d'1 a 2 heures pour tous les developpeurs nouveaux et existants est un investissement raisonnable. Elle peut etre complete par des rappels reguliers (newsletter mensuelle, exemples d'incidents internes anonymisés, ateliers semestriels).

La gamification peut aider. Plusieurs entreprises organisent des "secret hunting days" ou les developpeurs s'entrainent a detecter des secrets caches dans des codebases factices. Ces exercices renforcent la sensibilisation de maniere ludique.

Cas reels documentes

Plusieurs incidents publics en 2025-2026 illustrent la realite du risque.

Un cas documente concerne un developpeur d'une startup fintech qui a colle 50 lignes de code dans ChatGPT pour debugger une erreur. Les 50 lignes incluaient un commentaire // TODO: rotate this key avec une cle Stripe production. La cle a ete decouverte par les outils d'audit interne 3 jours plus tard. Cout total : 25 000 euros (rotation, audit, notification clients).

Un autre cas concerne une equipe DevOps qui a uploadé un fichier de logs dans Claude pour analyse. Le fichier de logs contenait les PII de 3 200 utilisateurs (emails, noms, derniers achats). Notification a la CNIL obligatoire, fine RGPD potentielle de plusieurs dizaines de milliers d'euros, perte de confiance client.

Un cas plus subtil concerne un agent qui consultait automatiquement un repertoire /credentials/ non exclu dans la configuration. Pendant 6 semaines, chaque interaction avec l'agent envoyait les fichiers de credentials a l'API LLM. La decouverte tardive a impose une rotation complete des credentials, des semaines d'audit, et un audit de securité externe.

Ces cas partagent une caracteristique : aucun n'est le resultat d'une mauvaise intention. Tous sont des erreurs operationnelles que la discipline et les outils auraient pu prevenir.

Discipline du recouvrement post-incident

Si une fuite se produit malgre les defenses, la discipline de recouvrement est essentielle.

L'identification rapide : les outils d'audit (proxy interne, logs des fournisseurs) doivent permettre de detecter rapidement quels secrets ont ete exposés et quand. Sans cette visibilité, le perimetre du recouvrement est inconnu.

La rotation immediate : tous les secrets potentiellement exposes doivent etre roule immediatement. Cette action limite la fenetre d'exploitation par un attaquant qui aurait obtenu les donnees.

L'audit du perimetre : determiner ce qui a ete fait avec les credentials exposes pendant la periode entre fuite et rotation. Cette analyse identifie les eventuelles intrusions deja realisees.

La notification : selon les regulations applicables, les autorites et personnes concernees doivent etre notifiees dans les delais legaux. Le RGPD impose 72 heures pour les fuites de PII. Ne pas respecter ces delais peut produire des sanctions plus graves que la fuite elle-meme.

L'analyse des causes : comprendre comment la fuite s'est produite et ajuster les defenses. Cette etape evite les recidives. Sans cette discipline, les memes incidents se repetent.

L'enjeu RGPD specifique

Pour les organisations soumises au RGPD, la fuite de PII via LLM presente des enjeux specifiques.

Le RGPD considere generalement le LLM provider comme un sous-traitant de la donnee. Les obligations standards s'appliquent : contrat de sous-traitance, garanties de securite, residence des donnees.

Les fournisseurs Enterprise (OpenAI Enterprise, Anthropic Enterprise) offrent des contrats DPA conformes. Les plans grand public ne les offrent generalement pas. Cette difference est determinante pour la legalite de l'usage en contexte business.

Le registre des traitements doit etre mis a jour pour inclure les usages LLM. Cette discipline administrative est obligatoire mais frequemment negligee. Les entreprises sans registre a jour s'exposent a des sanctions disproportionnees a leurs incidents reels.

Notre [guide sur la gouvernance des agents IA en entreprise](/budget-gouvernance-agents-ia-entreprise/) detaille les obligations RGPD plus larges.

Le pattern proxy interne

Le pattern qui combine toutes les defenses precedentes en 2026 est le proxy interne pour les API LLM.

Le proxy intercepte tous les appels vers les fournisseurs externes. Pour chaque appel, il applique en sequence : detection de secrets (truffleog ou equivalent), redaction de PII (Presidio ou equivalent), validation des permissions de l'utilisateur, logging complet. Si tout passe, l'appel est transmis. Sinon, l'appel est bloque ou modifie.

Cette centralisation a plusieurs avantages. Application uniforme des politiques. Mise a jour centrale des regles de detection. Audit unifie des appels. Possibilite d'auto-discipline (un developpeur qui voit ses appels bloques apprend rapidement les bonnes pratiques).

L'investissement initial est de quelques semaines pour configurer un proxy correctement. Le retour sur investissement se mesure typiquement en evitement d'un seul incident moyen.

La culture qui protege

Au-dela des outils, la culture organisationnelle est ce qui protege durablement.

Trois elements caracterisent les organisations protegees. La transparence sur les incidents : les incidents internes sont documentes et partages (anonymises). Cette transparence transforme les erreurs en apprentissages collectifs.

La reconnaissance de la difficulte : la discipline est dure, les developpeurs font des erreurs. Une culture punitive masque les incidents au lieu de les remonter. Une culture mature accepte que les erreurs arrivent et se concentre sur la prevention systemique.

L'investissement dans les outils : les outils ne suffisent pas mais ils sont indispensables. Sans proxy, sans pre-commit hooks, sans formation, la discipline depend uniquement de la vigilance individuelle, qui est par nature variable.

Les organisations qui combinent ces trois elements en 2026 maintiennent un niveau de securite qui resiste aux incidents reels. Celles qui ne le font pas voient leurs developpeurs adopter l'IA sans cadre et accumulent un risque qui finit par se materialiser dans la douleur d'incidents evitables.

L'enjeu en 2026 n'est plus de savoir si l'IA dans le developpement est risquee : elle l'est. C'est de mettre en place les disciplines qui rendent ce risque gerable. Les outils existent, les patterns sont documentes, les retours d'experience sont nombreux. Ce qui manque generalement n'est pas la connaissance mais la volonte d'investir dans la discipline. Cette volonte differencie les organisations matures des autres.