IA
Coding multimodal : screenshots, schemas et voix
Demander a un agent IA de comprendre une situation complexe par texte uniquement est souvent inefficace. "Voici l'erreur quand je clique sur le bouton" - le prompt textuel demande au developpeur de decrire ce qu'il voit, ce qui prend du temps et perd de l'information. Pourquoi ne pas simplement screenshot la page et le bug ? "Voici l'architecture que je veux" - la description verbale d'un schema d'architecture est laborieuse et ambigue. Pourquoi ne pas dessiner et photographier le tableau ? Les
Jean-Michel Helem
·
25 juin 2026
·
8 min