IA
Claude Sonnet 5 Fennec : 82% sur SWE-Bench, ce que ça change vraiment pour les développeurs
Quand Anthropic a publié Claude Sonnet 5 début février 2026, les benchmarks ont fait le tour de la tech en quelques heures : 82,1% sur SWE-Bench Verified. Pour mesurer ce que ce chiffre représente, rappelons qu'en 2023, les meilleurs modèles plafonnaient à 20% sur ce benchmark. Deux ans plus tard, Sonnet 5 — un modèle mid-range, pas le flagship — résout 8 bugs logiciels sur 10 extraits de vrais projets open source GitHub. Ce n'est pas une progression linéaire, c'est un saut qualitatif.
Codena
Jean-Michel Helem
·
3 mars 2026
·
5 min