Coding

1 article

Articles

Claude Sonnet 5 Fennec : 82% sur SWE-Bench, ce que ça change vraiment pour les développeurs

Quand Anthropic a publié Claude Sonnet 5 début février 2026, les benchmarks ont fait le tour de la tech en quelques heures : 82,1% sur SWE-Bench Verified. Pour mesurer ce que ce chiffre représente, rappelons qu'en 2023, les meilleurs modèles plafonnaient à 20% sur ce benchmark. Deux ans plus tard, Sonnet 5 — un modèle mid-range, pas le flagship — résout 8 bugs logiciels sur 10 extraits de vrais projets open source GitHub. Ce n'est pas une progression linéaire, c'est un saut qualitatif. Codena

Jean-Michel Helem · 3 mars 2026 · 5 min