Python
Polars vs Pandas : benchmark réel sur 10 Go (performance & mémoire)
Résumé des résultats (TL;DR)
Avant de plonger dans les détails, voici les chiffres clés de ce benchmark sur 47 millions de lignes (10 Go) :
MétriquePandasPolarsDifférenceVitesse moyenne41.3s3.3s12.5x plus rapideRAM moyenne20.3 Go6.8 Go67% moins de mémoireMeilleur gain128.3s4.2s30.5x (lazy pipeline)Read CSV 10 Go127.3s14.8s8.6x plus rapideGroupBy multi-agg18.4s1.2s15.3x plus rapideJoins8.92s0.54s16.5x plus rapideCoût infra réel$340/mois$85/mois-75% en production
Verdict : Polars domine sur
Jean-Michel Helem
·
17 octobre 2025
·
14 min