MATH et GSM8K.

Meilleurs modèles IA pour les mathématiques.

MATH (problèmes de compétition, preuves formelles) le plus pondéré, GSM8K (problèmes de niveau primaire) comme plancher. Les modèles qui gagnent les deux gèrent algèbre, calcul et arithmétique en chaîne.

Benchmarks utilisés: MATH · 70% GSM8K · 30%

Showing top 19 models with published data on at least one of the benchmarks above. Scores are weighted averages on a 0–100 scale.

Classements de modèles IA

More leaderboards.