MATH 和 GSM8K。

数学最佳 AI 模型.

MATH(竞赛级问题、形式证明)权重最高,GSM8K(小学应用题)作为基础。两者都赢的模型可处理代数、微积分和思维链算术。

使用的基准: MATH · 70% GSM8K · 30%

Showing top 19 models with published data on at least one of the benchmarks above. Scores are weighted averages on a 0–100 scale.

AI 模型排行榜

More leaderboards.