MMLU 和 MMLU-Pro 综合。

通识最佳 AI 模型.

MMLU 覆盖 57 个学科的广度;MMLU-Pro 在同样领域上提高难度。高分意味着模型在推理前就知道很多。

使用的基准: MMLU · 50% MMLU PRO · 50%

Showing top 25 models with published data on at least one of the benchmarks above. Scores are weighted averages on a 0–100 scale.

AI 模型排行榜

More leaderboards.