MMLU und MMLU-Pro kombiniert.

Beste KI-Modelle für Allgemeinwissen.

MMLU misst Breite über 57 akademische Fächer; MMLU-Pro erhöht den Schwierigkeitsgrad. Hohe Werte bedeuten: das Modell weiß viel, bevor es überhaupt reasonen muss.

Verwendete Benchmarks: MMLU · 50% MMLU PRO · 50%

Showing top 25 models with published data on at least one of the benchmarks above. Scores are weighted averages on a 0–100 scale.

KI-Modell-Bestenlisten

More leaderboards.