MMLU y MMLU-Pro combinados.

Mejores modelos de IA para conocimiento general.

MMLU mide amplitud en 57 materias académicas; MMLU-Pro endurece el nivel sobre los mismos temas. Una puntuación alta significa que el modelo sabe mucho antes de razonar.

Benchmarks usados: MMLU · 50% MMLU PRO · 50%

Showing top 25 models with published data on at least one of the benchmarks above. Scores are weighted averages on a 0–100 scale.

Rankings de modelos de IA

More leaderboards.