MMLU và MMLU-Pro kết hợp.

Mô hình AI tốt nhất cho kiến thức tổng quát.

MMLU đo độ rộng qua 57 môn học; MMLU-Pro nâng độ khó trên cùng các lĩnh vực. Điểm cao nghĩa là mô hình biết nhiều trước khi cần suy luận.

Benchmark được dùng: MMLU · 50% MMLU PRO · 50%

Showing top 25 models with published data on at least one of the benchmarks above. Scores are weighted averages on a 0–100 scale.

Bảng xếp hạng mô hình AI

More leaderboards.