MMMU — suy luận đa phương thức trên hình ảnh.
Mô hình AI tốt nhất cho thị giác.
MMMU đánh giá mô hình trên câu hỏi cấp đại học kết hợp biểu đồ, sơ đồ và hình ảnh. Lấy từ submission MMMU chính thức của mỗi mô hình.
Benchmark được dùng:
MMMU
| # | Mô hình | Điểm | Từ |
|---|---|---|---|
| 1 | 81.7 | Google DeepMind | |
| 2 | 69.1 | OpenAI | |
| 3 | 64.9 | Google DeepMind | |
| 4 | 50.7 | Meta AI |
Showing top 4 models with published data on at least one of the benchmarks above. Scores are weighted averages on a 0–100 scale.