MMMU — multimodal reasoning across images.

Best AI models for vision.

MMMU evaluates models on college-level questions paired with diagrams, charts, and images. Sourced from each model's official MMMU submission.

Benchmarks used: MMMU

#	Model	Score	From
1	Gemini 2.5 Pro closed	81.7	Google DeepMind
2	GPT-4o closed	69.1	OpenAI
3	Gemma 3 27B open	64.9	Google DeepMind
4	Llama 3.2 11B Vision open	50.7	Meta AI

Showing top 4 models with published data on at least one of the benchmarks above. Scores are weighted averages on a 0–100 scale.

AI model leaderboards

More leaderboards.