Qualität pro Dollar.

Günstigste leistungsfähige KI-Modelle.

Komposition aus MMLU und HumanEval geteilt durch API-Preis pro Million Input-Tokens. Frontier-Modelle kosten viel; diese Liste zeigt die günstigsten Optionen, die im Kern bestehen.

Verwendete Benchmarks: MMLU · 50% HUMANEVAL · 50% $ weighted

Score geteilt durch den API-Preis pro Million Input-Tokens des Modells. Open-Weight-Modelle ohne veröffentlichte API-Preise sind ausgeschlossen.

#	Modell	Score	Von
1	GPT-4o Mini closed	84.6 $0.15/M in	OpenAI
2	DeepSeek V3 open	85.6 $0.27/M in	DeepSeek
3	DeepSeek R1 open	90.0 $0.55/M in	DeepSeek
4	Claude Haiku 4.5 closed	80.5 $1.0/M in	Anthropic
5	Gemini 2.5 Pro closed	86.3 $1.25/M in	Google DeepMind
6	Gemini 1.5 Pro closed	81.9 $1.25/M in	Google DeepMind
7	Mistral Large 2 open	88.0 $2.0/M in	Mistral AI
8	GPT-5 closed	92.1 $2.5/M in	OpenAI
9	GPT-4o closed	89.5 $2.5/M in	OpenAI
10	Claude 3.5 Sonnet closed	90.4 $3.0/M in	Anthropic
11	Claude Sonnet 4.6 closed	88.8 $3.0/M in	Anthropic
12	Grok 3 closed	88.4 $3.0/M in	xAI
13	Command R+ open	72.7 $2.5/M in	Cohere
14	GPT-4 Turbo closed	86.4 $10.0/M in	OpenAI
15	Claude Opus 4.7 closed	90.0 $15.0/M in	Anthropic

Showing top 15 models with published data on at least one of the benchmarks above. Scores are weighted averages on a 0–100 scale.

KI-Modell-Bestenlisten

More leaderboards.

Beste KI-Modelle für Coding → Beste KI-Modelle fürs Reasoning → Beste KI-Modelle für Mathematik → Beste KI-Modelle für Allgemeinwissen → Beste KI-Modelle fürs Instruction-Following → Beste KI-Modelle für Vision →