Qualität pro Dollar.

Günstigste leistungsfähige KI-Modelle.

Komposition aus MMLU und HumanEval geteilt durch API-Preis pro Million Input-Tokens. Frontier-Modelle kosten viel; diese Liste zeigt die günstigsten Optionen, die im Kern bestehen.

Verwendete Benchmarks: MMLU · 50% HUMANEVAL · 50% $ weighted

Score geteilt durch den API-Preis pro Million Input-Tokens des Modells. Open-Weight-Modelle ohne veröffentlichte API-Preise sind ausgeschlossen.

# Modell Score Von
1 84.6
$0.15/M in
OpenAI
2 85.6
$0.27/M in
DeepSeek
3 90.0
$0.55/M in
DeepSeek
4 80.5
$1.0/M in
Anthropic
5 86.3
$1.25/M in
Google DeepMind
6 81.9
$1.25/M in
Google DeepMind
7 88.0
$2.0/M in
Mistral AI
8
GPT-5 closed
92.1
$2.5/M in
OpenAI
9
GPT-4o closed
89.5
$2.5/M in
OpenAI
10 90.4
$3.0/M in
Anthropic
11 88.8
$3.0/M in
Anthropic
12
Grok 3 closed
88.4
$3.0/M in
xAI
13 72.7
$2.5/M in
Cohere
14 86.4
$10.0/M in
OpenAI
15 90.0
$15.0/M in
Anthropic

Showing top 15 models with published data on at least one of the benchmarks above. Scores are weighted averages on a 0–100 scale.

KI-Modell-Bestenlisten

More leaderboards.