DeepSeek V4 Pro erreicht GPT-5.2-Niveau auf FoodTruck Bench — 17× günstiger

Warum es zählt

Die technologische Lücke zwischen China und USA bei Frontier-Modellen schrumpft rasant — von ~1 Jahr auf 10 Wochen. Bei Cost-Efficiency-Metriken positioniert sich DeepSeek V4 Pro an Position 2, was das Preis-Leistungs-Verhältnis agentic Workloads massiv verändert.

— Lumeric Redaktion

DeepSeek V4 Pro wurde auf FoodTruck Bench, einem agentic Benchmark mit Lebensmittelwagen-Simulation, getestet und erzielt dieselbe Performance wie GPT-5.2 (zehn Wochen später) bei 17× niedrigeren Kosten. Das Modell belegt Platz 4 hinter Opus 4.6, GPT-5.2 und Grok 4.3.

Was wir noch wissen

FoodTruck Bench: 30-tägiger agentic Benchmark mit Lebensmittelwagen-Simulation über 34 Tools (Standorte, Preise, Inventar, Personal, Wetter, Events) mit persistentem Speicher.
Preisvergleich: GPT-5.2 kostet $1,75/M Input + $14/M Output, DeepSeek V4 Pro $0,435/M Input + $0,87/M Output — Promopreise, die laut DeepSeeks Vergangenheit zur Standard-Basis werden.
Konsistenz-Vorteil: DeepSeek zeigt gegen Grok 4.3 6× weniger Lebensmittelverschwendung, 30% mehr Mahlzeiten/Tag, 2,4× engere Outcome-Verteilung (Grok variiert stärker).
Xiaomi MiMo v2.5 Pro: Zweites chinesisches Modell in Top 6, $22.388 medianer Nettowert bei $2,41/Run, zwischen Gemma 4 31B und Sonnet 4.6.
Strategischer Shift: Zwei chinesische Modelle unter $3,50/Run in der Frontier-Tier — diese Preisklasse existierte im Februar noch nicht außerhalb US-Laboren.

Quelle lesenreddit.com

FoodTruck Bench · Spitzenwert

28500%

Opus 4.6

Foundation Modelle Evals Benchmarks Open Source

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

DeepSeek V4 Pro erreicht GPT-5.2-Niveau auf FoodTruck Bench — 17× günstiger

ToolsClaude GPT Grok DeepSeek

CompaniesDeepSeek

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

FoodTruck Bench: 30-tägiger agentic Benchmark mit Lebensmittelwagen-Simulation über 34 Tools (Standorte, Preise, Inventar, Personal, Wetter, Events) mit persistentem Speicher.
Preisvergleich: GPT-5.2 kostet $1,75/M Input + $14/M Output, DeepSeek V4 Pro $0,435/M Input + $0,87/M Output — Promopreise, die laut DeepSeeks Vergangenheit zur Standard-Basis werden.
Konsistenz-Vorteil: DeepSeek zeigt gegen Grok 4.3 6× weniger Lebensmittelverschwendung, 30% mehr Mahlzeiten/Tag, 2,4× engere Outcome-Verteilung (Grok variiert stärker).
Xiaomi MiMo v2.5 Pro: Zweites chinesisches Modell in Top 6, $22.388 medianer Nettowert bei $2,41/Run, zwischen Gemma 4 31B und Sonnet 4.6.
Strategischer Shift: Zwei chinesische Modelle unter $3,50/Run in der Frontier-Tier — diese Preisklasse existierte im Februar noch nicht außerhalb US-Laboren.

FoodTruck Bench · Spitzenwert

28500%

Opus 4.6

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

DeepSeek V4 Pro erreicht GPT-5.2-Niveau auf FoodTruck Bench — 17× günstiger

Frag die KI zum Artikel

Verwandte Beiträge

DeepSeek V4 Pro erreicht GPT-5.2-Niveau auf FoodTruck Bench — 17× günstiger

Frag die KI zum Artikel

Verwandte Beiträge