DeepSeek V4 Pro erreicht GPT-5.2-Niveau auf FoodTruck Bench — 17× günstiger
CompaniesDeepSeek
Warum es zählt
Die technologische Lücke zwischen China und USA bei Frontier-Modellen schrumpft rasant — von ~1 Jahr auf 10 Wochen. Bei Cost-Efficiency-Metriken positioniert sich DeepSeek V4 Pro an Position 2, was das Preis-Leistungs-Verhältnis agentic Workloads massiv verändert.
— Lumeric Redaktion
DeepSeek V4 Pro wurde auf FoodTruck Bench, einem agentic Benchmark mit Lebensmittelwagen-Simulation, getestet und erzielt dieselbe Performance wie GPT-5.2 (zehn Wochen später) bei 17× niedrigeren Kosten. Das Modell belegt Platz 4 hinter Opus 4.6, GPT-5.2 und Grok 4.3.
Was wir noch wissen
- FoodTruck Bench: 30-tägiger agentic Benchmark mit Lebensmittelwagen-Simulation über 34 Tools (Standorte, Preise, Inventar, Personal, Wetter, Events) mit persistentem Speicher.
- Preisvergleich: GPT-5.2 kostet $1,75/M Input + $14/M Output, DeepSeek V4 Pro $0,435/M Input + $0,87/M Output — Promopreise, die laut DeepSeeks Vergangenheit zur Standard-Basis werden.
- Konsistenz-Vorteil: DeepSeek zeigt gegen Grok 4.3 6× weniger Lebensmittelverschwendung, 30% mehr Mahlzeiten/Tag, 2,4× engere Outcome-Verteilung (Grok variiert stärker).
- Xiaomi MiMo v2.5 Pro: Zweites chinesisches Modell in Top 6, $22.388 medianer Nettowert bei $2,41/Run, zwischen Gemma 4 31B und Sonnet 4.6.
- Strategischer Shift: Zwei chinesische Modelle unter $3,50/Run in der Frontier-Tier — diese Preisklasse existierte im Februar noch nicht außerhalb US-Laboren.
FoodTruck Bench · Spitzenwert
28500%
Opus 4.6
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
DeepSeek V4 Pro erreicht GPT-5.2-Niveau auf FoodTruck Bench — 17× günstiger
CompaniesDeepSeek
Warum es zählt
Die technologische Lücke zwischen China und USA bei Frontier-Modellen schrumpft rasant — von ~1 Jahr auf 10 Wochen. Bei Cost-Efficiency-Metriken positioniert sich DeepSeek V4 Pro an Position 2, was das Preis-Leistungs-Verhältnis agentic Workloads massiv verändert.
— Lumeric Redaktion
DeepSeek V4 Pro wurde auf FoodTruck Bench, einem agentic Benchmark mit Lebensmittelwagen-Simulation, getestet und erzielt dieselbe Performance wie GPT-5.2 (zehn Wochen später) bei 17× niedrigeren Kosten. Das Modell belegt Platz 4 hinter Opus 4.6, GPT-5.2 und Grok 4.3.
Was wir noch wissen
- FoodTruck Bench: 30-tägiger agentic Benchmark mit Lebensmittelwagen-Simulation über 34 Tools (Standorte, Preise, Inventar, Personal, Wetter, Events) mit persistentem Speicher.
- Preisvergleich: GPT-5.2 kostet $1,75/M Input + $14/M Output, DeepSeek V4 Pro $0,435/M Input + $0,87/M Output — Promopreise, die laut DeepSeeks Vergangenheit zur Standard-Basis werden.
- Konsistenz-Vorteil: DeepSeek zeigt gegen Grok 4.3 6× weniger Lebensmittelverschwendung, 30% mehr Mahlzeiten/Tag, 2,4× engere Outcome-Verteilung (Grok variiert stärker).
- Xiaomi MiMo v2.5 Pro: Zweites chinesisches Modell in Top 6, $22.388 medianer Nettowert bei $2,41/Run, zwischen Gemma 4 31B und Sonnet 4.6.
- Strategischer Shift: Zwei chinesische Modelle unter $3,50/Run in der Frontier-Tier — diese Preisklasse existierte im Februar noch nicht außerhalb US-Laboren.
FoodTruck Bench · Spitzenwert
28500%
Opus 4.6
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.