SWE-rebench Leaderboard: Claude Opus 4.8 führt mit 56,5 % vor GLM-5.2 und Gemini

Warum es zählt

Qwen3.6-27B erreicht 36,5 % auf SWE-rebench und ist damit ein wettbewerbsfähiges lokal betreibbares Modell für Coding-Agents. Gemma 4 31B (16,5 %) und Qwen3.6-35B-A3B (33,8 %) bieten Vergleichswerte für Self-Hosted-Setups.

— Lumeric Redaktion

Quelle lesenreddit.com

SWE-rebench · Spitzenwert

56.5%

Claude Opus 4.8 xhigh

Evals Benchmarks Open Source Coding Assistenten

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

SWE-rebench Leaderboard: Claude Opus 4.8 führt mit 56,5 % vor GLM-5.2 und Gemini

ToolsClaude Gemini Qwen DeepSeek

CompaniesDeepSeek

Warum es zählt

— Lumeric Redaktion

SWE-rebench · Spitzenwert

56.5%

Claude Opus 4.8 xhigh

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

SWE-rebench Leaderboard: Claude Opus 4.8 führt mit 56,5 % vor GLM-5.2 und Gemini

Frag die KI zum Artikel

Verwandte Beiträge

SWE-rebench Leaderboard: Claude Opus 4.8 führt mit 56,5 % vor GLM-5.2 und Gemini

Frag die KI zum Artikel

Verwandte Beiträge