SWE-rebench Leaderboard: Claude Opus 4.8 führt mit 56,5 % vor GLM-5.2 und Gemini
CompaniesDeepSeek
Warum es zählt
Qwen3.6-27B erreicht 36,5 % auf SWE-rebench und ist damit ein wettbewerbsfähiges lokal betreibbares Modell für Coding-Agents. Gemma 4 31B (16,5 %) und Qwen3.6-35B-A3B (33,8 %) bieten Vergleichswerte für Self-Hosted-Setups.
— Lumeric Redaktion
SWE-rebench · Spitzenwert
56.5%
Claude Opus 4.8 xhigh
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
SWE-rebench Leaderboard: Claude Opus 4.8 führt mit 56,5 % vor GLM-5.2 und Gemini
CompaniesDeepSeek
Warum es zählt
Qwen3.6-27B erreicht 36,5 % auf SWE-rebench und ist damit ein wettbewerbsfähiges lokal betreibbares Modell für Coding-Agents. Gemma 4 31B (16,5 %) und Qwen3.6-35B-A3B (33,8 %) bieten Vergleichswerte für Self-Hosted-Setups.
— Lumeric Redaktion
SWE-rebench · Spitzenwert
56.5%
Claude Opus 4.8 xhigh
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.