Open-Model-Welle: Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5 und GLM-5.1 erschienen

Warum es zählt

Mehrere starke Open-Weight-Modelle unter Apache 2.0 (u.a. Gemma 4, MiMo V2.5-Pro) erhöhen die praktische Einsatzbarkeit ohne Lizenzrisiken. Die CAISI-Bewertung, die einen wachsenden Rückstand offener Modelle behauptet, wird im Beitrag methodisch angezweifelt – besonders wegen Benchmark-Setup-Problemen.

— Lumeric Redaktion

Im Mai 2026 haben nahezu alle großen Open-Frontier-Labs neue Modelle veröffentlicht. Besonders auffällig: DeepSeek-V4 erscheint in zwei Varianten – Pro (1,6T-A49B MoE) und Flash (284B-13B), wobei Flash laut frühen Nutzererfahrungen das überzeugendere Modell ist. Googles Gemma 4 bringt mehrere Größen (4B, 9B, 31B dense sowie 26B-A4B MoE) und wechselt erstmals zur Apache-2.0-Lizenz. Xiaomis MiMo-V2.5-Pro (ebenfalls Apache 2.0) hält laut Benchmarks mit Kimi K2.6 und GLM-5.1 mit. Poolsides Laguna-XS.2 ist das erste öffentliche Coding-Modell des Unternehmens (33B-A3B). Das Center for AI Standards and Innovation (CAISI) hat auf Basis eines IRT-Elo-Scores über neun Benchmarks ermittelt, dass offene Modelle hinter der amerikanischen Frontier zurückbleiben – mit wachsendem Abstand. Autoren Florian Brand und Nathan Lambert kritisieren jedoch die Methodik: Benchmarks wie CTF-Archive-Diamond wurden für V4 nur auf einem Subset ausgeführt und extrapoliert; PortBench ist ein CAISI-interner Benchmark. Zudem nutzen Evaluierungen standardisierte, einfache Setups statt modellspezifischer Harnesses wie Claude Code oder OpenCode. Epoch AIs ECI-Metrik zeigt im Vergleich einen stabileren Rückstand von nur 3–7 Monaten seit R1.

Quelle leseninterconnects.ai

Foundation Modelle Open Source Evals Benchmarks

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Open-Model-Welle: Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5 und GLM-5.1 erschienen

ToolsClaude Claude Code DeepSeek

CompaniesDeepSeek Google DeepMind

Warum es zählt

— Lumeric Redaktion

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Open-Model-Welle: Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5 und GLM-5.1 erschienen

Frag die KI zum Artikel

Verwandte Beiträge

Open-Model-Welle: Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5 und GLM-5.1 erschienen

Frag die KI zum Artikel

Verwandte Beiträge