
Open-Model-Welle: Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5 und GLM-5.1 erschienen
Im Mai 2026 haben nahezu alle großen Open-Frontier-Labs neue Modelle veröffentlicht. Besonders auffällig: DeepSeek-V4 erscheint in zwei Varianten – Pro (1,6T-A49B MoE) und Flash (284B-13B), wobei Flash laut frühen Nutzererfahrungen das überzeugendere Modell ist. Googles Gemma 4 bringt mehrere Größen (4B, 9B, 31B dense sowie 26B-A4B MoE) und wechselt erstmals zur Apache-2.0-Lizenz. Xiaomis MiMo-V2.5-Pro (ebenfalls Apache 2.0) hält laut Benchmarks mit Kimi K2.6 und GLM-5.1 mit. Poolsides Laguna-XS.2 ist das erste öffentliche Coding-Modell des Unternehmens (33B-A3B). Das Center for AI Standards and Innovation (CAISI) hat auf Basis eines IRT-Elo-Scores über neun Benchmarks ermittelt, dass offene Modelle hinter der amerikanischen Frontier zurückbleiben – mit wachsendem Abstand. Autoren Florian Brand und Nathan Lambert kritisieren jedoch die Methodik: Benchmarks wie CTF-Archive-Diamond wurden für V4 nur auf einem Subset ausgeführt und extrapoliert; PortBench ist ein CAISI-interner Benchmark. Zudem nutzen Evaluierungen standardisierte, einfache Setups statt modellspezifischer Harnesses wie Claude Code oder OpenCode. Epoch AIs ECI-Metrik zeigt im Vergleich einen stabileren Rückstand von nur 3–7 Monaten seit R1.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- BENCHMARKthinkpol.ca3w
Kimi K2.6 schlägt Claude, GPT-5.5 und Gemini in Programmier-Challenge
- MEINUNGreddit.com2w
Open-Source-Vergleich: GLM, Kimi, MiMo und DeepSeek im Direktvergleich
- MEINUNGreddit.com3w
Leistungsvergleich: Kimi K2.6 am schnellsten, DeepSeek V4 mit MLA-Vorteil
- BENCHMARKreddit.com3w
CAISI: DeepSeek V4 stärkste Chinas, aber 8 Monate hinter US-Frontier

Open-Model-Welle: Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5 und GLM-5.1 erschienen
Im Mai 2026 haben nahezu alle großen Open-Frontier-Labs neue Modelle veröffentlicht. Besonders auffällig: DeepSeek-V4 erscheint in zwei Varianten – Pro (1,6T-A49B MoE) und Flash (284B-13B), wobei Flash laut frühen Nutzererfahrungen das überzeugendere Modell ist. Googles Gemma 4 bringt mehrere Größen (4B, 9B, 31B dense sowie 26B-A4B MoE) und wechselt erstmals zur Apache-2.0-Lizenz. Xiaomis MiMo-V2.5-Pro (ebenfalls Apache 2.0) hält laut Benchmarks mit Kimi K2.6 und GLM-5.1 mit. Poolsides Laguna-XS.2 ist das erste öffentliche Coding-Modell des Unternehmens (33B-A3B). Das Center for AI Standards and Innovation (CAISI) hat auf Basis eines IRT-Elo-Scores über neun Benchmarks ermittelt, dass offene Modelle hinter der amerikanischen Frontier zurückbleiben – mit wachsendem Abstand. Autoren Florian Brand und Nathan Lambert kritisieren jedoch die Methodik: Benchmarks wie CTF-Archive-Diamond wurden für V4 nur auf einem Subset ausgeführt und extrapoliert; PortBench ist ein CAISI-interner Benchmark. Zudem nutzen Evaluierungen standardisierte, einfache Setups statt modellspezifischer Harnesses wie Claude Code oder OpenCode. Epoch AIs ECI-Metrik zeigt im Vergleich einen stabileren Rückstand von nur 3–7 Monaten seit R1.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- BENCHMARKthinkpol.ca3w
Kimi K2.6 schlägt Claude, GPT-5.5 und Gemini in Programmier-Challenge
- MEINUNGreddit.com2w
Open-Source-Vergleich: GLM, Kimi, MiMo und DeepSeek im Direktvergleich
- MEINUNGreddit.com3w
Leistungsvergleich: Kimi K2.6 am schnellsten, DeepSeek V4 mit MLA-Vorteil
- BENCHMARKreddit.com3w
CAISI: DeepSeek V4 stärkste Chinas, aber 8 Monate hinter US-Frontier