Ling & Ring 2.6: MoE-Modell im Billion-Parameter-Bereich mit Flash-Variante
ToolsHugging Face
CompaniesHugging Face
Warum es zählt
Die Flash-Variante (100B) läuft als Q4-Quant auf 24/32 GB VRAM, die Mini-Vorgänger erreichten bis zu 160 t/s auf 8 GB VRAM bzw. 50–70 t/s im CPU-only-Betrieb – relevante Referenzwerte für lokale Agentic-Deployments auf Consumer-Hardware.
— Lumeric Redaktion
160 t/s
Ling-mini-2.0 IQ4_XS auf 8 GB VRAM
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Ling & Ring 2.6: MoE-Modell im Billion-Parameter-Bereich mit Flash-Variante
ToolsHugging Face
CompaniesHugging Face
Warum es zählt
Die Flash-Variante (100B) läuft als Q4-Quant auf 24/32 GB VRAM, die Mini-Vorgänger erreichten bis zu 160 t/s auf 8 GB VRAM bzw. 50–70 t/s im CPU-only-Betrieb – relevante Referenzwerte für lokale Agentic-Deployments auf Consumer-Hardware.
— Lumeric Redaktion
160 t/s
Ling-mini-2.0 IQ4_XS auf 8 GB VRAM
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.