LiquidAI veröffentlicht LFM2.5-8B-A1B: Hybrid-Modell für On-Device-Einsatz

Warum es zählt

Mit nur 1B aktiven Parametern bei 8B Gesamtgröße läuft das Modell laut LiquidAI auf schwacher Hardware und übertrifft dabei größere Dense- und MoE-Modelle bei Instruction-Following – relevant für alle, die lokale Agenten-Pipelines auf Consumer-Geräten betreiben wollen.

— Lumeric Redaktion

LFM2.5-8B-A1B ist Teil der neuen LFM2.5-Modellfamilie von LiquidAI und baut auf der LFM2-Architektur auf. Das Modell kombiniert erweitertes Pre-Training mit Reinforcement Learning und ist als Hybrid-Architektur konzipiert. Der Namenszusatz „A1B" steht für lediglich 1 Milliarde aktive Parameter bei einer Gesamtgröße von 8B – ein MoE-ähnlicher Ansatz für minimalen Rechenaufwand zur Inferenzzeit. LiquidAI bewirbt das Modell als schnellstes seiner Größenklasse auf CPU und GPU. Ab Tag eins werden llama.cpp, MLX, vLLM und SGLang unterstützt; ein GGUF-Release ist auf Hugging Face verfügbar. Laut Hersteller ist das Modell für Agentic Tasks, Tool-Chaining und komplexe Instruktionsfolgen auf allen Geräteklassen ausgelegt – also auch auf Low-End-Hardware ohne dedizierte GPU.

Was wir noch wissen

Architektur: Hybrid-Modell basierend auf LFM2, trainiert mit erweitertem Pre-Training + RL
Nur 1B aktive Parameter bei 8B Gesamtparametern – sehr niedrige Inferenzlast
Day-one-Support für llama.cpp, MLX, vLLM und SGLang
GGUF-Version auf Hugging Face unter LiquidAI/LFM2.5-8B-A1B-GGUF verfügbar
Zielszenarien: On-Device-Assistent, Tool-Call-Chaining, komplexe Instruktionen auf allen Geräten

Quelle lesenreddit.com

Foundation Modelle Inferenz Infra Agents

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

LiquidAI veröffentlicht LFM2.5-8B-A1B: Hybrid-Modell für On-Device-Einsatz

ToolsLlama Hugging Face

CompaniesHugging Face

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Architektur: Hybrid-Modell basierend auf LFM2, trainiert mit erweitertem Pre-Training + RL
Nur 1B aktive Parameter bei 8B Gesamtparametern – sehr niedrige Inferenzlast
Day-one-Support für llama.cpp, MLX, vLLM und SGLang
GGUF-Version auf Hugging Face unter LiquidAI/LFM2.5-8B-A1B-GGUF verfügbar
Zielszenarien: On-Device-Assistent, Tool-Call-Chaining, komplexe Instruktionen auf allen Geräten

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

LiquidAI veröffentlicht LFM2.5-8B-A1B: Hybrid-Modell für On-Device-Einsatz

Frag die KI zum Artikel

Verwandte Beiträge

LiquidAI veröffentlicht LFM2.5-8B-A1B: Hybrid-Modell für On-Device-Einsatz

Frag die KI zum Artikel

Verwandte Beiträge