LiquidAI veröffentlicht LFM2.5-8B-A1B: Hybrid-Modell für On-Device-Einsatz
LFM2.5-8B-A1B ist Teil der neuen LFM2.5-Modellfamilie von LiquidAI und baut auf der LFM2-Architektur auf. Das Modell kombiniert erweitertes Pre-Training mit Reinforcement Learning und ist als Hybrid-Architektur konzipiert. Der Namenszusatz „A1B" steht für lediglich 1 Milliarde aktive Parameter bei einer Gesamtgröße von 8B – ein MoE-ähnlicher Ansatz für minimalen Rechenaufwand zur Inferenzzeit. LiquidAI bewirbt das Modell als schnellstes seiner Größenklasse auf CPU und GPU. Ab Tag eins werden llama.cpp, MLX, vLLM und SGLang unterstützt; ein GGUF-Release ist auf Hugging Face verfügbar. Laut Hersteller ist das Modell für Agentic Tasks, Tool-Chaining und komplexe Instruktionsfolgen auf allen Geräteklassen ausgelegt – also auch auf Low-End-Hardware ohne dedizierte GPU.
- Architektur: Hybrid-Modell basierend auf LFM2, trainiert mit erweitertem Pre-Training + RL
- Nur 1B aktive Parameter bei 8B Gesamtparametern – sehr niedrige Inferenzlast
- Day-one-Support für llama.cpp, MLX, vLLM und SGLang
- GGUF-Version auf Hugging Face unter LiquidAI/LFM2.5-8B-A1B-GGUF verfügbar
- Zielszenarien: On-Device-Assistent, Tool-Call-Chaining, komplexe Instruktionen auf allen Geräten
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2w
Unsloth veröffentlicht MiMo-V2.5 als GGUF-Quantisierung auf Hugging Face
- LAUNCHreddit.com3w
Xiaomi MiMo v2.5 mit Sparse MoE-Architektur erhält llama.cpp-Unterstützung
- LAUNCHreddit.com1w
OpenBMB veröffentlicht BitCPM4-CANN in drei Größen: 1B, 3B und 8B
- LAUNCHreddit.com3w
ZAYA1-8B: Neues kleines Modell mit Frontier-Intelligence-Dichte
LiquidAI veröffentlicht LFM2.5-8B-A1B: Hybrid-Modell für On-Device-Einsatz
LFM2.5-8B-A1B ist Teil der neuen LFM2.5-Modellfamilie von LiquidAI und baut auf der LFM2-Architektur auf. Das Modell kombiniert erweitertes Pre-Training mit Reinforcement Learning und ist als Hybrid-Architektur konzipiert. Der Namenszusatz „A1B" steht für lediglich 1 Milliarde aktive Parameter bei einer Gesamtgröße von 8B – ein MoE-ähnlicher Ansatz für minimalen Rechenaufwand zur Inferenzzeit. LiquidAI bewirbt das Modell als schnellstes seiner Größenklasse auf CPU und GPU. Ab Tag eins werden llama.cpp, MLX, vLLM und SGLang unterstützt; ein GGUF-Release ist auf Hugging Face verfügbar. Laut Hersteller ist das Modell für Agentic Tasks, Tool-Chaining und komplexe Instruktionsfolgen auf allen Geräteklassen ausgelegt – also auch auf Low-End-Hardware ohne dedizierte GPU.
- Architektur: Hybrid-Modell basierend auf LFM2, trainiert mit erweitertem Pre-Training + RL
- Nur 1B aktive Parameter bei 8B Gesamtparametern – sehr niedrige Inferenzlast
- Day-one-Support für llama.cpp, MLX, vLLM und SGLang
- GGUF-Version auf Hugging Face unter LiquidAI/LFM2.5-8B-A1B-GGUF verfügbar
- Zielszenarien: On-Device-Assistent, Tool-Call-Chaining, komplexe Instruktionen auf allen Geräten
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2w
Unsloth veröffentlicht MiMo-V2.5 als GGUF-Quantisierung auf Hugging Face
- LAUNCHreddit.com3w
Xiaomi MiMo v2.5 mit Sparse MoE-Architektur erhält llama.cpp-Unterstützung
- LAUNCHreddit.com1w
OpenBMB veröffentlicht BitCPM4-CANN in drei Größen: 1B, 3B und 8B
- LAUNCHreddit.com3w
ZAYA1-8B: Neues kleines Modell mit Frontier-Intelligence-Dichte