openPangu-2.0-Flash: 92B MoE-Modell mit 512k Kontext auf Ascend trainiert
Warum es zählt
Das Modell bietet einen sehr langen Kontext (512k) bei niedrigen Aktivierungskosten (6B aktive Params) und wurde auf Huawei Ascend trainiert – relevant für Teams, die Alternativen zur NVIDIA-GPU-Infrastruktur evaluieren. Weights sind noch nicht auf Hugging Face verfügbar, nur über GitCode abrufbar.
— Lumeric Redaktion
92B / 6B aktiv
MoE-Parameter gesamt / aktiviert
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com1w
Poolside veröffentlicht Laguna M.1: 225B-MoE-Modell für Agentic Coding
- LAUNCHreddit.com2w
Huawei stellt openPangu 2.0 vor: 505B-Parameter-MoE, Open-Source ab 30. Juni
- LAUNCHreddit.com2w
MiniMax veröffentlicht MiniMax-M3 mit 428B Parametern auf Hugging Face
- LAUNCHreddit.com3d
Community-Finetuning: LiquidAI LFM2.5-230M auf Coding-Traces als GGUF
openPangu-2.0-Flash: 92B MoE-Modell mit 512k Kontext auf Ascend trainiert
Warum es zählt
Das Modell bietet einen sehr langen Kontext (512k) bei niedrigen Aktivierungskosten (6B aktive Params) und wurde auf Huawei Ascend trainiert – relevant für Teams, die Alternativen zur NVIDIA-GPU-Infrastruktur evaluieren. Weights sind noch nicht auf Hugging Face verfügbar, nur über GitCode abrufbar.
— Lumeric Redaktion
92B / 6B aktiv
MoE-Parameter gesamt / aktiviert
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com1w
Poolside veröffentlicht Laguna M.1: 225B-MoE-Modell für Agentic Coding
- LAUNCHreddit.com2w
Huawei stellt openPangu 2.0 vor: 505B-Parameter-MoE, Open-Source ab 30. Juni
- LAUNCHreddit.com2w
MiniMax veröffentlicht MiniMax-M3 mit 428B Parametern auf Hugging Face
- LAUNCHreddit.com3d
Community-Finetuning: LiquidAI LFM2.5-230M auf Coding-Traces als GGUF