wird geladen

openPangu-2.0-Flash: 92B MoE-Modell mit 512k Kontext auf Ascend trainiert · Lumeric

Feed
Digest
Lounge
Stash
Profil

Beitrag

LAUNCH

reddit.com· r/LocalLLaMA3h

openPangu-2.0-Flash: 92B MoE-Modell mit 512k Kontext auf Ascend trainiert

ToolsNVIDIA Hardware Hugging Face

CompaniesHugging Face NVIDIA

Warum es zählt

Das Modell bietet einen sehr langen Kontext (512k) bei niedrigen Aktivierungskosten (6B aktive Params) und wurde auf Huawei Ascend trainiert – relevant für Teams, die Alternativen zur NVIDIA-GPU-Infrastruktur evaluieren. Weights sind noch nicht auf Hugging Face verfügbar, nur über GitCode abrufbar.

— Lumeric Redaktion

Quelle lesenreddit.com

92B / 6B aktiv

MoE-Parameter gesamt / aktiviert

Foundation Modelle Open Source Inferenz Infra

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Verwandte Beiträge

LAUNCHreddit.com1w
Poolside veröffentlicht Laguna M.1: 225B-MoE-Modell für Agentic Coding
LAUNCHreddit.com2w
Huawei stellt openPangu 2.0 vor: 505B-Parameter-MoE, Open-Source ab 30. Juni
LAUNCHreddit.com2w
MiniMax veröffentlicht MiniMax-M3 mit 428B Parametern auf Hugging Face
LAUNCHreddit.com3d
Community-Finetuning: LiquidAI LFM2.5-230M auf Coding-Traces als GGUF

LAUNCH

reddit.com· r/LocalLLaMA3h

openPangu-2.0-Flash: 92B MoE-Modell mit 512k Kontext auf Ascend trainiert

ToolsNVIDIA Hardware Hugging Face

CompaniesHugging Face NVIDIA

Warum es zählt

Das Modell bietet einen sehr langen Kontext (512k) bei niedrigen Aktivierungskosten (6B aktive Params) und wurde auf Huawei Ascend trainiert – relevant für Teams, die Alternativen zur NVIDIA-GPU-Infrastruktur evaluieren. Weights sind noch nicht auf Hugging Face verfügbar, nur über GitCode abrufbar.

— Lumeric Redaktion

92B / 6B aktiv

MoE-Parameter gesamt / aktiviert

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Quelle lesenreddit.com

Themen

Foundation Modelle Open Source Inferenz Infra

Reaktion

Speichern

Verwandte Beiträge

LAUNCHreddit.com1w
Poolside veröffentlicht Laguna M.1: 225B-MoE-Modell für Agentic Coding
LAUNCHreddit.com2w
Huawei stellt openPangu 2.0 vor: 505B-Parameter-MoE, Open-Source ab 30. Juni
LAUNCHreddit.com2w
MiniMax veröffentlicht MiniMax-M3 mit 428B Parametern auf Hugging Face
LAUNCHreddit.com3d
Community-Finetuning: LiquidAI LFM2.5-230M auf Coding-Traces als GGUF