OpenBMB testet BitCPM-CANN 1,58-Bit-Modell auf Huawei Ascend 910B

CompaniesNVIDIA

Warum es zählt

1,58-Bit-Modelle auf Nicht-NVIDIA-Hardware (Huawei Ascend 910B) zu betreiben ist relevant für alle, die an Hardware-Diversifizierung oder extremer Quantisierung arbeiten. Konkreter Mehrwert ohne Volltext jedoch begrenzt beurteilbar.

— Lumeric Redaktion

OpenBMB, das Forschungslabor hinter der CPM-Modellfamilie, testet aktuell sein BitCPM-CANN-Modell mit einer extremen 1,58-Bit-Quantisierung auf Huaweis Ascend-910B-NPU. Die 1,58-Bit-Quantisierung folgt dem BitNet-Paradigma, bei dem Gewichte auf ternäre Werte (-1, 0, +1) reduziert werden, was den Speicherbedarf drastisch senkt. Bemerkenswert ist die Wahl der Hardware: Der Huawei Ascend 910B ist ein chinesischer KI-Beschleuniger, der zunehmend als Alternative zu NVIDIA-GPUs im Einsatz ist – besonders relevant vor dem Hintergrund von Exportbeschränkungen. Die Veröffentlichung deutet auf Bestrebungen hin, Inferenz-Workloads gezielt auf Ascend-Hardware zu optimieren. Technische Details und Benchmark-Ergebnisse wurden über einen X-Post geteilt; ein vollständiger Paper- oder Modell-Release liegt auf Basis des verfügbaren Ausschnitts nicht vor.

Quelle lesenreddit.com

Foundation Modelle Inferenz Infra Chips Silizium