NVIDIA
GPU-Hersteller. Marktführer für AI-Training-Hardware.
NVIDIA: Vera Rubin NVL72, NVFP4-Releases und geopolitisches Ringen um China-Zugang
NVIDIA hält seine dominante Stellung als führender Anbieter von KI-Trainingshardware, steht jedoch unter wachsendem Druck von mehreren Seiten. Cerebras ist mit einer 56,4-Mrd.-Dollar-Bewertung an die Börse gegangen und positioniert sich explizit als Inferenz-Chip-Konkurrent. Im Consumer-Segment zeigen Benchmarks, dass der DGX Spark unter llama.cpp bei bestimmten Workloads hinter AMD-basierten Ryzen-AI-Max-Systemen zurückbleibt — ein Hinweis auf Optimierungslücken ausserhalb des Datacenter-Kontexts.
Im strategisch wichtigen China-Markt bleibt die Lage ungelöst: US-Genehmigungen für H200-Verkäufe liegen vor, doch Peking blockiert die Abnahme durch chinesische Konzerne. Jensen Huang nahm am Trump-Xi-Gipfel in Peking teil — ein Signal, dass NVIDIA aktiv an einer Normalisierung des China-Geschäfts arbeitet. Der Marktanteil im Datacenter-Bereich bleibt vorerst unangefochten, doch die mittelfristige Nachfragestruktur für agentische Inferenz-Workloads stellt laut Stratechery-Analyse etablierte GPU-Modelle vor neue Fragen.
Vera Rubin NVL72 für agentische Workloads lanciert. Mit dem NVIDIA Vera Rubin NVL72 adressiert NVIDIA direkt das Skalierungsproblem nicht-deterministischer Inferenz-Lasten in Agenten-Systemen. Die Architektur ist explizit auf dynamische, schwer planbare Inferenz-Trajektorien ausgelegt — eine Reaktion auf die sich verschiebende Workload-Struktur weg von Batch-Training hin zu agentischer Laufzeit-Inferenz.
NVFP4-Quantisierungen für Kimi-Modelle veröffentlicht. NVIDIA hat NVFP4-Quantisierungen von Kimi-K2.6 und Kimi-K2.5 publiziert und damit sein NVFP4-Ökosystem auf externe MoE-Modelle ausgedehnt. Die Benchmark-Parität — z.B. GPQA Diamond 90,4 vs. 90,9 gegenüber INT4-Baseline — belegt die Praxistauglichkeit des Formats. Parallel publizierte NVIDIA-Forschung validiert 4-Bit-Pretraining mit NVFP4 auf einem 12B-Hybrid-Mamba-Transformer mit praktisch identischer MMLU-Pro-Performance gegenüber FP8.
Geopolitik: China-Geschäft zwischen Genehmigung und Blockade. Während die USA H200-Exporte für chinesische Abnehmer freigegeben haben, blockiert Peking die Abnahme aus industriepolitischen Gründen. Jensen Huangs Teilnahme am Trump-Xi-Gipfel in Peking deutet auf diplomatisches Engagement hin, ein wieder geöffnetes China-Geschäft bleibt jedoch ungewiss.
RTX-5090-Preise steigen weiter. Während sich die Preise anderer NVIDIA- und AMD-Karten normalisieren, zeigt ein 50-tägiges EU-PreisTracking, dass die RTX 5090 als einzige GPU-Klasse weiter teurer wird — getrieben durch KI- und Workstation-Nachfrage sowie gestiegene GDDR7-Kosten. Ein Gerücht über eine bevorstehende Preiserhöhung seitens NVIDIA verstärkt den Druck auf Käufer im Consumer-Hochpreissegment.
Was zu erwarten
Die Aufnahme von NVFP4 in den Pretraining-Stack deutet auf eine weitere Verbreitung des Formats bei Drittmodellen hin — weitere Releases analog zu Kimi-K2 sind wahrscheinlich, ohne dass konkrete Ankündigungen vorliegen. Die Vera-Rubin-NVL72-Plattform steht am Markt; wie schnell Hyperscaler und Enterprise-Kunden tatsächlich migrieren, bleibt offen. Im geopolitischen Kontext hängt viel vom Ausgang der diplomatischen Kontakte rund um den Peking-Gipfel ab — eine Lockerung der chinesischen Selbstblockade bei H200-Käufen würde NVIDIAs Quartalszahlen spürbar beeinflussen. Ob der Luce-Megakernel mit seinem 1,8-fachen Speed-up auf NVIDIA-GPUs Eingang in llama.cpp findet, ist laut Quell-Post noch ungeklärt.
Top-Tools rund um NVIDIA
Auch erwähnt: weitere Unternehmen
Archiv
Letzte 7 Tage · 51 Beiträge
- MEINUNGheuteFine-Tuning von Jina-v5 auf slowakischem Rechtskorpus scheitert an AmbiguitätDas Beispiel zeigt eine strukturelle Schwäche von Embedding-Fine-Tuning mit LLM-generierten Trainingsdaten: Selbst korrekt gelabelte MarginMSE-Tripel aus Qwen-3.5-Distillation können domänenspezifische Kontextambiguität nicht zuverlässig auflösen – relevant für alle, die Retrieval-Adapter für Fachrechts-RAG trainieren.
- MEINUNGheuteWestern Open-Weight SOTA: Gemma4-31B und Nemotron3-Super-120B führen das Feld anFür AI-Builder bedeutet das, dass die stärksten Open-Weight-Alternativen zunehmend aus China kommen – westliche Optionen wie Gemma4-31B und Nemotron3-Super-120B markieren aktuell die Obergrenze, ohne Meta als ernsthaften Konkurrenten im Rennen.
- FUNDING