
NVIDIA launcht Ising Open Models für Quanten-Kalibrierung und Fehlerkorrektur
NVIDIA stellt die Open-Model-Familie „NVIDIA Ising" vor, die speziell für Quantenprozessor-Kalibrierung und Quantenfehlerkorrektur entwickelt wurde und zwei zentrale Skalierungshindernisse aktueller Quantensysteme adressiert.

Nvidia investiert 150 Mrd. USD jährlich in Taiwan als KI-Epizentrum
Nvidia-CEO Jensen Huang kündigt Investitionen von 150 Milliarden USD pro Jahr in Taiwan an und plant dort eine neue Konzernzentrale – als Kontrapunkt zu Trumps Strategie, die USA zum globalen KI-Hub zu machen.

NVIDIA veröffentlicht Polar: Token-treues Rollout-Framework für GRPO-Training
NVIDIA stellt Polar vor, ein Rollout-Framework für RL-Training von Sprachagenten, das ohne Änderungen an bestehenden Agent-Harnesses auskommt. Mit GRPO auf Qwen3.5-4B verbessert Polar den SWE-Bench-Verified-pass@1-Score je nach Harness um bis zu 22,6 Punkte.
Nvidia streicht Gaming-Umsatzkategorie aus Finanzberichten
Nvidia entfernt die separate Kategorie „Gaming" aus seiner Finanzberichterstattung – ein Zeichen für den strukturellen Wandel des Unternehmens hin zum KI- und Rechenzentrumsgeschäft.

Jensen Huang: Vera-CPU erschließt Nvidia neuen 200-Milliarden-Dollar-Markt
Nvidia-CEO Jensen Huang sieht im neuen Vera-CPU einen Einstieg in einen bislang unerschlossenen 200-Mrd.-Dollar-Markt für agentische KI. Bereits jetzt sollen standalone Vera-CPUs im Wert von 20 Mrd. Dollar verkauft worden sein.
llama.cpp Build 9254 bringt PDL-Optimierung für NVIDIA-GPUs und behebt TG-Regression
Build 9254 von llama.cpp behebt eine Token-Generation-Regression der letzten Builds und führt Programmatic Dependent Launch (PDL) für NVIDIA-GPUs ab Compute Capability 90 ein.

Nvidia meldet Rekordquartal: 81,6 Mrd. USD Umsatz und 43 Mrd. USD Startup-Beteiligungen
Nvidia erzielte im Quartal bis April 2026 einen Rekordumsatz von 81,6 Mrd. USD (+20% zum Vorquartal), davon 75,2 Mrd. im Rechenzentrumsgeschäft. Überraschend: Die privaten Startup-Beteiligungen verdoppelten sich auf 43 Mrd. USD.

Googles SynthID-Wasserzeichen kommt zu OpenAI, Nvidia, ElevenLabs und Kakao
Google weitet sein KI-Wasserzeichen SynthID auf Partner aus: OpenAI nutzt es für GPT-2-Bilder, Nvidia für Cosmos-Modelle, ElevenLabs und Kakao für Audio- und Bild-Inhalte. Bisher wurden 100 Milliarden Bilder und Videos sowie 60.000 Jahre Audio mit SynthID markiert.
NVIDIA veröffentlicht NVFP4-Quantisierungen von Kimi-K2.6 und Kimi-K2.5
NVIDIA hat quantisierte NVFP4-Versionen von Moonshot AIs Kimi-K2.6 und Kimi-K2.5 auf HuggingFace veröffentlicht. Die Modelle wurden mit NVIDIAs Model Optimizer quantisiert und sind für kommerzielle wie nicht-kommerzielle Nutzung freigegeben.
NVIDIA setzt Codex mit GPT-5.5 unternehmensweit ein – 10× schnellere ML-Workflows
NVIDIA gibt 40.000 Mitarbeitenden Zugang zu Codex auf Basis von GPT-5.5 und erzielt laut eigenen Angaben eine zehnfache Beschleunigung in End-to-End-Forschungsworkflows.
TensorRT-LLM vs. vLLM vs. llama.cpp auf NVIDIA DGX Spark: Community-Diskussion
Ein Reddit-Nutzer fragt die LocalLLaMA-Community nach Empfehlungen für den besten Inferenz-Stack auf dem NVIDIA DGX Spark – zur Wahl stehen TensorRT-LLM, vLLM und llama.cpp.

Sakana AI & NVIDIA: TwELL beschleunigt LLM-Inferenz um 20,5 % und Training um 21,9 %
Sakana AI und NVIDIA stellen TwELL vor – eine Methode, die mittels L1-Regularisierung über 99 % Sparsity in Feedforward-Schichten erzeugt und diese mit neuen CUDA-Kerneln in echte GPU-Durchsatzgewinne übersetzt.

Nvidia investiert 2026 bereits über 40 Mrd. USD in KI-Beteiligungen
Nvidia hat in den ersten Monaten 2026 mehr als 40 Mrd. USD in KI-Beteiligungen committet – darunter 30 Mrd. USD allein für OpenAI sowie Deals mit Corning (3,2 Mrd.) und IREN (2,1 Mrd.).

Nvidia steigert jährliche Taiwan-Ausgaben von 15 auf 150 Milliarden Dollar
Nvidia gibt mittlerweile bis zu 150 Milliarden Dollar jährlich bei taiwanesischen Zulieferern wie TSMC aus – ein Zehnfaches gegenüber früheren 15 Milliarden Dollar, angetrieben durch den KI-Boom.
NVIDIA CUDA 13.3 veröffentlicht
NVIDIA hat CUDA 13.3 released. In der LocalLLaMA-Community wird bereits diskutiert, ob llama.cpp mit der neuen Version kompatibel ist.

FedAvg vs. FedProx auf Non-IID CIFAR-10 mit NVIDIA FLARE verglichen
Ein Tutorial zeigt Schritt für Schritt, wie FedAvg und FedProx im Federated Learning auf einem non-IID CIFAR-10-Datensatz mit NVIDIA FLARE aufgebaut und verglichen werden. Die Datenverteilung simuliert realistische Label-Ungleichgewichte via Dirichlet-Verteilung.
NVIDIA Jetson AGX Orin 64GB als lokale LLM-Plattform: Use-Cases gesucht
Ein Reddit-Nutzer fragt nach sinnvollen Einsatzmöglichkeiten für zwei NVIDIA Jetson AGX Orin 64GB aus ausgemusterter Hardware – mit 205 GB/s Speicherbandbreite und ~55 GB nutzbarem Unified Memory.
Qwen3.6-35B-A3B-FP8 mit Hermes Agent auf NVIDIA DGX Spark via vLLM
Ein Reddit-Nutzer teilt seine vLLM-Konfiguration für Qwen3.6-35B-A3B-FP8 mit Hermes Agent auf einem einzelnen NVIDIA DGX Spark und bittet die Community um Feedback.