Blackwell RTX Pro 5000: GSP-Timeout in VFIO-Passthrough ohne Host-Reboot nicht behebbar
Ein Reddit-Nutzer (u/Prestigious-Pop-3735) beschreibt ein reproduzierbares Problem mit der NVIDIA RTX Pro 5000 (Blackwell, PCI ID: 10de:2bb3) im KVM/QEMU-VFIO-Passthrough unter Ubuntu 24.04 LTS mit Treiber 580.105.08. Tritt ein GSP-Heartbeat-Timeout während der Initialisierung oder eines Treiber-Neulades auf, bleibt das WPR2-Flag gesetzt, und der Treiber verweigert den Neustart mit dem Fehler „unexpected WPR2 already up, cannot proceed with booting GSP". Alle üblichen Software-seitigen Recovery-Methoden — Secondary Bus Reset (SBR) auf dem Upstream-Bridge, erzwungener D3cold-Zustand über Root-Port-Power-Management, Driver-Unbind/Rebind sowie nvidia-smi -r — scheitern vollständig. Die Karte fällt beim SBR sogar ganz vom PCIe-Bus (Probe Error -1) und MSI bleibt aktiv. Vergleichbare Probleme sind in mehreren Issues des open-gpu-kernel-modules-Repos dokumentiert (#965, #1080, #1120), wo einzelne Nutzer mit Consumer-Karten Erfolg hatten — nicht jedoch mit dem Pro-5000-Modell. Der Poster sucht Erfahrungsberichte zu Firmware-Einstellungen, Kernel-Parametern oder PCIe-Quirks, die einen Reboot vermeiden.
- NVIDIA RTX Pro 5000 (Blackwell, PCI ID: 10de:2bb3) mit Open-Kernel-Modul-Treiber 580.105.08 betroffen.
- Fehlermeldung: 'NV_ERR_TIMEOUT' + 'unexpected WPR2 already up' — GPU gilt danach als 'bad state'.
- Secondary Bus Reset degradiert PCIe-Link und wirft Karte vom Bus (Probe Error -1), kein Recovery.
- D3cold via Root-Port-Power-Management flusht WPR2-Region nicht — Karte bleibt tot.
- Ähnliche Issues im open-gpu-kernel-modules-Repo: #965, #1080, #1120 — dort teils Erfolg mit Consumer-GPUs.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Blackwell RTX Pro 5000: GSP-Timeout in VFIO-Passthrough ohne Host-Reboot nicht behebbar
Ein Reddit-Nutzer (u/Prestigious-Pop-3735) beschreibt ein reproduzierbares Problem mit der NVIDIA RTX Pro 5000 (Blackwell, PCI ID: 10de:2bb3) im KVM/QEMU-VFIO-Passthrough unter Ubuntu 24.04 LTS mit Treiber 580.105.08. Tritt ein GSP-Heartbeat-Timeout während der Initialisierung oder eines Treiber-Neulades auf, bleibt das WPR2-Flag gesetzt, und der Treiber verweigert den Neustart mit dem Fehler „unexpected WPR2 already up, cannot proceed with booting GSP". Alle üblichen Software-seitigen Recovery-Methoden — Secondary Bus Reset (SBR) auf dem Upstream-Bridge, erzwungener D3cold-Zustand über Root-Port-Power-Management, Driver-Unbind/Rebind sowie nvidia-smi -r — scheitern vollständig. Die Karte fällt beim SBR sogar ganz vom PCIe-Bus (Probe Error -1) und MSI bleibt aktiv. Vergleichbare Probleme sind in mehreren Issues des open-gpu-kernel-modules-Repos dokumentiert (#965, #1080, #1120), wo einzelne Nutzer mit Consumer-Karten Erfolg hatten — nicht jedoch mit dem Pro-5000-Modell. Der Poster sucht Erfahrungsberichte zu Firmware-Einstellungen, Kernel-Parametern oder PCIe-Quirks, die einen Reboot vermeiden.
- NVIDIA RTX Pro 5000 (Blackwell, PCI ID: 10de:2bb3) mit Open-Kernel-Modul-Treiber 580.105.08 betroffen.
- Fehlermeldung: 'NV_ERR_TIMEOUT' + 'unexpected WPR2 already up' — GPU gilt danach als 'bad state'.
- Secondary Bus Reset degradiert PCIe-Link und wirft Karte vom Bus (Probe Error -1), kein Recovery.
- D3cold via Root-Port-Power-Management flusht WPR2-Region nicht — Karte bleibt tot.
- Ähnliche Issues im open-gpu-kernel-modules-Repo: #965, #1080, #1120 — dort teils Erfolg mit Consumer-GPUs.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.