Dual-GPU-Setup mit 48 GB VRAM: llama.cpp-Server via Vulkan auf AMD R9700 AI PRO + 7800XT

CompaniesAMD

Warum es zählt

Vulkan als Backend ermöglicht llama.cpp-Inferenz über gemischte AMD-GPU-Generationen hinweg, wo ROCm versagt – relevant für alle, die RDNA3- und RDNA4-Karten kombinieren wollen.

— Lumeric Redaktion

Der Reddit-Nutzer /u/Jorlen berichtet, wie er unter Kubuntu 24.04 einen llama.cpp-Inferenzserver mit zwei AMD-GPUs – einer R9700 AI PRO (32 GB VRAM, RDNA4) und einer RX 7800XT (16 GB VRAM, RDNA3) – zum Laufen gebracht hat. Zusammen stehen ihm damit 48 GB VRAM für lokale Modelle zur Verfügung. Der ursprüngliche Versuch mit ROCm scheiterte, da das AMD-Backend die Kombination aus RDNA4- und RDNA3-Architektur nicht unterstützte. Als Lösung kam das Vulkan-Backend von llama.cpp zum Einsatz, das über ein Docker-Image eingerichtet wurde. Das Setup läuft stabil genug für erste Prompts. Die Gesamtinvestition umfasste ein neues Netzteil für rund 300 USD, um die zweite GPU sicher betreiben zu können. Der Beitrag zeigt praxisnah, dass Vulkan eine realistische Alternative zu ROCm sein kann, wenn heterogene AMD-GPU-Kombinationen oder fehlende ROCm-Unterstützung ein Problem darstellen.

Was wir noch wissen

Setup: Kubuntu 24.04, Docker, Vulkan-Image für llama.cpp-Server
GPUs: AMD R9700 AI PRO (32 GB, RDNA4) + RX 7800XT (16 GB, RDNA3) = 48 GB VRAM gesamt
ROCm funktionierte nicht mit der RDNA4+RDNA3-Mischkonfiguration
Zusatzkosten: neues Netzteil für ca. 300 USD nötig
Erster Quick-Prompt-Test erfolgreich; Langzeitstabilität noch unbewiesen

Quelle lesenreddit.com

Inferenz Infra Open Source

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Dual-GPU-Setup mit 48 GB VRAM: llama.cpp-Server via Vulkan auf AMD R9700 AI PRO + 7800XT

ToolsLlama

CompaniesAMD

Warum es zählt

Vulkan als Backend ermöglicht llama.cpp-Inferenz über gemischte AMD-GPU-Generationen hinweg, wo ROCm versagt – relevant für alle, die RDNA3- und RDNA4-Karten kombinieren wollen.

— Lumeric Redaktion

Was wir noch wissen

Setup: Kubuntu 24.04, Docker, Vulkan-Image für llama.cpp-Server
GPUs: AMD R9700 AI PRO (32 GB, RDNA4) + RX 7800XT (16 GB, RDNA3) = 48 GB VRAM gesamt
ROCm funktionierte nicht mit der RDNA4+RDNA3-Mischkonfiguration
Zusatzkosten: neues Netzteil für ca. 300 USD nötig
Erster Quick-Prompt-Test erfolgreich; Langzeitstabilität noch unbewiesen

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Dual-GPU-Setup mit 48 GB VRAM: llama.cpp-Server via Vulkan auf AMD R9700 AI PRO + 7800XT

Frag die KI zum Artikel

Verwandte Beiträge

Dual-GPU-Setup mit 48 GB VRAM: llama.cpp-Server via Vulkan auf AMD R9700 AI PRO + 7800XT

Frag die KI zum Artikel

Verwandte Beiträge