Windows-Tipp: Memory Compression deaktivieren für flüssige Local-LLM-Inferenz
Ein Nutzer im r/LocalLLaMA-Subreddit berichtet von anhaltenden Performance-Problemen beim Betrieb lokaler KI-Modelle unter Windows 11 mit einer AMD-GPU. Das Problem äußerte sich darin, dass die Inferenzgeschwindigkeit massiv einbrach, sobald andere Anwendungen – etwa Spiele – geöffnet oder geschlossen wurden. Die Lösung: Das Deaktivieren der Windows-Speicherkomprimierung über einen einzigen PowerShell-Befehl mit Administratorrechten (`Disable-MMAgent -mc`). Windows komprimiert im RAM gehaltene Daten automatisch, um scheinbar mehr Speicher bereitzustellen – dieser Prozess konkurriert jedoch mit den speicherintensiven Operationen lokaler Sprachmodelle und erzeugt CPU-Bottlenecks. Nach dem Deaktivieren liefen sowohl Spiele als auch die KI-Inferenz laut Bericht ohne gegenseitige Beeinträchtigung. Der Beitrag ist ein Follow-up zu einem früheren Post desselben Nutzers, der das Problem zunächst als AMD-spezifischen Bug eingestuft hatte.
- Befehl zum Deaktivieren: `Disable-MMAgent -mc` im Admin-Terminal (PowerShell)
- Problem trat unter Windows 11 mit AMD-GPU auf, auch nach dem Schließen von Spielen
- Windows Memory Compression komprimiert RAM-Inhalte und konkurriert dabei mit LLM-Workloads
- Lösung wurde als Follow-up zu einem früheren r/LocalLLaMA-Post veröffentlicht
- Nutzer /u/soyalemujica berichtet: alle Probleme nach dem Eingriff vollständig behoben
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Windows-Tipp: Memory Compression deaktivieren für flüssige Local-LLM-Inferenz
Ein Nutzer im r/LocalLLaMA-Subreddit berichtet von anhaltenden Performance-Problemen beim Betrieb lokaler KI-Modelle unter Windows 11 mit einer AMD-GPU. Das Problem äußerte sich darin, dass die Inferenzgeschwindigkeit massiv einbrach, sobald andere Anwendungen – etwa Spiele – geöffnet oder geschlossen wurden. Die Lösung: Das Deaktivieren der Windows-Speicherkomprimierung über einen einzigen PowerShell-Befehl mit Administratorrechten (`Disable-MMAgent -mc`). Windows komprimiert im RAM gehaltene Daten automatisch, um scheinbar mehr Speicher bereitzustellen – dieser Prozess konkurriert jedoch mit den speicherintensiven Operationen lokaler Sprachmodelle und erzeugt CPU-Bottlenecks. Nach dem Deaktivieren liefen sowohl Spiele als auch die KI-Inferenz laut Bericht ohne gegenseitige Beeinträchtigung. Der Beitrag ist ein Follow-up zu einem früheren Post desselben Nutzers, der das Problem zunächst als AMD-spezifischen Bug eingestuft hatte.
- Befehl zum Deaktivieren: `Disable-MMAgent -mc` im Admin-Terminal (PowerShell)
- Problem trat unter Windows 11 mit AMD-GPU auf, auch nach dem Schließen von Spielen
- Windows Memory Compression komprimiert RAM-Inhalte und konkurriert dabei mit LLM-Workloads
- Lösung wurde als Follow-up zu einem früheren r/LocalLLaMA-Post veröffentlicht
- Nutzer /u/soyalemujica berichtet: alle Probleme nach dem Eingriff vollständig behoben
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.