llama.cpp: Audio-Input für Nemotron 3 Nano Omni nicht funktionsfähig
Ein Reddit-Nutzer meldet, dass llama-server (llama.cpp) beim Einsatz von Nemotron 3 Nano Omni – in der Unsloth-Variante – weder Audio- noch Video-Input akzeptiert. Die entsprechende Schaltfläche im WebUI ist ausgegraut. Bilder hingegen werden weiterhin korrekt verarbeitet. Als Vergleich dient Gemma4-e4b, bei dem Audio-Input im selben Setup problemlos funktioniert, was darauf hindeutet, dass das Problem modellspezifisch ist und nicht am Framework selbst liegt. Der Nutzer hat sowohl die llama.cpp-Version als auch das Modell neu heruntergeladen und den mmproj korrekt geladen. Unklar ist, ob es sich um ein bekanntes Kompatibilitätsproblem im llama.cpp-Backend handelt oder ob die GGUF-Konvertierung von Nemotron Omni (Unsloth) fehlende Multimodal-Metadaten für Audio/Video enthält. Eine offizielle Stellungnahme oder ein Issue-Tracker-Eintrag wird im Beitrag nicht genannt.
- Audio- und Video-Input-Option im llama-server WebUI ist für Nemotron 3 Nano Omni ausgegraut
- Bild-Input funktioniert mit demselben Modell und Setup weiterhin korrekt
- Gemma4-e4b zeigt Audio-Input im gleichen llama.cpp-Build ohne Probleme
- Nutzer verwendet Unsloth-Variante von Nemotron 3 Nano Omni mit geladenem mmproj
- Unklar, ob das Problem in llama.cpp oder in der Modell-Konvertierung liegt
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
llama.cpp: Audio-Input für Nemotron 3 Nano Omni nicht funktionsfähig
Ein Reddit-Nutzer meldet, dass llama-server (llama.cpp) beim Einsatz von Nemotron 3 Nano Omni – in der Unsloth-Variante – weder Audio- noch Video-Input akzeptiert. Die entsprechende Schaltfläche im WebUI ist ausgegraut. Bilder hingegen werden weiterhin korrekt verarbeitet. Als Vergleich dient Gemma4-e4b, bei dem Audio-Input im selben Setup problemlos funktioniert, was darauf hindeutet, dass das Problem modellspezifisch ist und nicht am Framework selbst liegt. Der Nutzer hat sowohl die llama.cpp-Version als auch das Modell neu heruntergeladen und den mmproj korrekt geladen. Unklar ist, ob es sich um ein bekanntes Kompatibilitätsproblem im llama.cpp-Backend handelt oder ob die GGUF-Konvertierung von Nemotron Omni (Unsloth) fehlende Multimodal-Metadaten für Audio/Video enthält. Eine offizielle Stellungnahme oder ein Issue-Tracker-Eintrag wird im Beitrag nicht genannt.
- Audio- und Video-Input-Option im llama-server WebUI ist für Nemotron 3 Nano Omni ausgegraut
- Bild-Input funktioniert mit demselben Modell und Setup weiterhin korrekt
- Gemma4-e4b zeigt Audio-Input im gleichen llama.cpp-Build ohne Probleme
- Nutzer verwendet Unsloth-Variante von Nemotron 3 Nano Omni mit geladenem mmproj
- Unklar, ob das Problem in llama.cpp oder in der Modell-Konvertierung liegt
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.