llama.cpp UI: Thinking-Mode-Toggle mit Reasoning-Effort-Stufen
Pull Request #23434 im ggml-org/llama.cpp-Repository führt einen Thinking-Mode-Toggle in die Chat-UI ein. Nutzer können damit Schritt-für-Schritt-Reasoning für unterstützte Modelle direkt im Interface ein- und ausschalten oder auf bestimmte Effort-Stufen begrenzen. Ergänzend werden Verbesserungen an der „Chat Form Add Action"-UI mitgeliefert. Der PR wurde von Contributor allozaur eingereicht und von /u/jacek2023 auf r/LocalLLaMA vorgestellt, inklusive Demo-Video. Das Feature richtet sich an Nutzer, die Thinking-fähige Modelle (z. B. QwQ, DeepSeek-R1 oder ähnliche) lokal über llama.cpp betreiben und den Compute-Aufwand situativ anpassen möchten.
- PR #23434 von Contributor allozaur im ggml-org/llama.cpp-Repository
- Toggle ermöglicht drei Zustände: Thinking aktiviert, deaktiviert oder auf Effort-Level begrenzt
- Zusätzlich: Verbesserungen an der Chat-Form-Add-Action-UI
- Demo-Video im Reddit-Post verlinkt
- Vorgestellt von /u/jacek2023 auf r/LocalLLaMA am 2026-06-02
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com1w
Tampermonkey-Skript ergänzt llama.cpp Web-Chat um Qwen3-Reasoning-Toggle
- MEINUNGreddit.com1w
llama.cpp: Thinking-Modus bei Gemma 4 31B standardmäßig deaktiviert
- MEINUNGreddit.com5h
Reasoning-Aktivierung in llama.cpp: Community sucht Lösung
- LAUNCHreddit.com1w
llama.cpp erhält Mermaid-Diagramm-Rendering mit interaktiver Vorschau
llama.cpp UI: Thinking-Mode-Toggle mit Reasoning-Effort-Stufen
Pull Request #23434 im ggml-org/llama.cpp-Repository führt einen Thinking-Mode-Toggle in die Chat-UI ein. Nutzer können damit Schritt-für-Schritt-Reasoning für unterstützte Modelle direkt im Interface ein- und ausschalten oder auf bestimmte Effort-Stufen begrenzen. Ergänzend werden Verbesserungen an der „Chat Form Add Action"-UI mitgeliefert. Der PR wurde von Contributor allozaur eingereicht und von /u/jacek2023 auf r/LocalLLaMA vorgestellt, inklusive Demo-Video. Das Feature richtet sich an Nutzer, die Thinking-fähige Modelle (z. B. QwQ, DeepSeek-R1 oder ähnliche) lokal über llama.cpp betreiben und den Compute-Aufwand situativ anpassen möchten.
- PR #23434 von Contributor allozaur im ggml-org/llama.cpp-Repository
- Toggle ermöglicht drei Zustände: Thinking aktiviert, deaktiviert oder auf Effort-Level begrenzt
- Zusätzlich: Verbesserungen an der Chat-Form-Add-Action-UI
- Demo-Video im Reddit-Post verlinkt
- Vorgestellt von /u/jacek2023 auf r/LocalLLaMA am 2026-06-02
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com1w
Tampermonkey-Skript ergänzt llama.cpp Web-Chat um Qwen3-Reasoning-Toggle
- MEINUNGreddit.com1w
llama.cpp: Thinking-Modus bei Gemma 4 31B standardmäßig deaktiviert
- MEINUNGreddit.com5h
Reasoning-Aktivierung in llama.cpp: Community sucht Lösung
- LAUNCHreddit.com1w
llama.cpp erhält Mermaid-Diagramm-Rendering mit interaktiver Vorschau