Experimentelles Jinja-Template stabilisiert Thinking-Tags für Gemma4 31B in llama.cpp

Warum es zählt

Wer Gemma4 31B lokal für Agenten-Workflows nutzt, kann mit dem Template Probleme wie nicht geschlossene oder vergessene Thinking-Tags bei mehrstufigen Tool-Calls reduzieren — ohne auf ein offizielles Google-Fix warten zu müssen.

— Lumeric Redaktion

Der Reddit-Nutzer /u/ggonavyy hat ein experimentelles Jinja-Chat-Template für Gemma4 31B (Instruction-Tuned, nvfp4-GGUF) veröffentlicht, das auf HuggingFace als `gemma4-improved.jinja` verfügbar ist. Das Template adressiert bekannte Stabilitätsprobleme beim Umgang mit `<thinking>`-Tags in llama.cpp: In der Praxis trat beim Modell häufig auf, dass Tags nicht geöffnet, nicht geschlossen oder zu früh geschlossen wurden – besonders in Multi-Turn-Szenarien mit Tool-Calls. Der Autor gibt an, das Template in seinem eigenen Projekt „Pi-coding-agent" getestet zu haben und dort keine dieser Fehler mehr zu beobachten. Ausdrücklich wird darauf hingewiesen, dass das Template nicht von Google empfohlen oder offiziell unterstützt wird und als experimentell gilt. Community-Feedback ist explizit erwünscht.

Was wir noch wissen

Template verfügbar unter: huggingface.co/stevelikesrhino/gemma-4-31B-it-nvfp4-GGUF als gemma4-improved.jinja
Behebt Fehler: vergessene/nicht geschlossene Thinking-Tags bei Multi-Turn-Tool-Calls in llama.cpp
Getestet im Projekt Pi-coding-agent des Autors /u/ggonavyy
Ausdrücklich NICHT von Google empfohlen — Community-Experiment
Zielt auf das Modell Gemma4 31B IT im nvfp4-GGUF-Format ab

Quelle lesenreddit.com

Open Source Agents Developer Tooling

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Experimentelles Jinja-Template stabilisiert Thinking-Tags für Gemma4 31B in llama.cpp

ToolsLlama Hugging Face

CompaniesHugging Face Google DeepMind

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Template verfügbar unter: huggingface.co/stevelikesrhino/gemma-4-31B-it-nvfp4-GGUF als gemma4-improved.jinja
Behebt Fehler: vergessene/nicht geschlossene Thinking-Tags bei Multi-Turn-Tool-Calls in llama.cpp
Getestet im Projekt Pi-coding-agent des Autors /u/ggonavyy
Ausdrücklich NICHT von Google empfohlen — Community-Experiment
Zielt auf das Modell Gemma4 31B IT im nvfp4-GGUF-Format ab

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Experimentelles Jinja-Template stabilisiert Thinking-Tags für Gemma4 31B in llama.cpp

Frag die KI zum Artikel

Verwandte Beiträge

Experimentelles Jinja-Template stabilisiert Thinking-Tags für Gemma4 31B in llama.cpp

Frag die KI zum Artikel

Verwandte Beiträge