ReAct-Agent mit Qwen 3.5 9B und Gemma 4 via LangGraph: Stabilitätsprobleme in Tool-Loops

Warum es zählt

Kleine Modelle wie Qwen 3.5 9B neigen in Tool-Calling-Loops zu unkontrolliertem Reasoning-Token-Wachstum – ein praxisrelevantes Problem für Teams, die lokale Agenten ohne große Modelle betreiben wollen.

— Lumeric Redaktion

Der Reddit-Nutzer /u/siri_1110 experimentiert mit einem ReAct-style Looping-Agenten, der auf kleinen LLMs wie Qwen 3.5 9B und Gemma 4 (via E2B) basiert und mit LangGraph orchestriert wird. Das Setup umfasst rund 5 Tools, verarbeitet sowohl Text als auch Bilder und ist so konzipiert, dass der Output eines Tools als Input des nächsten dienen kann. Mittelfristig ist eine Erweiterung auf ein Multi-Agenten-System mit zwei Subagenten geplant. Das zentrale Problem: Qwen 3.5 9B produziert in rekursiven Loops massenhaft Thinking/Reasoning-Tokens, was zu abgeschnittenen Ausgaben und instabilen Iterationen führt. Der Autor sucht Community-Feedback zu Strategien wie Reasoning-Depth-Limiting, Planner/Executor-Trennung und bekannten Patterns für Tool-Dependency-Handling in LangGraph – eine Diskussion, die viele praktische Fragen rund um den Einsatz kleiner Modelle in Agenten-Architekturen bündelt.

Was wir noch wissen

Qwen 3.5 9B generiert in Tool-Loops exzessiv viele Reasoning-Tokens, was Ausgaben truncated oder nie zurückgibt
Setup nutzt LangGraph mit ca. 5 verfügbaren Tools und multimodalem Input (Text + Bilder)
Gemma 4 wird als alternatives Modell über E2B getestet
Erweiterung auf Multi-Agenten-System mit 2 Subagenten ist geplant, aktuell nur Single-Agent-Workflow
Autor fragt nach Planner/Executor-Trennung und Strategien zur Reduktion unnötiger Thinking-Token-Generierung

Quelle lesenreddit.com

Agents Open Source Foundation Modelle

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

ReAct-Agent mit Qwen 3.5 9B und Gemma 4 via LangGraph: Stabilitätsprobleme in Tool-Loops

ToolsQwen LangChain

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Qwen 3.5 9B generiert in Tool-Loops exzessiv viele Reasoning-Tokens, was Ausgaben truncated oder nie zurückgibt
Setup nutzt LangGraph mit ca. 5 verfügbaren Tools und multimodalem Input (Text + Bilder)
Gemma 4 wird als alternatives Modell über E2B getestet
Erweiterung auf Multi-Agenten-System mit 2 Subagenten ist geplant, aktuell nur Single-Agent-Workflow
Autor fragt nach Planner/Executor-Trennung und Strategien zur Reduktion unnötiger Thinking-Token-Generierung

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

ReAct-Agent mit Qwen 3.5 9B und Gemma 4 via LangGraph: Stabilitätsprobleme in Tool-Loops

Frag die KI zum Artikel

Verwandte Beiträge

ReAct-Agent mit Qwen 3.5 9B und Gemma 4 via LangGraph: Stabilitätsprobleme in Tool-Loops

Frag die KI zum Artikel

Verwandte Beiträge