ReAct-Agent mit Qwen 3.5 9B und Gemma 4 via LangGraph: Stabilitätsprobleme in Tool-Loops
Der Reddit-Nutzer /u/siri_1110 experimentiert mit einem ReAct-style Looping-Agenten, der auf kleinen LLMs wie Qwen 3.5 9B und Gemma 4 (via E2B) basiert und mit LangGraph orchestriert wird. Das Setup umfasst rund 5 Tools, verarbeitet sowohl Text als auch Bilder und ist so konzipiert, dass der Output eines Tools als Input des nächsten dienen kann. Mittelfristig ist eine Erweiterung auf ein Multi-Agenten-System mit zwei Subagenten geplant. Das zentrale Problem: Qwen 3.5 9B produziert in rekursiven Loops massenhaft Thinking/Reasoning-Tokens, was zu abgeschnittenen Ausgaben und instabilen Iterationen führt. Der Autor sucht Community-Feedback zu Strategien wie Reasoning-Depth-Limiting, Planner/Executor-Trennung und bekannten Patterns für Tool-Dependency-Handling in LangGraph – eine Diskussion, die viele praktische Fragen rund um den Einsatz kleiner Modelle in Agenten-Architekturen bündelt.
- Qwen 3.5 9B generiert in Tool-Loops exzessiv viele Reasoning-Tokens, was Ausgaben truncated oder nie zurückgibt
- Setup nutzt LangGraph mit ca. 5 verfügbaren Tools und multimodalem Input (Text + Bilder)
- Gemma 4 wird als alternatives Modell über E2B getestet
- Erweiterung auf Multi-Agenten-System mit 2 Subagenten ist geplant, aktuell nur Single-Agent-Workflow
- Autor fragt nach Planner/Executor-Trennung und Strategien zur Reduktion unnötiger Thinking-Token-Generierung
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com5d
Wie klein kann das Orchestrierungsmodell in einem ReAct-Agent sein?
- MEINUNGreddit.com1w
Looping-Problem bei lokalen LLMs: Qwen 3.6 35B erzeugt endlose Token-Schleifen
- MEINUNGreddit.com3w
Qwen 3.6 27B zeigt Schleifen-Probleme bei über 100k Token Kontext
- MEINUNGreddit.com2w
Gemma4 vs. Qwen3: Community-Erfahrungen bei lokalem LLM-Einsatz
ReAct-Agent mit Qwen 3.5 9B und Gemma 4 via LangGraph: Stabilitätsprobleme in Tool-Loops
Der Reddit-Nutzer /u/siri_1110 experimentiert mit einem ReAct-style Looping-Agenten, der auf kleinen LLMs wie Qwen 3.5 9B und Gemma 4 (via E2B) basiert und mit LangGraph orchestriert wird. Das Setup umfasst rund 5 Tools, verarbeitet sowohl Text als auch Bilder und ist so konzipiert, dass der Output eines Tools als Input des nächsten dienen kann. Mittelfristig ist eine Erweiterung auf ein Multi-Agenten-System mit zwei Subagenten geplant. Das zentrale Problem: Qwen 3.5 9B produziert in rekursiven Loops massenhaft Thinking/Reasoning-Tokens, was zu abgeschnittenen Ausgaben und instabilen Iterationen führt. Der Autor sucht Community-Feedback zu Strategien wie Reasoning-Depth-Limiting, Planner/Executor-Trennung und bekannten Patterns für Tool-Dependency-Handling in LangGraph – eine Diskussion, die viele praktische Fragen rund um den Einsatz kleiner Modelle in Agenten-Architekturen bündelt.
- Qwen 3.5 9B generiert in Tool-Loops exzessiv viele Reasoning-Tokens, was Ausgaben truncated oder nie zurückgibt
- Setup nutzt LangGraph mit ca. 5 verfügbaren Tools und multimodalem Input (Text + Bilder)
- Gemma 4 wird als alternatives Modell über E2B getestet
- Erweiterung auf Multi-Agenten-System mit 2 Subagenten ist geplant, aktuell nur Single-Agent-Workflow
- Autor fragt nach Planner/Executor-Trennung und Strategien zur Reduktion unnötiger Thinking-Token-Generierung
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com5d
Wie klein kann das Orchestrierungsmodell in einem ReAct-Agent sein?
- MEINUNGreddit.com1w
Looping-Problem bei lokalen LLMs: Qwen 3.6 35B erzeugt endlose Token-Schleifen
- MEINUNGreddit.com3w
Qwen 3.6 27B zeigt Schleifen-Probleme bei über 100k Token Kontext
- MEINUNGreddit.com2w
Gemma4 vs. Qwen3: Community-Erfahrungen bei lokalem LLM-Einsatz