Qwen2 7B: Community sucht Proxy-Lösung für leakende tool_call-Tags

Warum es zählt

Wer Qwen2 7B in Agenten-Setups einsetzt, muss das unkontrollierte Durchsickern von <tool_call>-Tags clientseitig abfangen – einen fertigen, allgemein verfügbaren Proxy dafür gibt es laut Community noch nicht.

— Lumeric Redaktion

Das Problem betrifft Qwen2 7B beim Einsatz mit Tool-Calling: Die Tags <tool_call> und </tool_call> landen nicht immer im dafür vorgesehenen Kanal, sondern lecken in den regulären content- oder reasoning_content-Stream. Der Poster /u/Hot-Employ-3399 skizziert einen möglichen clientseitigen Fix: Beim Erkennen von <tool_call> im Stream wird das Streaming gestoppt, das Ende auf </tool_call> geprüft und anschließend ein synthetischer Tool-Call zurückgesendet oder ein Retry ausgelöst. Schwieriger wird es bei mehreren aufeinanderfolgenden Tool-Calls. Als Referenz wird das Hermes-Agent-Projekt von NousResearch genannt, das einen ähnlichen Flush-Mechanismus für GPT-kompatible Endpunkte implementiert hat (codex_responses_adapter.py, Zeile 1043). Das dort genutzte Muster ist bekannt, wurde für Qwen2 7B jedoch noch nicht als fertiger, öffentlich zugänglicher Proxy-Server bereitgestellt. Das Tool „qwencode" erholt sich laut Poster nach einem solchen Leak nicht selbstständig. Die Diskussion zielt darauf ab, eine netzwerkseitige Lösung zu finden, die diesen Fix zentral für alle Nutzer bereitstellt.

Was wir noch wissen

Fehler tritt auf, wenn <tool_call>-Tags am Ende von content oder reasoning_content erscheinen statt im Tool-Kanal.
Clientseitiger Fix-Ansatz: Stream bei <tool_call> stoppen, auf </tool_call> warten, dann gefälschten Tool-Call senden oder Retry auslösen.
NousResearch Hermes-Agent implementiert einen ähnlichen Flush-Mechanismus für GPT (codex_responses_adapter.py, Z. 1043).
qwencode kann nach einem solchen Leak nicht selbstständig wiederhergestellt werden.
Es wird ein öffentlicher Proxy-Web-Server gesucht, der diesen Fix für Qwen2 7B zentral bereitstellt.

Quelle lesenreddit.com

Agents Inferenz Infra Developer Tooling

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Qwen2 7B: Community sucht Proxy-Lösung für leakende tool_call-Tags

ToolsGPT Qwen

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Fehler tritt auf, wenn <tool_call>-Tags am Ende von content oder reasoning_content erscheinen statt im Tool-Kanal.
Clientseitiger Fix-Ansatz: Stream bei <tool_call> stoppen, auf </tool_call> warten, dann gefälschten Tool-Call senden oder Retry auslösen.
NousResearch Hermes-Agent implementiert einen ähnlichen Flush-Mechanismus für GPT (codex_responses_adapter.py, Z. 1043).
qwencode kann nach einem solchen Leak nicht selbstständig wiederhergestellt werden.
Es wird ein öffentlicher Proxy-Web-Server gesucht, der diesen Fix für Qwen2 7B zentral bereitstellt.

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Qwen2 7B: Community sucht Proxy-Lösung für leakende tool_call-Tags

Frag die KI zum Artikel

Verwandte Beiträge

Qwen2 7B: Community sucht Proxy-Lösung für leakende tool_call-Tags

Frag die KI zum Artikel

Verwandte Beiträge