Step-3.7-Flash auf AMD ROCm: Long-Context-Bug ab ~94k Token und Thinking-Budget-Fix

CompaniesAMD

Warum es zählt

Wer Step-3.7-Flash mit ROCm für RAG oder Klassifikation nutzt, muss den Kontext auf unter 90k kappen und ein hartes Thinking-Budget setzen – sonst drohen leere Antworten durch Token-Budget-Erschöpfung. `enable_thinking:false` und `reasoning_effort` funktionieren nicht zuverlässig.

— Lumeric Redaktion

Quelle lesenreddit.com

Inferenz Infra Long Context Open Source

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Step-3.7-Flash auf AMD ROCm: Long-Context-Bug ab ~94k Token und Thinking-Budget-Fix

ToolsLlama

CompaniesAMD

Warum es zählt

— Lumeric Redaktion

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Step-3.7-Flash auf AMD ROCm: Long-Context-Bug ab ~94k Token und Thinking-Budget-Fix

Frag die KI zum Artikel

Verwandte Beiträge

Step-3.7-Flash auf AMD ROCm: Long-Context-Bug ab ~94k Token und Thinking-Budget-Fix

Frag die KI zum Artikel

Verwandte Beiträge