„Gentle Coding" reduziert Token-Overhead und Abstürze bei GLM-5.1 und Kimi K2.6
Der Reddit-Nutzer OttoRenner präsentiert ein Update zu seinem „Gentle Coding"-Ansatz: die These, dass sachlich-freundliche statt druckvoller Prompt-Formulierungen die Modellleistung messbar verbessert. Die Tests wurden von der Community rund um das 8.200-Sterne-Repo oh-my-pi (GitHub: can1357/oh-my-pi) durchgeführt. Bei GLM-5.1 (Medium) wurde eine 100-prozentige Freeze-Pathologie vollständig behoben – die Standard-Baseline crashte 6/6 Mal, „Gentle Framing" löste 6/6 Aufgaben sofort, mit +22 % Erfolgsrate und −23,3 % medianer Latenz. Kimi K2.6 (Turbo/High) zeigte −36 % Input-Token, −23 % Output-Token und −11 % Wall-Clock-Time. Bei Claude 3.5 Sonnet, Opus und GPT-5 wurden agentengetriebene Endlosschleifen (30+ Minuten unter Druck) vollständig eliminiert, zudem wurden 21 bisher verpasste architektonische Randfälle korrekt gelöst. Alle Ergebnisse sind im GitHub-Repo OttoRenner/Gentle-Coding dokumentiert.
- GLM-5.1: Freeze-Bug 6/6 gelöst, +22% Erfolgsrate, −23,3% mediane Latenz gegenüber koerzitiver Baseline
- Kimi K2.6 Turbo/High: −36% Input-Token, −23% Output-Token, −11% Wall-Clock-Time
- GLM-5-Turbo mit Thinking Off: +3 Task-Passes, −17% Input-Token, −37% Wall-Clock-Time
- Claude 3.5 Sonnet/Opus & GPT-5: Agentic Runaway vollständig eliminiert, 21 neue Edge Cases gelöst
- Tests liefen auf oh-my-pi-Harness (8.200 GitHub-Stars), Community-betrieben, nicht kommerziell
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org1w
Whisper: Persuasive Prompts reduzieren LRM-Token-Verbrauch um bis zu 50%
- FORSCHUNGarxiv.org2d
Prompt Codebooks: Kompositionelle Prompt-Optimierung mit wiederverwendbaren Instruction-Units
- FORSCHUNGarxiv.org3w
Memory Inception: Training-freies KV-Cache-Steering für LLMs
- FORSCHUNGarxiv.org2w
RL-Framework trainiert Prompting-Policies für Black-box-LLMs via Erfahrungs-Destillation
„Gentle Coding" reduziert Token-Overhead und Abstürze bei GLM-5.1 und Kimi K2.6
Der Reddit-Nutzer OttoRenner präsentiert ein Update zu seinem „Gentle Coding"-Ansatz: die These, dass sachlich-freundliche statt druckvoller Prompt-Formulierungen die Modellleistung messbar verbessert. Die Tests wurden von der Community rund um das 8.200-Sterne-Repo oh-my-pi (GitHub: can1357/oh-my-pi) durchgeführt. Bei GLM-5.1 (Medium) wurde eine 100-prozentige Freeze-Pathologie vollständig behoben – die Standard-Baseline crashte 6/6 Mal, „Gentle Framing" löste 6/6 Aufgaben sofort, mit +22 % Erfolgsrate und −23,3 % medianer Latenz. Kimi K2.6 (Turbo/High) zeigte −36 % Input-Token, −23 % Output-Token und −11 % Wall-Clock-Time. Bei Claude 3.5 Sonnet, Opus und GPT-5 wurden agentengetriebene Endlosschleifen (30+ Minuten unter Druck) vollständig eliminiert, zudem wurden 21 bisher verpasste architektonische Randfälle korrekt gelöst. Alle Ergebnisse sind im GitHub-Repo OttoRenner/Gentle-Coding dokumentiert.
- GLM-5.1: Freeze-Bug 6/6 gelöst, +22% Erfolgsrate, −23,3% mediane Latenz gegenüber koerzitiver Baseline
- Kimi K2.6 Turbo/High: −36% Input-Token, −23% Output-Token, −11% Wall-Clock-Time
- GLM-5-Turbo mit Thinking Off: +3 Task-Passes, −17% Input-Token, −37% Wall-Clock-Time
- Claude 3.5 Sonnet/Opus & GPT-5: Agentic Runaway vollständig eliminiert, 21 neue Edge Cases gelöst
- Tests liefen auf oh-my-pi-Harness (8.200 GitHub-Stars), Community-betrieben, nicht kommerziell
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org1w
Whisper: Persuasive Prompts reduzieren LRM-Token-Verbrauch um bis zu 50%
- FORSCHUNGarxiv.org2d
Prompt Codebooks: Kompositionelle Prompt-Optimierung mit wiederverwendbaren Instruction-Units
- FORSCHUNGarxiv.org3w
Memory Inception: Training-freies KV-Cache-Steering für LLMs
- FORSCHUNGarxiv.org2w
RL-Framework trainiert Prompting-Policies für Black-box-LLMs via Erfahrungs-Destillation