Warum Cursor und Claude Code im Kontext-Fenster ersticken

ToolsClaude Claude Code Model Context Protocol Cursor

Warum es zählt

Wer mit Coding-Agenten auf größeren Repos arbeitet, verliert bis zu 30.000 Token allein durch blinde Datei-Dumps und verbose Tool-Definitionen – die eigentliche Codegenerierung leidet darunter massiv. Standard-RAG löst das Problem laut dem Autor nicht; ein AST- oder Graph-DB-basiertes Codestruktur-Parsing wäre nötig.

— Lumeric Redaktion

Der Reddit-Nutzer StatisticianFluid747 dokumentiert auf r/LocalLLaMA anhand eigener API-Log-Audits, wie Coding-Agenten ihr Kontextfenster bereits vor der ersten Code-Ausgabe durch vier strukturelle Muster systematisch verstopfen: (1) „Blind Exploration" – rekursives Greppen und Dumpen von bis zu 40 Dateien, um eine einzige Utility-Funktion zu finden. (2) „Raw Ingestion" – komplette 2.000-Zeilen-Dateien werden in den Prompt geladen, obwohl nur ein 5-Zeilen-Interface angepasst wird. (3) „Tool Diarrhea" – verbose Testlogs und umfangreiche MCP-Tool-Definitionen fressen bis zu 30.000 Token, bevor ein einziges Code-Token generiert wird. (4) „Goldfish Memory" – fehlende sessionübergreifende Projektkenntnis zwingt den Agenten, dieselben Dateien jede Sitzung erneut einzulesen. Sobald das Kontextfenster die 80-Prozent-Auslastung überschreitet, degradiert die Ausgabequalität sichtbar, was zu halluzinierten Duplikaten und architektonischen Regressionen führt. Der Autor kritisiert, dass Standard-Chunking-RAG das Problem nicht löst, da es die logische Struktur eines Codebases nicht erfasst. Als Lösung fordert er einen Open-Source-Agenten, der Code vorab in einen AST oder eine Graph-Datenbank parst, um strukturelles Verständnis vor dem Token-Budget aufzubauen.

Was wir noch wissen

Bis zu 40 Dateien werden per rekursivem Grep in den Kontext geladen, nur um eine einzelne Util-Funktion zu lokalisieren.
Verbose MCP-Tool-Definitionen und Testlogs kosten laut Autor rund 30.000 Token vor der ersten Code-Ausgabe.
Ab ~80 % Kontext-Auslastung beobachtet der Autor sichtbaren Qualitätsabfall und architektonische Regressionen.
Standard-Chunking-RAG wird als ungeeignet eingestuft, da es die logische Codestruktur nicht abbildet.
Gefordert wird ein OSS-Agent mit AST- oder Graph-DB-basiertem Code-Parsing als Kontext-Vorverarbeitungsschicht.

Quelle lesenreddit.com

Agents Coding Assistenten Long Context

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Warum Cursor und Claude Code im Kontext-Fenster ersticken

ToolsClaude Claude Code Model Context Protocol Cursor

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Bis zu 40 Dateien werden per rekursivem Grep in den Kontext geladen, nur um eine einzelne Util-Funktion zu lokalisieren.
Verbose MCP-Tool-Definitionen und Testlogs kosten laut Autor rund 30.000 Token vor der ersten Code-Ausgabe.
Ab ~80 % Kontext-Auslastung beobachtet der Autor sichtbaren Qualitätsabfall und architektonische Regressionen.
Standard-Chunking-RAG wird als ungeeignet eingestuft, da es die logische Codestruktur nicht abbildet.
Gefordert wird ein OSS-Agent mit AST- oder Graph-DB-basiertem Code-Parsing als Kontext-Vorverarbeitungsschicht.

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Warum Cursor und Claude Code im Kontext-Fenster ersticken

Frag die KI zum Artikel

Verwandte Beiträge

Warum Cursor und Claude Code im Kontext-Fenster ersticken

Frag die KI zum Artikel

Verwandte Beiträge