
SWE-Explore: AI-Coding-Agenten finden Dateien, verfehlen kritische Codezeilen
Warum es zählt
Unzureichende Kontextlokalisierung ist ein eigenständiger Schwachpunkt von Coding-Agenten – selbst ein korrekter Patch schlägt fehl, wenn die relevanten Zeilen nicht gefunden werden. SWE-Explore liefert eine gezielte Messgröße, um diesen Engpass separat zu evaluieren und zu verbessern.
— Lumeric Redaktion
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org2w
TRAJEVAL deckt Coherence Collapse als Hauptversagen von Code-Agenten auf
- FORSCHUNGhuggingface.co5d
SWE-Explore: Benchmark für Repository-Exploration von Coding Agents
- FORSCHUNGarxiv.org2w
Studie analysiert fünf APR-Agenten auf 500 SWE-bench-Aufgaben
- FORSCHUNGarxiv.org5d
CodeTaste: Benchmark testet LLM-Agenten bei Code-Refactoring auf menschlichem Niveau

SWE-Explore: AI-Coding-Agenten finden Dateien, verfehlen kritische Codezeilen
Warum es zählt
Unzureichende Kontextlokalisierung ist ein eigenständiger Schwachpunkt von Coding-Agenten – selbst ein korrekter Patch schlägt fehl, wenn die relevanten Zeilen nicht gefunden werden. SWE-Explore liefert eine gezielte Messgröße, um diesen Engpass separat zu evaluieren und zu verbessern.
— Lumeric Redaktion
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org2w
TRAJEVAL deckt Coherence Collapse als Hauptversagen von Code-Agenten auf
- FORSCHUNGhuggingface.co5d
SWE-Explore: Benchmark für Repository-Exploration von Coding Agents
- FORSCHUNGarxiv.org2w
Studie analysiert fünf APR-Agenten auf 500 SWE-bench-Aufgaben
- FORSCHUNGarxiv.org5d
CodeTaste: Benchmark testet LLM-Agenten bei Code-Refactoring auf menschlichem Niveau