Context Is Not Control: Source-Boundary-Eval für LLM-Kontextkontrolle

Warum es zählt

Das Eval-Framework ist ohne Frontier-Modell-Zugang nutzbar und testet lokale/offene Modelle auf Source-Boundary-Fehler – ein bisher wenig formalisierter Schwachpunkt bei RAG, Prompt-Injection und Grounding.

— Lumeric Redaktion

Das Paper „Context Is Not Control" von Reddit-Nutzer /u/RJSabouhi formuliert ein neues Evaluierungsrahmenwerk für Large Language Models. Kern der Arbeit ist die These, dass viele Halluzinations- und Compliance-Fehler nicht auf fehlenden Kontext zurückzuführen sind, sondern darauf, dass Modelle nicht unterscheiden, welcher Teil des Kontextfensters als zulässige Evidenz gelten darf. Der Autor nennt sieben kritische Kontextkategorien: Evidenz, User-Framing, zitiertes Material, Quelltext, instruktionsartige Kontamination, unbelegte Behauptungen sowie autoritativ wirkende, aber ungültige Kontexte. Diese Unterscheidung wird als „Source-Boundary-Problem" gerahmt. Das Eval ist bewusst so gestaltet, dass es über verschiedene Kontextformate hinweg testbar ist und keinen Zugang zu proprietären Frontier-Modellen erfordert – damit richtet es sich explizit an die Community rund um lokale und offene Modelle. Der Autor betont, das Paper löse Halluzinationen nicht, sondern reframe einen spezifischen Teilbereich: das Versagen, Quellgrenzen unter kontextuellem Druck aufrechtzuerhalten.

Was wir noch wissen

7 Kontextkategorien werden unterschieden: Evidenz, User-Framing, Zitat, Quelltext, Instruktions-Kontamination, unbelegte Claims, ungültige Autorität
Kernthese: Die Frage ist nicht 'hatte das Modell genug Kontext?', sondern 'hat es den richtigen Kontext als Evidenz identifiziert?'
Eval ist unabhängig von Frontier-Modell-Zugang – explizit für lokale/offene Modelle konzipiert
Paper erhebt keinen Anspruch, Halluzinationen zu lösen – nur einen Teilbereich neu zu rahmen
Veröffentlicht als Kurzpaper/Eval-Write-up auf r/LocalLLaMA, offen für Kritik

Quelle lesenreddit.com

Evals Benchmarks Interpretierbarkeit Open Source

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Context Is Not Control: Source-Boundary-Eval für LLM-Kontextkontrolle

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

7 Kontextkategorien werden unterschieden: Evidenz, User-Framing, Zitat, Quelltext, Instruktions-Kontamination, unbelegte Claims, ungültige Autorität
Kernthese: Die Frage ist nicht 'hatte das Modell genug Kontext?', sondern 'hat es den richtigen Kontext als Evidenz identifiziert?'
Eval ist unabhängig von Frontier-Modell-Zugang – explizit für lokale/offene Modelle konzipiert
Paper erhebt keinen Anspruch, Halluzinationen zu lösen – nur einen Teilbereich neu zu rahmen
Veröffentlicht als Kurzpaper/Eval-Write-up auf r/LocalLLaMA, offen für Kritik

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Context Is Not Control: Source-Boundary-Eval für LLM-Kontextkontrolle

Frag die KI zum Artikel

Verwandte Beiträge

Context Is Not Control: Source-Boundary-Eval für LLM-Kontextkontrolle

Frag die KI zum Artikel

Verwandte Beiträge