Writ: Enforcement-Layer für KI-Coding-Agenten via Neo4j-Wissensgraph und hybridem RAG
Writ adressiert ein strukturelles Problem beim Einsatz von KI-Coding-Agenten: Werden viele Regeln und Standards als Prompt übergeben, ignoriert der Agent relevante Teile davon oder überfüllt das Kontextfenster mit irrelevantem Material. Die Lösung von InfinriDev teilt sich in zwei Schichten auf. Der Knowledge-Layer speichert Regeln, Skills, Antipatterns und Playbooks als Knoten in einem Neo4j-Graphen mit typisierten Beziehungen. Eine fünfstufige Retrieval-Pipeline kombiniert BM25 via Tantivy, Vektorähnlichkeit über HNSW, Graph-Traversal, Reciprocal Rank Fusion und Context-Budget-Management. Das Embedding-Modell all-MiniLM-L6-v2 läuft lokal über ONNX Runtime ohne PyTorch und ohne GPU-Anforderung. Der Enforcement-Layer besteht aus 30 Bash-Hook-Skripten, die Tool-Calls des Agenten vor der Ausführung abfangen – der Agent kann keinen Code schreiben ohne genehmigten Plan, keine Tests überspringen und keine Testergebnisse behaupten ohne vorherige statische Analyse. Aktuell ist Writ an das Hook-System von Claude Code angebunden, die Retrieval-Engine selbst ist jedoch providerunabhängig und kann prinzipiell an jedes lokale Modell-Setup mit Tool-Call-Events adaptiert werden.
- Neo4j-Wissensgraph speichert Regeln, Skills, Antipatterns und Playbooks als typisierte Knoten
- Fünfstufige Retrieval-Pipeline: BM25 (Tantivy), HNSW-Vektorsuche, Graph-Traversal, Reciprocal Rank Fusion, Context-Budget-Management
- Embedding-Modell all-MiniLM-L6-v2 läuft via ONNX Runtime – kein PyTorch, kein GPU nötig
- 30 Bash-Hook-Skripten blocken unzulässige Agent-Aktionen auf Prozessebene, nicht per Prompt
- Aktuell an Claude Code's Hook-System gebunden; Retrieval-Engine ist providerunabhängig
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org3w
ContextCov: Framework zur Durchsetzung von Code-Constraints in LLM-Agenten
- FORSCHUNGarxiv.org1w
AgentWall: Runtime-Safety-Layer für lokale KI-Agenten mit 92,9 % Policy-Genauigkeit
- FORSCHUNGarxiv.org2w
ClawGuard: Laufzeit-Sicherheitsframework gegen Indirect Prompt Injection in LLM-Agenten
- FORSCHUNGhuggingface.co1w
Code as Agent Harness: LLMs als Substrat für Agenten-Systeme
Writ: Enforcement-Layer für KI-Coding-Agenten via Neo4j-Wissensgraph und hybridem RAG
Writ adressiert ein strukturelles Problem beim Einsatz von KI-Coding-Agenten: Werden viele Regeln und Standards als Prompt übergeben, ignoriert der Agent relevante Teile davon oder überfüllt das Kontextfenster mit irrelevantem Material. Die Lösung von InfinriDev teilt sich in zwei Schichten auf. Der Knowledge-Layer speichert Regeln, Skills, Antipatterns und Playbooks als Knoten in einem Neo4j-Graphen mit typisierten Beziehungen. Eine fünfstufige Retrieval-Pipeline kombiniert BM25 via Tantivy, Vektorähnlichkeit über HNSW, Graph-Traversal, Reciprocal Rank Fusion und Context-Budget-Management. Das Embedding-Modell all-MiniLM-L6-v2 läuft lokal über ONNX Runtime ohne PyTorch und ohne GPU-Anforderung. Der Enforcement-Layer besteht aus 30 Bash-Hook-Skripten, die Tool-Calls des Agenten vor der Ausführung abfangen – der Agent kann keinen Code schreiben ohne genehmigten Plan, keine Tests überspringen und keine Testergebnisse behaupten ohne vorherige statische Analyse. Aktuell ist Writ an das Hook-System von Claude Code angebunden, die Retrieval-Engine selbst ist jedoch providerunabhängig und kann prinzipiell an jedes lokale Modell-Setup mit Tool-Call-Events adaptiert werden.
- Neo4j-Wissensgraph speichert Regeln, Skills, Antipatterns und Playbooks als typisierte Knoten
- Fünfstufige Retrieval-Pipeline: BM25 (Tantivy), HNSW-Vektorsuche, Graph-Traversal, Reciprocal Rank Fusion, Context-Budget-Management
- Embedding-Modell all-MiniLM-L6-v2 läuft via ONNX Runtime – kein PyTorch, kein GPU nötig
- 30 Bash-Hook-Skripten blocken unzulässige Agent-Aktionen auf Prozessebene, nicht per Prompt
- Aktuell an Claude Code's Hook-System gebunden; Retrieval-Engine ist providerunabhängig
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org3w
ContextCov: Framework zur Durchsetzung von Code-Constraints in LLM-Agenten
- FORSCHUNGarxiv.org1w
AgentWall: Runtime-Safety-Layer für lokale KI-Agenten mit 92,9 % Policy-Genauigkeit
- FORSCHUNGarxiv.org2w
ClawGuard: Laufzeit-Sicherheitsframework gegen Indirect Prompt Injection in LLM-Agenten
- FORSCHUNGhuggingface.co1w
Code as Agent Harness: LLMs als Substrat für Agenten-Systeme