
Andrej Karpathy's LLM Wiki: Persistente Wissensbasis für KI-Assistenten
Sara Nobrega dokumentiert die praktische Implementierung des „LLM Wiki"-Musters, das Andrej Karpathy in einem GitHub-Gist beschrieben hat. Das System löst ein zentrales Problem aktueller LLM-Nutzung: Jedes Gespräch beginnt bei Null, Kontext über Projekte, Entscheidungen oder Operationalzustand muss wiederholt eingegeben werden. Das vorgeschlagene Modell nutzt eine strukturierte Vault mit Raw-Ordnern (unveränderliche Quelldaten), Wiki-Ordnern (von der KI gepflegte, indexierte Seiten) und einer Schema-Datei (CLAUDE.md), die die Organisationsregeln definiert. Zentral sind drei Kontrollmechanismen: _hot.md als täglicher Cache mit den wichtigsten Infos unter 500 Tokens, _pending.md als Kompilierungs-Queue für neue Rohfiles, und _log.md als Audit-Trail für alle automatisierten Läufe. Das System ähnelt bewährten Daten-Pipeline-Mustern und unterscheidet sich fundamental von RAG, das bei jeder Query von Grund auf neue Synthesen aus Dokumenten erstellt.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge

Andrej Karpathy's LLM Wiki: Persistente Wissensbasis für KI-Assistenten
Sara Nobrega dokumentiert die praktische Implementierung des „LLM Wiki"-Musters, das Andrej Karpathy in einem GitHub-Gist beschrieben hat. Das System löst ein zentrales Problem aktueller LLM-Nutzung: Jedes Gespräch beginnt bei Null, Kontext über Projekte, Entscheidungen oder Operationalzustand muss wiederholt eingegeben werden. Das vorgeschlagene Modell nutzt eine strukturierte Vault mit Raw-Ordnern (unveränderliche Quelldaten), Wiki-Ordnern (von der KI gepflegte, indexierte Seiten) und einer Schema-Datei (CLAUDE.md), die die Organisationsregeln definiert. Zentral sind drei Kontrollmechanismen: _hot.md als täglicher Cache mit den wichtigsten Infos unter 500 Tokens, _pending.md als Kompilierungs-Queue für neue Rohfiles, und _log.md als Audit-Trail für alle automatisierten Läufe. Das System ähnelt bewährten Daten-Pipeline-Mustern und unterscheidet sich fundamental von RAG, das bei jeder Query von Grund auf neue Synthesen aus Dokumenten erstellt.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.