wird geladen

Andrej Karpathy's LLM Wiki: Persistente Wissensbasis für KI-Assistenten · Lumeric

Beitrag

MEINUNG

towardsdatascience.com· Towards Data Science2mo

Andrej Karpathy's LLM Wiki: Persistente Wissensbasis für KI-Assistenten

ToolsClaude GPT

CompaniesOpenAI

Warum es zählt

Alternative zu RAG-Ansätzen: Statt Dokumentchunks bei jeder Query neu zu embedden und zu retrieven, wird Synthese einmalig vorgenommen und gepflegt. Das reduziert Latenz bei komplexen Fragen und verhindert, dass operative Zustände (Projektdetails, Pipeline-Status, Entscheidungen) immer neu erklärt werden müssen.

— Lumeric Redaktion

Sara Nobrega dokumentiert die praktische Implementierung des „LLM Wiki"-Musters, das Andrej Karpathy in einem GitHub-Gist beschrieben hat. Das System löst ein zentrales Problem aktueller LLM-Nutzung: Jedes Gespräch beginnt bei Null, Kontext über Projekte, Entscheidungen oder Operationalzustand muss wiederholt eingegeben werden. Das vorgeschlagene Modell nutzt eine strukturierte Vault mit Raw-Ordnern (unveränderliche Quelldaten), Wiki-Ordnern (von der KI gepflegte, indexierte Seiten) und einer Schema-Datei (CLAUDE.md), die die Organisationsregeln definiert. Zentral sind drei Kontrollmechanismen: _hot.md als täglicher Cache mit den wichtigsten Infos unter 500 Tokens, _pending.md als Kompilierungs-Queue für neue Rohfiles, und _log.md als Audit-Trail für alle automatisierten Läufe. Das System ähnelt bewährten Daten-Pipeline-Mustern und unterscheidet sich fundamental von RAG, das bei jeder Query von Grund auf neue Synthesen aus Dokumenten erstellt.

Quelle lesentowardsdatascience.com

Long Context Developer Tooling Agents

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Verwandte Beiträge

MEINUNG

towardsdatascience.com· Towards Data Science2mo

Andrej Karpathy's LLM Wiki: Persistente Wissensbasis für KI-Assistenten

ToolsClaude GPT

CompaniesOpenAI

Warum es zählt

Alternative zu RAG-Ansätzen: Statt Dokumentchunks bei jeder Query neu zu embedden und zu retrieven, wird Synthese einmalig vorgenommen und gepflegt. Das reduziert Latenz bei komplexen Fragen und verhindert, dass operative Zustände (Projektdetails, Pipeline-Status, Entscheidungen) immer neu erklärt werden müssen.

— Lumeric Redaktion

Sara Nobrega dokumentiert die praktische Implementierung des „LLM Wiki"-Musters, das Andrej Karpathy in einem GitHub-Gist beschrieben hat. Das System löst ein zentrales Problem aktueller LLM-Nutzung: Jedes Gespräch beginnt bei Null, Kontext über Projekte, Entscheidungen oder Operationalzustand muss wiederholt eingegeben werden. Das vorgeschlagene Modell nutzt eine strukturierte Vault mit Raw-Ordnern (unveränderliche Quelldaten), Wiki-Ordnern (von der KI gepflegte, indexierte Seiten) und einer Schema-Datei (CLAUDE.md), die die Organisationsregeln definiert. Zentral sind drei Kontrollmechanismen: _hot.md als täglicher Cache mit den wichtigsten Infos unter 500 Tokens, _pending.md als Kompilierungs-Queue für neue Rohfiles, und _log.md als Audit-Trail für alle automatisierten Läufe. Das System ähnelt bewährten Daten-Pipeline-Mustern und unterscheidet sich fundamental von RAG, das bei jeder Query von Grund auf neue Synthesen aus Dokumenten erstellt.

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Verwandte Beiträge