talkie-1930-13B: Vintage-LLM auf 260B historischen Tokens trainiert

Warum es zählt

Das Modell ermöglicht Experimente mit historisch beschränktem Weltwissen und eignet sich für Forschung zu Bias, Sprachstil und Wissensgrenzen – die llama.cpp-Integration macht es lokal ausführbar.

— Lumeric Redaktion

talkie-1930-13b-it ist ein sogenanntes „Vintage Language Model" – ein Konzept, das auf Owain Evans zurückgeht. Das Basismodell talkie-1930-13b-base wurde auf 260 Milliarden Tokens englischsprachiger Texte trainiert, die ausschließlich vor 1931 verfasst wurden. Die Instruction-tuned Variante wurde anschließend auf einem eigens erstellten Datensatz aus vormodernen Referenzwerken feinabgestimmt, darunter Etikette-Handbücher, Enzyklopädien und Briefratgeber. Um die Instruktionsfolge-Fähigkeit zu verbessern, wurde das Modell mit Online-DPO (LLM-as-a-Judge) per Reinforcement Learning weiter optimiert. Ein Pull Request (#22596) im ggml-org/llama.cpp-Repository ergänzt nun die nötige Unterstützung, um das Modell lokal über llama.cpp auszuführen. Das Modell ist auf HuggingFace unter talkie-lm/talkie-1930-13b-it verfügbar; ein technischer Bericht sowie Referenzcode auf GitHub begleiten die Veröffentlichung.

Was wir noch wissen

13B-Parameter-Modell, Basistraining auf ausschließlich vor-1931-englischem Text
Instruction-Tuning auf Datensatz aus Etikette-Büchern, Enzyklopädien und Briefschreib-Manualen
Reinforcement Learning via Online-DPO mit LLM-as-a-Judge zur Verbesserung des Instruction-Followings
llama.cpp-Support via Pull Request #22596 von Nutzer niklassheth
Modell auf HuggingFace unter talkie-lm/talkie-1930-13b-it verfügbar

Quelle lesenreddit.com

260B Token

Pre-1931-Trainingskorpus des Basismodells

Foundation Modelle Open Source Post Training

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

talkie-1930-13B: Vintage-LLM auf 260B historischen Tokens trainiert

ToolsLlama Hugging Face

CompaniesHugging Face

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

13B-Parameter-Modell, Basistraining auf ausschließlich vor-1931-englischem Text
Instruction-Tuning auf Datensatz aus Etikette-Büchern, Enzyklopädien und Briefschreib-Manualen
Reinforcement Learning via Online-DPO mit LLM-as-a-Judge zur Verbesserung des Instruction-Followings
llama.cpp-Support via Pull Request #22596 von Nutzer niklassheth
Modell auf HuggingFace unter talkie-lm/talkie-1930-13b-it verfügbar

260B Token

Pre-1931-Trainingskorpus des Basismodells

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

talkie-1930-13B: Vintage-LLM auf 260B historischen Tokens trainiert

Frag die KI zum Artikel

Verwandte Beiträge

talkie-1930-13B: Vintage-LLM auf 260B historischen Tokens trainiert

Frag die KI zum Artikel

Verwandte Beiträge