Neue Forschung: Language Models leiden unter anterograder Amnesie
Ein Paper von Forschern aus Google und Cornell argumentiert, dass Transformer-Modelle strukturell an anterograder Amnesie leiden: Sie lernen nur einmalig beim Training, neues Wissen bleibt nicht dauerhaft gespeichert. Die Autoren schlagen einen biologisch inspirierten „Schlaf"-Mechanismus als Lösung vor.
Warum es zählt
Das Paper stellt das klassische Train/Test-Paradigma grundlegend in Frage und schlägt einen Konsolidierungsmechanismus analog zum Schlaf vor. Für AI-Builder relevant, die an kontinuierlichem Lernen und persistenter Wissensaktualisierung jenseits von Kontextfenstern arbeiten.
Foundation ModellePost Training