STAM: Neuer Deep-Learning-Optimizer soll Adam und Muon übertreffen

Warum es zählt

STAM adressiert bekannte Schwächen von Adam, AdamW und Muon und könnte für Praktiker relevant sein, die mit instabilem Training oder hohem Ressourcenverbrauch kämpfen – allerdings fehlen bislang unabhängige Peer-Reviews.

— Lumeric Redaktion

Der Reddit-Nutzer /u/assemsabryy hat sein erstes KI-Forschungspaper auf der Preprint-Plattform SSRN veröffentlicht. Das Paper beschreibt STAM (Stable Training with Adaptive Momentum), einen neu entwickelten Optimizer für tiefe neuronale Netze. Im Mittelpunkt stehen drei Ziele: stabileres Training, geringerer Ressourcenverbrauch und die Behebung von Schwächen etablierter Optimizer wie Adam, AdamW und Muon. Das Paper enthält nach eigener Aussage des Autors direkte Vergleiche mit diesen Methoden sowie Trainingsergebnisse. Auf SSRN hat das Paper bereits ein Ranking von rund 646.000 erreicht – eine Metrik, die dort die relative Sichtbarkeit anzeigt. Der Autor sucht ausdrücklich nach technischem Feedback von KI-Ingenieuren und Forschern. STAM befindet sich noch in der frühen Phase; eine externe Peer-Review hat noch nicht stattgefunden. Der Autor kündigt an, den Optimizer weiter zu entwickeln und zu verbessern.

Was wir noch wissen

Paper auf SSRN verfügbar (kein Peer-Review, Preprint-Status): abstract_id=6699059
SSRN-Ranking des Papers liegt laut Autor bei rund 646.000
Vergleiche mit Adam, AdamW und Muon sind im Paper enthalten
Autor plant weitere Entwicklung und Verbesserung von STAM
Veröffentlicht von Einzelperson (/u/assemsabryy), kein institutioneller Hintergrund genannt

Quelle lesenreddit.com

Foundation Modelle Open Source Post Training

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

STAM: Neuer Deep-Learning-Optimizer soll Adam und Muon übertreffen

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Paper auf SSRN verfügbar (kein Peer-Review, Preprint-Status): abstract_id=6699059
SSRN-Ranking des Papers liegt laut Autor bei rund 646.000
Vergleiche mit Adam, AdamW und Muon sind im Paper enthalten
Autor plant weitere Entwicklung und Verbesserung von STAM
Veröffentlicht von Einzelperson (/u/assemsabryy), kein institutioneller Hintergrund genannt

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

STAM: Neuer Deep-Learning-Optimizer soll Adam und Muon übertreffen

Frag die KI zum Artikel

Verwandte Beiträge

STAM: Neuer Deep-Learning-Optimizer soll Adam und Muon übertreffen

Frag die KI zum Artikel

Verwandte Beiträge