SFT verschlechtert Instruction-Following bei 1B- und 2B-Modellen laut IFEval

Warum es zählt

Wer kleine Modelle unter 2B Parametern per SFT auf Instruction-Following trimmt, riskiert laut diesen Ergebnissen eine Regression – die Wahl der Lernrate (5e-5 vs. 2e-4) könnte dabei ebenso entscheidend sein wie die Modellgröße.

— Lumeric Redaktion

Der Reddit-Nutzer GPUburnout trainierte drei eigene Sprachmodelle mit 1B, 2B und 3B Parametern von Grund auf und wendete anschließend dieselbe SFT-Konfiguration an: SlimOrca 50K Datensatz, LoRA mit Rang 16, 1 Epoche. Die IFEval-Scores zeigen ein klares Muster: Das 1B-Modell verschlechterte sich von 20,50 auf 14,75 (−5,75 Punkte), das 2B-Modell von 21,94 auf 17,03 (−4,91 Punkte). Lediglich das 3B-Modell verbesserte sich von 23,14 auf 25,18 (+2,04 Punkte). Ein wesentlicher Unterschied im Setup: Das 3B-Modell wurde mit einer niedrigeren Lernrate von 5e-5 trainiert, während 1B und 2B mit 2e-4 trainiert wurden. Ob die Regression also auf fehlende Modellkapazität oder die zu hohe Lernrate zurückzuführen ist, bleibt offen – der Autor kündigt an, das 2B-Modell mit lr=5e-5 erneut zu trainieren. Der Beitrag löste eine Community-Diskussion darüber aus, ob IFEval-Regression nach SFT bei kleinen Modellen ein bekanntes Phänomen ist.

Quelle lesenreddit.com

IFEval (nach SFT mit SlimOrca 50K) · Spitzenwert

14.75%

1B (nach SFT)

Post Training Evals Benchmarks Foundation Modelle

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

SFT verschlechtert Instruction-Following bei 1B- und 2B-Modellen laut IFEval

Warum es zählt

— Lumeric Redaktion

IFEval (nach SFT mit SlimOrca 50K) · Spitzenwert

14.75%

1B (nach SFT)

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

SFT verschlechtert Instruction-Following bei 1B- und 2B-Modellen laut IFEval

Frag die KI zum Artikel

Verwandte Beiträge

SFT verschlechtert Instruction-Following bei 1B- und 2B-Modellen laut IFEval

Frag die KI zum Artikel

Verwandte Beiträge