Community-Fine-Tune von Qwen3.6 27B mit 75 % Human-Alignment veröffentlicht

Warum es zählt

Das Modell zeigt, dass Community-seitige Dataset-Expansion-Techniken mit Unsloth messbare Qualitätssteigerungen bei Human-Alignment erzielen können – relevant für alle, die eigene Fine-Tunes auf Basis aktueller Qwen-Modelle entwickeln.

— Lumeric Redaktion

Reddit-Nutzer /u/de4dee hat nach eigenen Angaben über zwei Jahre Erfahrung im Fine-Tuning von Sprachmodellen gesammelt und sein bisher bestes Ergebnis mit einem auf Qwen3.6 27B basierenden Fine-Tune erzielt. Als primäres Werkzeug setzt er Unsloth ein. Der zentrale Fortschritt gegenüber dem Vorgänger-Fine-Tune auf Qwen 3.5 liegt in verbesserten Dataset-Expansion-Tricks, die das Human-Alignment-Ergebnis von 73 % auf 75 % steigerten. Bewertet wird das Modell ausschließlich anhand selbst entwickelter Evals, da nach Aussage des Autors kaum andere Personen in diesem spezifischen Bereich arbeiten. Das Fine-Tune wurde öffentlich hochgeladen; der Autor sucht aktiv nach Community-Feedback.

Was wir noch wissen

Trainings-Tool: primär Unsloth, über 2 Jahre Fine-Tuning-Erfahrung
Human-Alignment: 75 % (Vorgänger auf Qwen 3.5: 73 %)
Evaluierung ausschließlich über eigene, selbst entwickelte Benchmarks
Modell ist öffentlich hochgeladen, Feedback über r/LocalLLaMA erbeten

Quelle lesenreddit.com

75% Human Alignment

auf eigenen Evals (vorher 73 %)

Open Source Post Training Foundation Modelle

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Community-Fine-Tune von Qwen3.6 27B mit 75 % Human-Alignment veröffentlicht

ToolsQwen

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Trainings-Tool: primär Unsloth, über 2 Jahre Fine-Tuning-Erfahrung
Human-Alignment: 75 % (Vorgänger auf Qwen 3.5: 73 %)
Evaluierung ausschließlich über eigene, selbst entwickelte Benchmarks
Modell ist öffentlich hochgeladen, Feedback über r/LocalLLaMA erbeten

75% Human Alignment

auf eigenen Evals (vorher 73 %)

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Community-Fine-Tune von Qwen3.6 27B mit 75 % Human-Alignment veröffentlicht

Frag die KI zum Artikel

Verwandte Beiträge

Community-Fine-Tune von Qwen3.6 27B mit 75 % Human-Alignment veröffentlicht

Frag die KI zum Artikel

Verwandte Beiträge