Community-Fine-Tune von Qwen3.6 27B mit 75 % Human-Alignment veröffentlicht
Reddit-Nutzer /u/de4dee hat nach eigenen Angaben über zwei Jahre Erfahrung im Fine-Tuning von Sprachmodellen gesammelt und sein bisher bestes Ergebnis mit einem auf Qwen3.6 27B basierenden Fine-Tune erzielt. Als primäres Werkzeug setzt er Unsloth ein. Der zentrale Fortschritt gegenüber dem Vorgänger-Fine-Tune auf Qwen 3.5 liegt in verbesserten Dataset-Expansion-Tricks, die das Human-Alignment-Ergebnis von 73 % auf 75 % steigerten. Bewertet wird das Modell ausschließlich anhand selbst entwickelter Evals, da nach Aussage des Autors kaum andere Personen in diesem spezifischen Bereich arbeiten. Das Fine-Tune wurde öffentlich hochgeladen; der Autor sucht aktiv nach Community-Feedback.
- Trainings-Tool: primär Unsloth, über 2 Jahre Fine-Tuning-Erfahrung
- Human-Alignment: 75 % (Vorgänger auf Qwen 3.5: 73 %)
- Evaluierung ausschließlich über eigene, selbst entwickelte Benchmarks
- Modell ist öffentlich hochgeladen, Feedback über r/LocalLLaMA erbeten
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com0mo
Llama 3.3 70B vs. Qwen3: Community debattiert Fine-Tuning-Eignung
- FORSCHUNGreddit.com13h
Qwen2.5-7B auf 96 % von Claude Haiku fine-getuned – für ~3 $ API-Kosten
- LAUNCHreddit.com0mo
0G AI veröffentlicht 0GM-1.0-35B-A3B-0427: Qwen3-Finetune mit Blockchain-Inferenz
- MEINUNGreddit.com16h
Nutzerbericht: Neuere Qwen-Modelle schwächer bei Textzusammenfassungen
Community-Fine-Tune von Qwen3.6 27B mit 75 % Human-Alignment veröffentlicht
Reddit-Nutzer /u/de4dee hat nach eigenen Angaben über zwei Jahre Erfahrung im Fine-Tuning von Sprachmodellen gesammelt und sein bisher bestes Ergebnis mit einem auf Qwen3.6 27B basierenden Fine-Tune erzielt. Als primäres Werkzeug setzt er Unsloth ein. Der zentrale Fortschritt gegenüber dem Vorgänger-Fine-Tune auf Qwen 3.5 liegt in verbesserten Dataset-Expansion-Tricks, die das Human-Alignment-Ergebnis von 73 % auf 75 % steigerten. Bewertet wird das Modell ausschließlich anhand selbst entwickelter Evals, da nach Aussage des Autors kaum andere Personen in diesem spezifischen Bereich arbeiten. Das Fine-Tune wurde öffentlich hochgeladen; der Autor sucht aktiv nach Community-Feedback.
- Trainings-Tool: primär Unsloth, über 2 Jahre Fine-Tuning-Erfahrung
- Human-Alignment: 75 % (Vorgänger auf Qwen 3.5: 73 %)
- Evaluierung ausschließlich über eigene, selbst entwickelte Benchmarks
- Modell ist öffentlich hochgeladen, Feedback über r/LocalLLaMA erbeten
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com0mo
Llama 3.3 70B vs. Qwen3: Community debattiert Fine-Tuning-Eignung
- FORSCHUNGreddit.com13h
Qwen2.5-7B auf 96 % von Claude Haiku fine-getuned – für ~3 $ API-Kosten
- LAUNCHreddit.com0mo
0G AI veröffentlicht 0GM-1.0-35B-A3B-0427: Qwen3-Finetune mit Blockchain-Inferenz
- MEINUNGreddit.com16h
Nutzerbericht: Neuere Qwen-Modelle schwächer bei Textzusammenfassungen