Qwen3.6 27B Uncensored Heretic v2 mit Native MTP und KLD 0.0021 veröffentlicht
Der Reddit-Nutzer LLMFan46 hat mit Qwen3.6-27B-uncensored-heretic-v2 eine entsicherte Feinabstimmung des Qwen3.6-27B-Modells veröffentlicht, die sich durch drei Kernmerkmale auszeichnet: eine sehr geringe KL-Divergenz von 0.0021 zum Originalmodell (was minimale Qualitätsverluste durch das Uncensoring impliziert), eine Refusal-Rate von lediglich 6 von 100 Testprompts sowie den vollständigen Erhalt aller 15 nativen Multi-Token-Prediction (MTP)-Köpfe. Letztere ermöglichen spekulatives Decoding mit höherem Durchsatz. Das Modell ist in fünf Varianten auf HuggingFace verfügbar: Safetensors, GGUF, NVFP4, NVFP4-GGUF sowie eine MLP-Only-NVFP4-Variante. Alle Versionen wurden laut Autor auf das vollständige Vorhandensein der 15 MTP-Köpfe geprüft. Ein eigenes Benchmark wird mitgeliefert. Die Veröffentlichung richtet sich an die Local-LLM-Community, die zensurfreie Modelle mit möglichst geringer Abweichung vom Originalverhalten sucht.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Qwen3.6 27B Uncensored Heretic v2 mit Native MTP und KLD 0.0021 veröffentlicht
Der Reddit-Nutzer LLMFan46 hat mit Qwen3.6-27B-uncensored-heretic-v2 eine entsicherte Feinabstimmung des Qwen3.6-27B-Modells veröffentlicht, die sich durch drei Kernmerkmale auszeichnet: eine sehr geringe KL-Divergenz von 0.0021 zum Originalmodell (was minimale Qualitätsverluste durch das Uncensoring impliziert), eine Refusal-Rate von lediglich 6 von 100 Testprompts sowie den vollständigen Erhalt aller 15 nativen Multi-Token-Prediction (MTP)-Köpfe. Letztere ermöglichen spekulatives Decoding mit höherem Durchsatz. Das Modell ist in fünf Varianten auf HuggingFace verfügbar: Safetensors, GGUF, NVFP4, NVFP4-GGUF sowie eine MLP-Only-NVFP4-Variante. Alle Versionen wurden laut Autor auf das vollständige Vorhandensein der 15 MTP-Köpfe geprüft. Ein eigenes Benchmark wird mitgeliefert. Die Veröffentlichung richtet sich an die Local-LLM-Community, die zensurfreie Modelle mit möglichst geringer Abweichung vom Originalverhalten sucht.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.