wird geladen

Qwen3.6 27B Uncensored Heretic v2 mit Native MTP und KLD 0.0021 veröffentlicht · Lumeric

Beitrag

LAUNCH

reddit.com· r/LocalLLaMA3w

Qwen3.6 27B Uncensored Heretic v2 mit Native MTP und KLD 0.0021 veröffentlicht

ToolsQwen Hugging Face

CompaniesHugging Face

Warum es zählt

Das Modell kombiniert minimale Zensur (6 % Refusal-Rate) mit nahezu unveränderter Ausgabeverteilung (KLD 0.0021) und voll erhaltenen MTP-Köpfen für schnelleres Decoding – relevant für lokale Deployments, die Geschwindigkeit und Unzensierheit kombinieren wollen.

— Lumeric Redaktion

Der Reddit-Nutzer LLMFan46 hat mit Qwen3.6-27B-uncensored-heretic-v2 eine entsicherte Feinabstimmung des Qwen3.6-27B-Modells veröffentlicht, die sich durch drei Kernmerkmale auszeichnet: eine sehr geringe KL-Divergenz von 0.0021 zum Originalmodell (was minimale Qualitätsverluste durch das Uncensoring impliziert), eine Refusal-Rate von lediglich 6 von 100 Testprompts sowie den vollständigen Erhalt aller 15 nativen Multi-Token-Prediction (MTP)-Köpfe. Letztere ermöglichen spekulatives Decoding mit höherem Durchsatz. Das Modell ist in fünf Varianten auf HuggingFace verfügbar: Safetensors, GGUF, NVFP4, NVFP4-GGUF sowie eine MLP-Only-NVFP4-Variante. Alle Versionen wurden laut Autor auf das vollständige Vorhandensein der 15 MTP-Köpfe geprüft. Ein eigenes Benchmark wird mitgeliefert. Die Veröffentlichung richtet sich an die Local-LLM-Community, die zensurfreie Modelle mit möglichst geringer Abweichung vom Originalverhalten sucht.

Quelle lesenreddit.com

KLD 0.0021

KL-Divergenz zum Basismodell

Open Source Foundation Modelle Inferenz Infra

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Verwandte Beiträge

LAUNCH

reddit.com· r/LocalLLaMA3w

Qwen3.6 27B Uncensored Heretic v2 mit Native MTP und KLD 0.0021 veröffentlicht

ToolsQwen Hugging Face

CompaniesHugging Face

Warum es zählt

Das Modell kombiniert minimale Zensur (6 % Refusal-Rate) mit nahezu unveränderter Ausgabeverteilung (KLD 0.0021) und voll erhaltenen MTP-Köpfen für schnelleres Decoding – relevant für lokale Deployments, die Geschwindigkeit und Unzensierheit kombinieren wollen.

— Lumeric Redaktion

Der Reddit-Nutzer LLMFan46 hat mit Qwen3.6-27B-uncensored-heretic-v2 eine entsicherte Feinabstimmung des Qwen3.6-27B-Modells veröffentlicht, die sich durch drei Kernmerkmale auszeichnet: eine sehr geringe KL-Divergenz von 0.0021 zum Originalmodell (was minimale Qualitätsverluste durch das Uncensoring impliziert), eine Refusal-Rate von lediglich 6 von 100 Testprompts sowie den vollständigen Erhalt aller 15 nativen Multi-Token-Prediction (MTP)-Köpfe. Letztere ermöglichen spekulatives Decoding mit höherem Durchsatz. Das Modell ist in fünf Varianten auf HuggingFace verfügbar: Safetensors, GGUF, NVFP4, NVFP4-GGUF sowie eine MLP-Only-NVFP4-Variante. Alle Versionen wurden laut Autor auf das vollständige Vorhandensein der 15 MTP-Köpfe geprüft. Ein eigenes Benchmark wird mitgeliefert. Die Veröffentlichung richtet sich an die Local-LLM-Community, die zensurfreie Modelle mit möglichst geringer Abweichung vom Originalverhalten sucht.

KLD 0.0021

KL-Divergenz zum Basismodell

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Verwandte Beiträge