Qwen3.5-27B Uncensored Heretic mit 15 nativen MTPs in 5 Formaten veröffentlicht
Der Community-Nutzer LLMFan46 (llmfan46 auf HuggingFace) hat eine abliterierte Variante von Qwen3.5-27B unter dem Namen „Uncensored Heretic v2 Native MTP Preserved" veröffentlicht. Besonderes Merkmal ist die vollständige Erhaltung aller 15 nativen MTP-Köpfe (Multi-Token Prediction), die für schnellere Inferenz genutzt werden können. Das Modell steht in fünf Quantisierungsformaten bereit: Safetensors (Vollpräzision), GGUF, NVFP4, NVFP4-GGUF sowie GPTQ-Int4. Der Autor erklärt den Unterschied zwischen Qwen3.5 und Qwen3.6: Beide teilen dieselbe qwen35-Architektur, sind jedoch unterschiedlich trainiert – Qwen3.5 sei primär für allgemeine Assistenz optimiert, Qwen3.6 für agentische und Coding-Aufgaben. Relevant für Nutzer ist außerdem die Verhaltensdifferenz bei der Abliteration: Qwen3.5-27B erreicht trotz einer KL-Divergenz von 0.0308 nur einen Genauigkeitsverlust von 0.35%, während Qwen3.6-27B bei einer KL-Divergenz von 0.0021 bereits 0.98% Genauigkeit einbüßt. Qwen3.5-35B-A3B kommt auf eine KL-Divergenz von 0.0487 bei 0.40% Verlust. Ein Benchmark ist dem Release beigefügt.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Qwen3.5-27B Uncensored Heretic mit 15 nativen MTPs in 5 Formaten veröffentlicht
Der Community-Nutzer LLMFan46 (llmfan46 auf HuggingFace) hat eine abliterierte Variante von Qwen3.5-27B unter dem Namen „Uncensored Heretic v2 Native MTP Preserved" veröffentlicht. Besonderes Merkmal ist die vollständige Erhaltung aller 15 nativen MTP-Köpfe (Multi-Token Prediction), die für schnellere Inferenz genutzt werden können. Das Modell steht in fünf Quantisierungsformaten bereit: Safetensors (Vollpräzision), GGUF, NVFP4, NVFP4-GGUF sowie GPTQ-Int4. Der Autor erklärt den Unterschied zwischen Qwen3.5 und Qwen3.6: Beide teilen dieselbe qwen35-Architektur, sind jedoch unterschiedlich trainiert – Qwen3.5 sei primär für allgemeine Assistenz optimiert, Qwen3.6 für agentische und Coding-Aufgaben. Relevant für Nutzer ist außerdem die Verhaltensdifferenz bei der Abliteration: Qwen3.5-27B erreicht trotz einer KL-Divergenz von 0.0308 nur einen Genauigkeitsverlust von 0.35%, während Qwen3.6-27B bei einer KL-Divergenz von 0.0021 bereits 0.98% Genauigkeit einbüßt. Qwen3.5-35B-A3B kommt auf eine KL-Divergenz von 0.0487 bei 0.40% Verlust. Ein Benchmark ist dem Release beigefügt.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.