wird geladen

Qwen3.5-27B Uncensored Heretic mit 15 nativen MTPs in 5 Formaten veröffentlicht · Lumeric

Beitrag

LAUNCH

reddit.com· r/LocalLLaMA1mo

Qwen3.5-27B Uncensored Heretic mit 15 nativen MTPs in 5 Formaten veröffentlicht

ToolsQwen Hugging Face

CompaniesHugging Face

Warum es zählt

Wer Qwen3.5-27B lokal ohne Inhaltsbeschränkungen und mit vollem Multi-Token-Prediction-Support betreiben will, hat nun eine fertig quantisierte Auswahl an Formaten. Die genannten KL-Divergenz- und Genauigkeitsverlust-Werte helfen einzuschätzen, wie stark die Abliteration die Modellqualität beeinflusst.

— Lumeric Redaktion

Der Community-Nutzer LLMFan46 (llmfan46 auf HuggingFace) hat eine abliterierte Variante von Qwen3.5-27B unter dem Namen „Uncensored Heretic v2 Native MTP Preserved" veröffentlicht. Besonderes Merkmal ist die vollständige Erhaltung aller 15 nativen MTP-Köpfe (Multi-Token Prediction), die für schnellere Inferenz genutzt werden können. Das Modell steht in fünf Quantisierungsformaten bereit: Safetensors (Vollpräzision), GGUF, NVFP4, NVFP4-GGUF sowie GPTQ-Int4. Der Autor erklärt den Unterschied zwischen Qwen3.5 und Qwen3.6: Beide teilen dieselbe qwen35-Architektur, sind jedoch unterschiedlich trainiert – Qwen3.5 sei primär für allgemeine Assistenz optimiert, Qwen3.6 für agentische und Coding-Aufgaben. Relevant für Nutzer ist außerdem die Verhaltensdifferenz bei der Abliteration: Qwen3.5-27B erreicht trotz einer KL-Divergenz von 0.0308 nur einen Genauigkeitsverlust von 0.35%, während Qwen3.6-27B bei einer KL-Divergenz von 0.0021 bereits 0.98% Genauigkeit einbüßt. Qwen3.5-35B-A3B kommt auf eine KL-Divergenz von 0.0487 bei 0.40% Verlust. Ein Benchmark ist dem Release beigefügt.

Quelle lesenreddit.com

0.35% Genauigkeitsverlust

nach Abliteration bei Qwen3.5-27B

Open Source Foundation Modelle Inferenz Infra

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Verwandte Beiträge

LAUNCH

reddit.com· r/LocalLLaMA1mo

Qwen3.5-27B Uncensored Heretic mit 15 nativen MTPs in 5 Formaten veröffentlicht

ToolsQwen Hugging Face

CompaniesHugging Face

Warum es zählt

Wer Qwen3.5-27B lokal ohne Inhaltsbeschränkungen und mit vollem Multi-Token-Prediction-Support betreiben will, hat nun eine fertig quantisierte Auswahl an Formaten. Die genannten KL-Divergenz- und Genauigkeitsverlust-Werte helfen einzuschätzen, wie stark die Abliteration die Modellqualität beeinflusst.

— Lumeric Redaktion

Der Community-Nutzer LLMFan46 (llmfan46 auf HuggingFace) hat eine abliterierte Variante von Qwen3.5-27B unter dem Namen „Uncensored Heretic v2 Native MTP Preserved" veröffentlicht. Besonderes Merkmal ist die vollständige Erhaltung aller 15 nativen MTP-Köpfe (Multi-Token Prediction), die für schnellere Inferenz genutzt werden können. Das Modell steht in fünf Quantisierungsformaten bereit: Safetensors (Vollpräzision), GGUF, NVFP4, NVFP4-GGUF sowie GPTQ-Int4. Der Autor erklärt den Unterschied zwischen Qwen3.5 und Qwen3.6: Beide teilen dieselbe qwen35-Architektur, sind jedoch unterschiedlich trainiert – Qwen3.5 sei primär für allgemeine Assistenz optimiert, Qwen3.6 für agentische und Coding-Aufgaben. Relevant für Nutzer ist außerdem die Verhaltensdifferenz bei der Abliteration: Qwen3.5-27B erreicht trotz einer KL-Divergenz von 0.0308 nur einen Genauigkeitsverlust von 0.35%, während Qwen3.6-27B bei einer KL-Divergenz von 0.0021 bereits 0.98% Genauigkeit einbüßt. Qwen3.5-35B-A3B kommt auf eine KL-Divergenz von 0.0487 bei 0.40% Verlust. Ein Benchmark ist dem Release beigefügt.

0.35% Genauigkeitsverlust

nach Abliteration bei Qwen3.5-27B

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Verwandte Beiträge