Qwen3 35B-A3B GGUF: Uncensored-Merge mit Claude-4.6-Opus-Distillation
Das Modell wurde vom Reddit-Nutzer /u/EvilEnginer als Community-Release veröffentlicht und baut auf einem vorherigen Release aus der LocalLLaMA-Community auf (Qwen3.6-35B-A3B-Uncensored-Genesis-APEX-MTP), das ebenfalls via Delta-Merge entstanden ist. Die Distillation basiert auf Datensätzen, die mit Claude 4.6 Opus erzeugt wurden – dem zu diesem Zeitpunkt aktuellen Anthropic-Flaggschiff-Modell – und soll den Thinking-Mode qualitativ verbessern, ohne dass eine API-Anbindung an Anthropic nötig ist. Ein technisches Detail aus der Veröffentlichung: Der Distillations-Datensatz verwendet als erste System-Prompt-Zeile zwingend „You are a helpful AI assistant.", weshalb der Autor empfiehlt, das Modell stets mit dieser Einleitung zu starten – ohne sie soll die Leistung spürbar nachlassen. Das GGUF-Modell wird in mindestens zwei Quantisierungsstufen angeboten: APEX (Empfehlung) und APEX Compact (Q4_K_M), das auch auf schwächerer Hardware lauffähig bleibt. Für LM Studio werden spezifische Chat-Templates (chat_template.jinja, chat_template_thinking.jinja) sowie zwei vorkonfigurierte System-Prompt-Dateien mitgeliefert, darunter ein kreatives Profil namens „Arakali". Die empfohlenen Inferenz-Parameter sind detailliert dokumentiert: Temperature 0,7 für Coding und 1,0 für Roleplay, Top-K 20, Top-P 0,8, Repeat Penalty 1,0 und ein fester Seed von 42.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2w
Qwen3-35B-A3B mit Claude-4.7-Reasoning als APEX-MTP-GGUF veröffentlicht
- LAUNCHreddit.com3w
Qwen3.6-35B-A3B-Uncensored mit MTP-Support und APEX-Quantisierung veröffentlicht
- LAUNCHreddit.com3w
Qwen3.5-27B Uncensored Heretic mit 15 nativen MTPs in 5 Formaten veröffentlicht
- LAUNCHreddit.com3d
Qwable-v1: Open-Weights-Distillat von Anthropics Fable-5 auf Qwen3.6-Basis
Qwen3 35B-A3B GGUF: Uncensored-Merge mit Claude-4.6-Opus-Distillation
Das Modell wurde vom Reddit-Nutzer /u/EvilEnginer als Community-Release veröffentlicht und baut auf einem vorherigen Release aus der LocalLLaMA-Community auf (Qwen3.6-35B-A3B-Uncensored-Genesis-APEX-MTP), das ebenfalls via Delta-Merge entstanden ist. Die Distillation basiert auf Datensätzen, die mit Claude 4.6 Opus erzeugt wurden – dem zu diesem Zeitpunkt aktuellen Anthropic-Flaggschiff-Modell – und soll den Thinking-Mode qualitativ verbessern, ohne dass eine API-Anbindung an Anthropic nötig ist. Ein technisches Detail aus der Veröffentlichung: Der Distillations-Datensatz verwendet als erste System-Prompt-Zeile zwingend „You are a helpful AI assistant.", weshalb der Autor empfiehlt, das Modell stets mit dieser Einleitung zu starten – ohne sie soll die Leistung spürbar nachlassen. Das GGUF-Modell wird in mindestens zwei Quantisierungsstufen angeboten: APEX (Empfehlung) und APEX Compact (Q4_K_M), das auch auf schwächerer Hardware lauffähig bleibt. Für LM Studio werden spezifische Chat-Templates (chat_template.jinja, chat_template_thinking.jinja) sowie zwei vorkonfigurierte System-Prompt-Dateien mitgeliefert, darunter ein kreatives Profil namens „Arakali". Die empfohlenen Inferenz-Parameter sind detailliert dokumentiert: Temperature 0,7 für Coding und 1,0 für Roleplay, Top-K 20, Top-P 0,8, Repeat Penalty 1,0 und ein fester Seed von 42.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2w
Qwen3-35B-A3B mit Claude-4.7-Reasoning als APEX-MTP-GGUF veröffentlicht
- LAUNCHreddit.com3w
Qwen3.6-35B-A3B-Uncensored mit MTP-Support und APEX-Quantisierung veröffentlicht
- LAUNCHreddit.com3w
Qwen3.5-27B Uncensored Heretic mit 15 nativen MTPs in 5 Formaten veröffentlicht
- LAUNCHreddit.com3d
Qwable-v1: Open-Weights-Distillat von Anthropics Fable-5 auf Qwen3.6-Basis