Lazarus AI veröffentlicht ReAligned-Qwen3.5 – Qwen ohne chinesische Zensur
Eric Hartford, bekannt als Ersteller der Dolphin- und Samantha-Modell-Serien, hat gemeinsam mit Lazarus AI die ReAligned-Qwen3.5-Reihe veröffentlicht. Ziel ist es, die in Qwen3.5-Basismodellen enthaltene chinesische ideologische Ausrichtung, Zensur und staatliche Narrativ-Rahmung durch gezieltes Fine-Tuning zu entfernen. Technisch setzt Hartford auf eine SFT+GRPO-Pipeline: Zunächst wird ein speziell kuratierter Datensatz eingesetzt, der auf eine Taxonomie chinesischer Zensur- und Bias-Muster ausgelegt ist; als GRPO-Reward-Signal dient dabei ein eigens trainierter ReAligned-Classifier. Die Modellreihe umfasst sechs Größen – 0.8B, 2B, 4B, 9B, 27B sowie 35B-A3B (MoE) – und steht in den Formaten BF16, FP8 und GGUF auf HuggingFace zur Verfügung. Alle Modelle sind unter Apache 2.0 lizenziert, also auch für kommerzielle Nutzung freigegeben. Das Projekt ist auf der Lazarus-AI-Plattform sowie als HuggingFace Collection veröffentlicht.
- SFT + GRPO Pipeline mit eigenem ReAligned-Classifier als Reward-Signal
- Datensatz gezielt nach Taxonomie chinesischer Zensur- und Bias-Muster kuratiert
- Sechs Modellgrößen: 0.8B, 2B, 4B, 9B, 27B, 35B-A3B (MoE)
- Verfügbar als BF16, FP8 und GGUF auf HuggingFace
- Apache-2.0-Lizenz – auch kommerzielle Nutzung erlaubt
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Lazarus AI veröffentlicht ReAligned-Qwen3.5 – Qwen ohne chinesische Zensur
Eric Hartford, bekannt als Ersteller der Dolphin- und Samantha-Modell-Serien, hat gemeinsam mit Lazarus AI die ReAligned-Qwen3.5-Reihe veröffentlicht. Ziel ist es, die in Qwen3.5-Basismodellen enthaltene chinesische ideologische Ausrichtung, Zensur und staatliche Narrativ-Rahmung durch gezieltes Fine-Tuning zu entfernen. Technisch setzt Hartford auf eine SFT+GRPO-Pipeline: Zunächst wird ein speziell kuratierter Datensatz eingesetzt, der auf eine Taxonomie chinesischer Zensur- und Bias-Muster ausgelegt ist; als GRPO-Reward-Signal dient dabei ein eigens trainierter ReAligned-Classifier. Die Modellreihe umfasst sechs Größen – 0.8B, 2B, 4B, 9B, 27B sowie 35B-A3B (MoE) – und steht in den Formaten BF16, FP8 und GGUF auf HuggingFace zur Verfügung. Alle Modelle sind unter Apache 2.0 lizenziert, also auch für kommerzielle Nutzung freigegeben. Das Projekt ist auf der Lazarus-AI-Plattform sowie als HuggingFace Collection veröffentlicht.
- SFT + GRPO Pipeline mit eigenem ReAligned-Classifier als Reward-Signal
- Datensatz gezielt nach Taxonomie chinesischer Zensur- und Bias-Muster kuratiert
- Sechs Modellgrößen: 0.8B, 2B, 4B, 9B, 27B, 35B-A3B (MoE)
- Verfügbar als BF16, FP8 und GGUF auf HuggingFace
- Apache-2.0-Lizenz – auch kommerzielle Nutzung erlaubt
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.