Unsloth und Mistral beheben Inferenz-Bug in Mistral Medium 3.5

Warum es zählt

Wer Mistral Medium 3.5 über transformers, llama.cpp oder andere betroffene Implementierungen nutzt, sollte auf die aktualisierten GGUFs wechseln – der Bug beeinträchtigte die Inferenzqualität und war nicht auf Unsloth-Quants beschränkt.

— Lumeric Redaktion

Am 1. Mai 2026 veröffentlichte Unsloth ein Update, das einen Inferenzfehler in Mistral Medium 3.5 adressiert, der in mehreren verbreiteten Implementierungen auftrat – darunter Hugging Face transformers und llama.cpp. Der Bug war nicht auf Unsloth oder dessen Quantisierungen zurückzuführen, sondern auf eine Eigenheit beim Parsen von YaRN-Parametern (Yet another RoPE extensioN), die für Long-Context-Unterstützung zuständig sind. Konkret war der Parameter mscale_all_dim fälschlicherweise auf 1 gesetzt; das Setzen auf 0 behebt das Problem. Unsloth hat aktualisierte GGUF-Dateien mit dem Fix veröffentlicht und dabei zusätzlich einen separaten Fehler bei der Generierung von mmproj-Dateien (Multimodal-Projektionsdateien) korrigiert. Die Zusammenarbeit mit Mistral deutet darauf hin, dass der Fix auch upstream in die offiziellen Modellkonfigurationen einfließen soll.

Was wir noch wissen

Bug betraf mehrere Frameworks gleichzeitig: transformers, llama.cpp und weitere Implementierungen.
Fix: YaRN-Parameter mscale_all_dim von 1 auf 0 geändert — nicht modellspezifisch für Unsloth-Quants.
Unsloth hat aktualisierte GGUF-Dateien mit dem Bugfix veröffentlicht.
Zusätzlich wurde ein Fehler bei der Generierung von mmproj-Dateien (Multimodal) behoben.
Fix entstand in Kooperation zwischen Unsloth und Mistral.

Quelle lesenreddit.com

Foundation Modelle Inferenz Infra Open Source

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Unsloth und Mistral beheben Inferenz-Bug in Mistral Medium 3.5

ToolsMistral Llama Hugging Face

CompaniesHugging Face Mistral AI

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Bug betraf mehrere Frameworks gleichzeitig: transformers, llama.cpp und weitere Implementierungen.
Fix: YaRN-Parameter mscale_all_dim von 1 auf 0 geändert — nicht modellspezifisch für Unsloth-Quants.
Unsloth hat aktualisierte GGUF-Dateien mit dem Bugfix veröffentlicht.
Zusätzlich wurde ein Fehler bei der Generierung von mmproj-Dateien (Multimodal) behoben.
Fix entstand in Kooperation zwischen Unsloth und Mistral.

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Unsloth und Mistral beheben Inferenz-Bug in Mistral Medium 3.5

Frag die KI zum Artikel

Verwandte Beiträge

Unsloth und Mistral beheben Inferenz-Bug in Mistral Medium 3.5

Frag die KI zum Artikel

Verwandte Beiträge