Unsloth und Mistral beheben Inferenz-Bug in Mistral Medium 3.5
Unsloth hat gemeinsam mit Mistral einen Implementierungsfehler in Mistral Medium 3.5 behoben, der mehrere Frameworks betraf. Ursache war ein YaRN-Parsing-Fehler: Der Parameter mscale_all_dim musste von 1 auf 0 gesetzt werden.
Mistral Medium 3.5 128B vs. Qwen 3.5 122B: Benchmarks auf 4× RTX 3080
Community-Benchmark zeigt Performance von Mistral Medium 3.5 (128B) und Qwen 3.5 (122B MoE) auf 4× RTX 3080 20GB mit llama.cpp. Tensor Parallel bringt bei Mistral ~2× Speedup in der Textgenerierung gegenüber Layer Split.

Mistral-CEO Mensch warnt Frankreich vor Anthropics Mythos in Militär-Codebases
Mistral-CEO Arthur Mensch mahnt zur Vorsicht: Frankreichs militärische Codebasen sollten nicht von US-KI-Modellen wie Anthropics Mythos gescannt werden. Zudem schließt Mensch einen Verkauf von Mistral aus und strebt stattdessen einen Börsengang an.

Mistral Medium 3.5 vereint Chat, Reasoning und Code in einem Modell
Mistral veröffentlicht Mistral Medium 3.5 als neues Flaggschiff-Modell, das bisher getrennte Modelle für Chat, Reasoning und Code zusammenführt. Zudem erhält das Coding-Tool Vibe asynchrone Cloud-Agenten und Le Chat einen neuen Agenten-Modus.

Mistral AI launcht Workflows für Enterprise-KI-Orchestrierung
Mistral AI führt „Workflows" ein, eine Orchestrierungsebene, die Unternehmen dabei hilft, KI-gestützte Prozesse in produktionsreife Systeme zu überführen.

Mistral benennt Le Chat in Vibe um und startet Work-Agent-Modus
Mistral AI benennt seinen Chatbot Le Chat in Vibe um und integriert Chat, Coding-Agenten und einen neuen Work Mode unter einer Marke. Der Work Mode verbindet sich mit Google Workspace, Outlook, Slack und GitHub und erledigt Aufgaben wie E-Mails oder Pull Requests eigenständig.

Mistral AI übernimmt Wiener Physical-AI-Startup Emmi AI
Mistral AI hat das Wiener Startup Emmi AI akquiriert, um sein Angebot für Industriekunden in Europa auszubauen.
Mistral-Medium-3.5-128B läuft lokal auf 3× RTX 3090 mit Q3_K_M
Community-Mitglied demonstriert die praktische Ausführung von Mistral Medium 3.5 (128B) mit Q3_K_M-Quantisierung auf drei RTX 3090 GPUs (72 GB VRAM) und dokumentiert die Inferenzgeschwindigkeit anhand mehrerer Code-Szenarien.
Mistral Medium 3.5 128B: Fehlerhafte GGUF-Dateien bei Unsloth korrigiert
Alle GGUF-Quantisierungen von Mistral Medium 3.5 128B auf Unsloth waren fehlerhaft und lieferten schlechte Outputs – besonders bei langem Kontext. Der Fehler ist nun behoben.

SAP nutzt Mistral AI für S/4HANA-Migrationshilfe bei 30.000 SBB-Mitarbeitern
SAP setzt Mistral-AI-Modelle ein, um Kunden bei der Migration auf S/4HANA zu unterstützen. Bei den Schweizerischen Bundesbahnen beantwortet ein mehrsprachiger RAG-Chatbot Fragen von 30.000 Mitarbeitenden zur Software-Umstellung.
Mistral Medium 3.5 auf AMD Strix Halo: 2 Stunden für 48k-Token-Prompt
Ein Nutzer testete Mistral Medium 3.5 (128B) auf AMD Strix Halo und erreichte nur 9,76 Token/s bei Prompt-Verarbeitung und 2,1 Token/s beim Denken – insgesamt 2 Stunden für einen 48k-Token-Prompt mit Extended-Thinking.

Mistral Le Chat verbreitet Iran-Kriegsdesinformation in 60 % der Fälle
Ein NewsGuard-Audit zeigt, dass Mistrals Le Chat staatlich gesponserte Desinformation zum Iran-Krieg in rund 60 % der getesteten Prompts wiederholt – bei manipulativen Formulierungen steigt die Fehlerrate auf 80 %.
Europe has 2 years to stop becoming America's AI 'vassal state'.

Mistrals Voxtral TTS: Hybrid-Architektur für ausdrucksstarke mehrsprachige Sprachklone
Mistral stellt Voxtral TTS vor, ein Text-to-Speech-System mit hybrider autoregressive und Flow-Matching-Architektur, das die „Expressivity Gap" schließen soll – das Problem mangelnder emotionaler Nuancen in bisherigen Sprachsynthesen.
llama.cpp vs. vLLM: Mistral-Medium-3.5 128B auf 4× RTX 3090 optimieren
Ein Nutzer erzielt mit Mistral Medium 3.5 128B (Q4_K_XL) auf 4× RTX 3090 via llama.cpp nur ~11 t/s und fragt, ob vLLM mit quantisierten Modellen und vertretbarem VRAM-Verbrauch schneller wäre.
Vision-Fähigkeiten per Pixtral-Encoder in reine Text-Modelle einpfropfen
Ein Reddit-Nutzer zeigt, wie man mit llama.cpp und Mistral-Pixtral-Vision-Encodern Bildverarbeitung in Textmodelle wie Behemoth-X einbauen kann – inklusive nötigem Patch in mtmd.cpp für den [IMG_END]-Token.