Whisper — April 2026
2 Beiträge im April 2026.
- LAUNCH29. Apr.smol-audio: Colab-Notebook-Sammlung zum Fine-Tuning von Whisper, Voxtral und Co.Praktiker erhalten einen niedrigschwelligen Einstieg ins Audio-Modell-Fine-Tuning ohne eigene GPU-Infrastruktur. Die Sammlung deckt mehrere Modellarchitekturen ab und reduziert den Aufwand für Sprach-KI-Experimente erheblich.
- LAUNCH27. Apr.Microsoft VibeVoice: Whisper-Alternative mit Speaker-Diarization, MIT-lizenziertVibeVoice läuft lokal per One-Liner mit uv und mlx-audio, liefert zeitgestempeltes JSON mit Speaker-IDs und ist damit eine praktische Alternative zu Cloud-STT-Diensten – jedoch auf max. 1 Stunde Audio pro Lauf begrenzt.