Omi Med STT v1: Fine-tuned Parakeet 0.6B für medizinische Spracherkennung, Open Weights
Warum es zählt
Patientenaudio muss das Gerät nicht verlassen: Das 0.6B-Modell erreicht 145× RTFx auf einer A10-GPU, schlägt Deepgram Nova-3 Medical und Corti auf M-WER und halbiert die WER gegenüber dem Basis-Modell. Für lokale Medizin-Scribe-Anwendungen ist das ein direkt nutzbarer Open-Weights-Einstiegspunkt.
— Lumeric Redaktion
Medical-WER (M-WER) – 1.513 klinische Clips / 7,18 h · Spitzenwert
1.78%
VibeVoice-ASR 9B
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com4h
Streaming-Medizin-STT läuft lokal auf MacBook via MLX
- GERÜCHTreddit.com3w
Tongyi Labs veröffentlicht STT- und TTS-Modelle mit Spitzenwerten
- LAUNCHreddit.com2w
Dockerized Nemotron 3.5 ASR: 4,5× Echtzeit-Speed auf CPU mit Streaming
- LAUNCHreddit.com3d
650+ Apache-2.0 Biomedizin-NER-Modelle laufen 30–40× schneller via MLX auf Apple Silicon
Omi Med STT v1: Fine-tuned Parakeet 0.6B für medizinische Spracherkennung, Open Weights
Warum es zählt
Patientenaudio muss das Gerät nicht verlassen: Das 0.6B-Modell erreicht 145× RTFx auf einer A10-GPU, schlägt Deepgram Nova-3 Medical und Corti auf M-WER und halbiert die WER gegenüber dem Basis-Modell. Für lokale Medizin-Scribe-Anwendungen ist das ein direkt nutzbarer Open-Weights-Einstiegspunkt.
— Lumeric Redaktion
Medical-WER (M-WER) – 1.513 klinische Clips / 7,18 h · Spitzenwert
1.78%
VibeVoice-ASR 9B
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com4h
Streaming-Medizin-STT läuft lokal auf MacBook via MLX
- GERÜCHTreddit.com3w
Tongyi Labs veröffentlicht STT- und TTS-Modelle mit Spitzenwerten
- LAUNCHreddit.com2w
Dockerized Nemotron 3.5 ASR: 4,5× Echtzeit-Speed auf CPU mit Streaming
- LAUNCHreddit.com3d
650+ Apache-2.0 Biomedizin-NER-Modelle laufen 30–40× schneller via MLX auf Apple Silicon