
IBM veröffentlicht zwei Granite Speech 4.1 2B Modelle für Enterprise-ASR
IBM hat mit Granite Speech 4.1 2B zwei kompakte automatische Spracherkennungsmodelle (ASR) veröffentlicht, die auf Enterprise-Anwendungen ausgerichtet sind. Das erste Modell arbeitet autoregressive und unterstützt neben der Transkription auch Sprachübersetzung. Das zweite Modell ist sein nicht-autoregressives Pendant und setzt auf einen Editing-Ansatz, der deutlich schnellere Inferenzzeiten ermöglichen soll. Beide Modelle haben 2 Milliarden Parameter und gehören zur Granite-Modellfamilie, die IBM für den robusten Produktiveinsatz in Unternehmen entwickelt. Der nicht-autoregressive Ansatz vermeidet die sequenzielle Token-Generierung und kann Transkriptionen stattdessen iterativ verfeinern, was die Latenz reduziert. Die Veröffentlichung richtet sich an Entwickler und Unternehmen, die ASR-Fähigkeiten mit kontrollierbarem Geschwindigkeits-Genauigkeits-Trade-off in eigene Pipelines integrieren möchten.
- Zwei Modelle unter dem Granite Speech 4.1 2B Label: eines autoregressive, eines nicht-autoregressive
- Autoregressive Variante bietet zusätzlich Sprachübersetzungsfunktion
- Nicht-autoregressive Variante nutzt Editing-Ansatz für reduzierte Inferenzlatenz
- Beide Modelle mit 2B Parametern – konzipiert für Enterprise-Deployments
- Teil der IBM Granite Modellfamilie, die auf Produktivtauglichkeit ausgelegt ist
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org1w
FormalASR: Kompakte End-to-End-Modelle transkribieren gesprochenes Chinesisch direkt in formalen Text
- FORSCHUNGarxiv.org2w
MBR-Decoding übertrifft Beam Search bei ASR und Speech Translation
- FORSCHUNGarxiv.org1w
Mega-ASR: Robuste Spracherkennung unter komplexen Akustikbedingungen via Skalierung

IBM veröffentlicht zwei Granite Speech 4.1 2B Modelle für Enterprise-ASR
IBM hat mit Granite Speech 4.1 2B zwei kompakte automatische Spracherkennungsmodelle (ASR) veröffentlicht, die auf Enterprise-Anwendungen ausgerichtet sind. Das erste Modell arbeitet autoregressive und unterstützt neben der Transkription auch Sprachübersetzung. Das zweite Modell ist sein nicht-autoregressives Pendant und setzt auf einen Editing-Ansatz, der deutlich schnellere Inferenzzeiten ermöglichen soll. Beide Modelle haben 2 Milliarden Parameter und gehören zur Granite-Modellfamilie, die IBM für den robusten Produktiveinsatz in Unternehmen entwickelt. Der nicht-autoregressive Ansatz vermeidet die sequenzielle Token-Generierung und kann Transkriptionen stattdessen iterativ verfeinern, was die Latenz reduziert. Die Veröffentlichung richtet sich an Entwickler und Unternehmen, die ASR-Fähigkeiten mit kontrollierbarem Geschwindigkeits-Genauigkeits-Trade-off in eigene Pipelines integrieren möchten.
- Zwei Modelle unter dem Granite Speech 4.1 2B Label: eines autoregressive, eines nicht-autoregressive
- Autoregressive Variante bietet zusätzlich Sprachübersetzungsfunktion
- Nicht-autoregressive Variante nutzt Editing-Ansatz für reduzierte Inferenzlatenz
- Beide Modelle mit 2B Parametern – konzipiert für Enterprise-Deployments
- Teil der IBM Granite Modellfamilie, die auf Produktivtauglichkeit ausgelegt ist
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org1w
FormalASR: Kompakte End-to-End-Modelle transkribieren gesprochenes Chinesisch direkt in formalen Text
- FORSCHUNGarxiv.org2w
MBR-Decoding übertrifft Beam Search bei ASR und Speech Translation
- FORSCHUNGarxiv.org1w
Mega-ASR: Robuste Spracherkennung unter komplexen Akustikbedingungen via Skalierung