
OpenAI bringt GPT-5-Reasoning in Echtzeit-Sprachmodelle
OpenAI stellt drei neue Varianten seiner Realtime-Sprachmodelle vor: GPT-Realtime-2 ist das Flaggschiff der neuen Familie und soll laut OpenAI ein Reasoning-Niveau erreichen, das mit GPT-5 vergleichbar ist – allerdings direkt in Echtzeit-Gesprächen ohne Umweg über eine textbasierte Zwischenschicht. GPT-Realtime-Translate ergänzt die Familie um dedizierte Übersetzungsfähigkeiten in mehr als 70 Sprachen und richtet sich damit an multilinguale Kommunikationsszenarien. GPT-Realtime-Whisper wiederum ist auf Live-Transkription ausgelegt und dürfte auf der bewährten Whisper-Architektur von OpenAI aufbauen. Die drei Modelle sind über die OpenAI API zugänglich und erweitern die bestehende Realtime-API, die seit Ende 2024 für Entwickler verfügbar ist. Mit dem Release reagiert OpenAI auf wachsende Nachfrage nach sprachgesteuerten Agenten und Voice-First-Produkten, bei denen Reasoning bislang durch die Umwandlung in Text erkauft werden musste.
- GPT-Realtime-2 soll Reasoning auf GPT-5-Niveau direkt in Echtzeit-Gesprächen liefern.
- GPT-Realtime-Translate unterstützt Übersetzung in mehr als 70 Sprachen.
- GPT-Realtime-Whisper ist auf Live-Transkription von Sprache spezialisiert.
- Alle drei Modelle sind Teil der OpenAI Realtime API für Entwickler.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

OpenAI bringt GPT-5-Reasoning in Echtzeit-Sprachmodelle
OpenAI stellt drei neue Varianten seiner Realtime-Sprachmodelle vor: GPT-Realtime-2 ist das Flaggschiff der neuen Familie und soll laut OpenAI ein Reasoning-Niveau erreichen, das mit GPT-5 vergleichbar ist – allerdings direkt in Echtzeit-Gesprächen ohne Umweg über eine textbasierte Zwischenschicht. GPT-Realtime-Translate ergänzt die Familie um dedizierte Übersetzungsfähigkeiten in mehr als 70 Sprachen und richtet sich damit an multilinguale Kommunikationsszenarien. GPT-Realtime-Whisper wiederum ist auf Live-Transkription ausgelegt und dürfte auf der bewährten Whisper-Architektur von OpenAI aufbauen. Die drei Modelle sind über die OpenAI API zugänglich und erweitern die bestehende Realtime-API, die seit Ende 2024 für Entwickler verfügbar ist. Mit dem Release reagiert OpenAI auf wachsende Nachfrage nach sprachgesteuerten Agenten und Voice-First-Produkten, bei denen Reasoning bislang durch die Umwandlung in Text erkauft werden musste.
- GPT-Realtime-2 soll Reasoning auf GPT-5-Niveau direkt in Echtzeit-Gesprächen liefern.
- GPT-Realtime-Translate unterstützt Übersetzung in mehr als 70 Sprachen.
- GPT-Realtime-Whisper ist auf Live-Transkription von Sprache spezialisiert.
- Alle drei Modelle sind Teil der OpenAI Realtime API für Entwickler.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.