
xAI ermöglicht Stimm-Klonen mit einer Minute Sprachaufnahme
xAI, das KI-Unternehmen von Elon Musk, hat mit „Custom Voices" ein neues Feature für Entwickler vorgestellt, das Voice Cloning direkt über die Grok-API ermöglicht. Grundlage sind die kürzlich veröffentlichten Grok-APIs für Speech-to-Text und Text-to-Speech. Bereits eine Minute Sprachaufnahme soll genügen, um eine nutzbare Stimm-Kopie zu erzeugen, die anschließend in eigenen KI-Anwendungen eingesetzt werden kann. Das Feature richtet sich primär an Entwickler und ergänzt das wachsende Ökosystem rund um die Grok-Sprachmodelle. xAI positioniert sich damit im Wettbewerb mit bestehenden Voice-Cloning-Anbietern wie ElevenLabs oder OpenAIs Voice-API, die ähnliche Funktionalitäten bereits anbieten.
- Mindestens eine Minute Sprachaufnahme reicht laut xAI für einen nutzbaren Voice Clone aus.
- Das Feature baut direkt auf den neu eingeführten Grok Speech-to-Text- und Text-to-Speech-APIs auf.
- Custom Voices richtet sich explizit an Entwickler für den Einsatz in eigenen KI-Applikationen.
- xAI tritt damit in direkten Wettbewerb mit Voice-Cloning-Diensten wie ElevenLabs und OpenAI Voice API.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHtogether.ai2w
Together AI launcht Voice Finder: 600+ Stimmen per Prompt oder Audio durchsuchen
- FORSCHUNGarxiv.org2w
X-Voice: 0,4B-Modell klont beliebige Stimmen in 30 Sprachen ohne Transkript
- MEINUNGreddit.com3w
OmniVoice ermöglicht One-Shot-Voice-Cloning ohne komplexe Konfiguration
- LAUNCHreddit.com2w
Scenema Audio: Open-Source-Diffusionsmodell für expressives Zero-Shot-Voice-Cloning

xAI ermöglicht Stimm-Klonen mit einer Minute Sprachaufnahme
xAI, das KI-Unternehmen von Elon Musk, hat mit „Custom Voices" ein neues Feature für Entwickler vorgestellt, das Voice Cloning direkt über die Grok-API ermöglicht. Grundlage sind die kürzlich veröffentlichten Grok-APIs für Speech-to-Text und Text-to-Speech. Bereits eine Minute Sprachaufnahme soll genügen, um eine nutzbare Stimm-Kopie zu erzeugen, die anschließend in eigenen KI-Anwendungen eingesetzt werden kann. Das Feature richtet sich primär an Entwickler und ergänzt das wachsende Ökosystem rund um die Grok-Sprachmodelle. xAI positioniert sich damit im Wettbewerb mit bestehenden Voice-Cloning-Anbietern wie ElevenLabs oder OpenAIs Voice-API, die ähnliche Funktionalitäten bereits anbieten.
- Mindestens eine Minute Sprachaufnahme reicht laut xAI für einen nutzbaren Voice Clone aus.
- Das Feature baut direkt auf den neu eingeführten Grok Speech-to-Text- und Text-to-Speech-APIs auf.
- Custom Voices richtet sich explizit an Entwickler für den Einsatz in eigenen KI-Applikationen.
- xAI tritt damit in direkten Wettbewerb mit Voice-Cloning-Diensten wie ElevenLabs und OpenAI Voice API.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHtogether.ai2w
Together AI launcht Voice Finder: 600+ Stimmen per Prompt oder Audio durchsuchen
- FORSCHUNGarxiv.org2w
X-Voice: 0,4B-Modell klont beliebige Stimmen in 30 Sprachen ohne Transkript
- MEINUNGreddit.com3w
OmniVoice ermöglicht One-Shot-Voice-Cloning ohne komplexe Konfiguration
- LAUNCHreddit.com2w
Scenema Audio: Open-Source-Diffusionsmodell für expressives Zero-Shot-Voice-Cloning