GLaDOS TTS Build Kit: Portal-Besitzer trainieren eigene GLaDOS-Stimme lokal

CompaniesCohere

Warum es zählt

Wer ein reproduzierbares, rechtlich saubereres TTS-Training aus urheberrechtlich geschütztem Audiomaterial anstrebt, bekommt hier eine vollständige Source-only-Pipeline als Referenzimplementierung – relevant für eigene TTS-Projekte mit lizenzierten Quellmedien.

— Lumeric Redaktion

Das GitHub-Projekt „glados-tts-build-kit" von Joe Helbing bietet eine vollständige, reproduzierbare Pipeline zum Training eines lokalen GLaDOS-Stimm-Modells – ausschließlich auf Basis eigener, lokal installierter Spieldateien von Portal und Portal 2. Das Toolkit enthält bewusst keine Valve-Audiodaten, Transkripte, Samples oder trainierte Gewichte; sämtliche generierten Daten verbleiben in lokalen, per .gitignore ausgeschlossenen Verzeichnissen. Die Pipeline extrahiert GLaDOS-Voice-Lines aus den VPK-Archiven der Spiele, konvertiert die Source-Engine-eigenen MP3-in-WAV-Dateien in sauberes 24-kHz-Mono-PCM, transkribiert die Clips über Cohere Transcribe (CohereX) und gleicht die Ergebnisse mit Portal-Wiki-Transkripten als Ground-Truth ab. Fehlerhafte oder schlecht übereinstimmende Clips werden herausgefiltert; optional steht eine lokale Web-UI zur manuellen Nachkontrolle zur Verfügung. Am Ende werden Manifeste erstellt und ein OmniVoice-TTS-Modell lokal trainiert. Die Grundidee der Spieldatei-Extraktion stammt vom Projekt „piper-de-glados" von systemofapwne; Helbing hat darauf aufbauend eine vollständige Source-only-Trainingspipeline entwickelt.

Was wir noch wissen

Pipeline extrahiert Voice-Lines direkt aus lokalen Portal/Portal-2-VPK-Archiven
Audio wird in 24 kHz Mono PCM konvertiert; Transkription via Cohere Transcribe (CohereX)
Portal-Wiki-Transkripte dienen als Ground-Truth zur Qualitätssicherung
Optionale lokale Web-UI für manuelles Review unklarer Clips enthalten
Finales Modell-Training erfolgt mit OmniVoice TTS; keine vorgefertigten Weights im Repo

Quelle lesenreddit.com

Voice Open Source Developer Tooling

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

GLaDOS TTS Build Kit: Portal-Besitzer trainieren eigene GLaDOS-Stimme lokal

CompaniesCohere

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Pipeline extrahiert Voice-Lines direkt aus lokalen Portal/Portal-2-VPK-Archiven
Audio wird in 24 kHz Mono PCM konvertiert; Transkription via Cohere Transcribe (CohereX)
Portal-Wiki-Transkripte dienen als Ground-Truth zur Qualitätssicherung
Optionale lokale Web-UI für manuelles Review unklarer Clips enthalten
Finales Modell-Training erfolgt mit OmniVoice TTS; keine vorgefertigten Weights im Repo

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

GLaDOS TTS Build Kit: Portal-Besitzer trainieren eigene GLaDOS-Stimme lokal

Frag die KI zum Artikel

Verwandte Beiträge

GLaDOS TTS Build Kit: Portal-Besitzer trainieren eigene GLaDOS-Stimme lokal

Frag die KI zum Artikel

Verwandte Beiträge