GLaDOS TTS Build Kit: Portal-Besitzer trainieren eigene GLaDOS-Stimme lokal
Das GitHub-Projekt „glados-tts-build-kit" von Joe Helbing bietet eine vollständige, reproduzierbare Pipeline zum Training eines lokalen GLaDOS-Stimm-Modells – ausschließlich auf Basis eigener, lokal installierter Spieldateien von Portal und Portal 2. Das Toolkit enthält bewusst keine Valve-Audiodaten, Transkripte, Samples oder trainierte Gewichte; sämtliche generierten Daten verbleiben in lokalen, per .gitignore ausgeschlossenen Verzeichnissen. Die Pipeline extrahiert GLaDOS-Voice-Lines aus den VPK-Archiven der Spiele, konvertiert die Source-Engine-eigenen MP3-in-WAV-Dateien in sauberes 24-kHz-Mono-PCM, transkribiert die Clips über Cohere Transcribe (CohereX) und gleicht die Ergebnisse mit Portal-Wiki-Transkripten als Ground-Truth ab. Fehlerhafte oder schlecht übereinstimmende Clips werden herausgefiltert; optional steht eine lokale Web-UI zur manuellen Nachkontrolle zur Verfügung. Am Ende werden Manifeste erstellt und ein OmniVoice-TTS-Modell lokal trainiert. Die Grundidee der Spieldatei-Extraktion stammt vom Projekt „piper-de-glados" von systemofapwne; Helbing hat darauf aufbauend eine vollständige Source-only-Trainingspipeline entwickelt.
- Pipeline extrahiert Voice-Lines direkt aus lokalen Portal/Portal-2-VPK-Archiven
- Audio wird in 24 kHz Mono PCM konvertiert; Transkription via Cohere Transcribe (CohereX)
- Portal-Wiki-Transkripte dienen als Ground-Truth zur Qualitätssicherung
- Optionale lokale Web-UI für manuelles Review unklarer Clips enthalten
- Finales Modell-Training erfolgt mit OmniVoice TTS; keine vorgefertigten Weights im Repo
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com6d
Open-Source-Pipeline klont Rockys Stimme aus „Project Hail Mary" in zwei Tagen
- LAUNCHmarktechpost.com2d
OmniVoice Studio: Open-Source-Alternative zu ElevenLabs mit lokalem Betrieb
- LAUNCHthe-decoder.com3w
xAI ermöglicht Stimm-Klonen mit einer Minute Sprachaufnahme
- LAUNCHreddit.com1w
OpenMOSS: Pure-C++-TTS-Pipeline auf GGML-Basis veröffentlicht
GLaDOS TTS Build Kit: Portal-Besitzer trainieren eigene GLaDOS-Stimme lokal
Das GitHub-Projekt „glados-tts-build-kit" von Joe Helbing bietet eine vollständige, reproduzierbare Pipeline zum Training eines lokalen GLaDOS-Stimm-Modells – ausschließlich auf Basis eigener, lokal installierter Spieldateien von Portal und Portal 2. Das Toolkit enthält bewusst keine Valve-Audiodaten, Transkripte, Samples oder trainierte Gewichte; sämtliche generierten Daten verbleiben in lokalen, per .gitignore ausgeschlossenen Verzeichnissen. Die Pipeline extrahiert GLaDOS-Voice-Lines aus den VPK-Archiven der Spiele, konvertiert die Source-Engine-eigenen MP3-in-WAV-Dateien in sauberes 24-kHz-Mono-PCM, transkribiert die Clips über Cohere Transcribe (CohereX) und gleicht die Ergebnisse mit Portal-Wiki-Transkripten als Ground-Truth ab. Fehlerhafte oder schlecht übereinstimmende Clips werden herausgefiltert; optional steht eine lokale Web-UI zur manuellen Nachkontrolle zur Verfügung. Am Ende werden Manifeste erstellt und ein OmniVoice-TTS-Modell lokal trainiert. Die Grundidee der Spieldatei-Extraktion stammt vom Projekt „piper-de-glados" von systemofapwne; Helbing hat darauf aufbauend eine vollständige Source-only-Trainingspipeline entwickelt.
- Pipeline extrahiert Voice-Lines direkt aus lokalen Portal/Portal-2-VPK-Archiven
- Audio wird in 24 kHz Mono PCM konvertiert; Transkription via Cohere Transcribe (CohereX)
- Portal-Wiki-Transkripte dienen als Ground-Truth zur Qualitätssicherung
- Optionale lokale Web-UI für manuelles Review unklarer Clips enthalten
- Finales Modell-Training erfolgt mit OmniVoice TTS; keine vorgefertigten Weights im Repo
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com6d
Open-Source-Pipeline klont Rockys Stimme aus „Project Hail Mary" in zwei Tagen
- LAUNCHmarktechpost.com2d
OmniVoice Studio: Open-Source-Alternative zu ElevenLabs mit lokalem Betrieb
- LAUNCHthe-decoder.com3w
xAI ermöglicht Stimm-Klonen mit einer Minute Sprachaufnahme
- LAUNCHreddit.com1w
OpenMOSS: Pure-C++-TTS-Pipeline auf GGML-Basis veröffentlicht