OpenReader v3.0.0: Open-Source TTS-Dokumentenleser mit Audiobook-Export
OpenReader ist eine selbst gehostete Next.js-Webanwendung, die Dokumente im EPUB-, PDF-, DOCX-, TXT- und Markdown-Format verarbeitet und per Text-to-Speech vorliest. Version 3.0.0 bringt mehrere nennenswerte Neuerungen: Audio wird nun über mehrere Seiten voraus vorgeladen und serverseitig persistent in einem eingebetteten SeaweedFS oder einem externen S3-Speicher gecacht. Ein neues Admin-Panel erlaubt die Verwaltung mehrerer benannter TTS-Anbieter mit separaten API-Keys sowie die Steuerung von Feature-Flags (z. B. Nutzer-Registrierungen, Anbieter-Einschränkungen) zur Laufzeit ohne Redeployment. Unterstützte TTS-Dienste sind OpenAI, Replicate, Deepinfra sowie selbst gehostete OpenAI-kompatible APIs wie Kokoro-FastAPI oder KittenTTS-FastAPI. Audiobuch-Export erfolgt als m4b oder mp3 inklusive Kapitel-Metadaten via ffmpeg. Dokumente, Audio und Einstellungen bleiben auf dem eigenen Server in SQLite oder PostgreSQL. Das Projekt ist seit über einem Jahr live und hat über 300 GitHub-Stars gesammelt. Entwickler richardr1126 sucht Feedback und Contributions auf GitHub.
- Unterstützte Formate: EPUB, PDF, DOCX, TXT und Markdown
- TTS-Anbieter: OpenAI, Replicate, Deepinfra sowie OpenAI-kompatible Self-Hosted-APIs (Kokoro-FastAPI, KittenTTS-FastAPI)
- Speicheroptionen: SQLite oder PostgreSQL für Metadaten, eingebettetes SeaweedFS oder externes S3 für Audio
- Audiobook-Export als m4b/mp3 mit Kapitel-Metadaten via ffmpeg
- Docker-Schnellstart verfügbar unter docs.openreader.richardr.dev; über 300 GitHub-Stars
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
OpenReader v3.0.0: Open-Source TTS-Dokumentenleser mit Audiobook-Export
OpenReader ist eine selbst gehostete Next.js-Webanwendung, die Dokumente im EPUB-, PDF-, DOCX-, TXT- und Markdown-Format verarbeitet und per Text-to-Speech vorliest. Version 3.0.0 bringt mehrere nennenswerte Neuerungen: Audio wird nun über mehrere Seiten voraus vorgeladen und serverseitig persistent in einem eingebetteten SeaweedFS oder einem externen S3-Speicher gecacht. Ein neues Admin-Panel erlaubt die Verwaltung mehrerer benannter TTS-Anbieter mit separaten API-Keys sowie die Steuerung von Feature-Flags (z. B. Nutzer-Registrierungen, Anbieter-Einschränkungen) zur Laufzeit ohne Redeployment. Unterstützte TTS-Dienste sind OpenAI, Replicate, Deepinfra sowie selbst gehostete OpenAI-kompatible APIs wie Kokoro-FastAPI oder KittenTTS-FastAPI. Audiobuch-Export erfolgt als m4b oder mp3 inklusive Kapitel-Metadaten via ffmpeg. Dokumente, Audio und Einstellungen bleiben auf dem eigenen Server in SQLite oder PostgreSQL. Das Projekt ist seit über einem Jahr live und hat über 300 GitHub-Stars gesammelt. Entwickler richardr1126 sucht Feedback und Contributions auf GitHub.
- Unterstützte Formate: EPUB, PDF, DOCX, TXT und Markdown
- TTS-Anbieter: OpenAI, Replicate, Deepinfra sowie OpenAI-kompatible Self-Hosted-APIs (Kokoro-FastAPI, KittenTTS-FastAPI)
- Speicheroptionen: SQLite oder PostgreSQL für Metadaten, eingebettetes SeaweedFS oder externes S3 für Audio
- Audiobook-Export als m4b/mp3 mit Kapitel-Metadaten via ffmpeg
- Docker-Schnellstart verfügbar unter docs.openreader.richardr.dev; über 300 GitHub-Stars
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.