OpenReader v3.0.0: Open-Source TTS-Dokumentenleser mit Audiobook-Export

CompaniesOpenAI

Warum es zählt

Wer Dokumente lokal oder auf eigenem Server mit hochwertiger Text-to-Speech verarbeiten will, erhält mit v3.0.0 persistentes Audio-Caching, ein Admin-Panel für mehrere TTS-Anbieter sowie Runtime-Feature-Flags – ohne Redeployment.

— Lumeric Redaktion

OpenReader ist eine selbst gehostete Next.js-Webanwendung, die Dokumente im EPUB-, PDF-, DOCX-, TXT- und Markdown-Format verarbeitet und per Text-to-Speech vorliest. Version 3.0.0 bringt mehrere nennenswerte Neuerungen: Audio wird nun über mehrere Seiten voraus vorgeladen und serverseitig persistent in einem eingebetteten SeaweedFS oder einem externen S3-Speicher gecacht. Ein neues Admin-Panel erlaubt die Verwaltung mehrerer benannter TTS-Anbieter mit separaten API-Keys sowie die Steuerung von Feature-Flags (z. B. Nutzer-Registrierungen, Anbieter-Einschränkungen) zur Laufzeit ohne Redeployment. Unterstützte TTS-Dienste sind OpenAI, Replicate, Deepinfra sowie selbst gehostete OpenAI-kompatible APIs wie Kokoro-FastAPI oder KittenTTS-FastAPI. Audiobuch-Export erfolgt als m4b oder mp3 inklusive Kapitel-Metadaten via ffmpeg. Dokumente, Audio und Einstellungen bleiben auf dem eigenen Server in SQLite oder PostgreSQL. Das Projekt ist seit über einem Jahr live und hat über 300 GitHub-Stars gesammelt. Entwickler richardr1126 sucht Feedback und Contributions auf GitHub.

Was wir noch wissen

Unterstützte Formate: EPUB, PDF, DOCX, TXT und Markdown
TTS-Anbieter: OpenAI, Replicate, Deepinfra sowie OpenAI-kompatible Self-Hosted-APIs (Kokoro-FastAPI, KittenTTS-FastAPI)
Speicheroptionen: SQLite oder PostgreSQL für Metadaten, eingebettetes SeaweedFS oder externes S3 für Audio
Audiobook-Export als m4b/mp3 mit Kapitel-Metadaten via ffmpeg
Docker-Schnellstart verfügbar unter docs.openreader.richardr.dev; über 300 GitHub-Stars

Quelle lesenreddit.com

Open Source Voice Developer Tooling

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

OpenReader v3.0.0: Open-Source TTS-Dokumentenleser mit Audiobook-Export

ToolsGPT Replicate Vercel

CompaniesOpenAI

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Unterstützte Formate: EPUB, PDF, DOCX, TXT und Markdown
TTS-Anbieter: OpenAI, Replicate, Deepinfra sowie OpenAI-kompatible Self-Hosted-APIs (Kokoro-FastAPI, KittenTTS-FastAPI)
Speicheroptionen: SQLite oder PostgreSQL für Metadaten, eingebettetes SeaweedFS oder externes S3 für Audio
Audiobook-Export als m4b/mp3 mit Kapitel-Metadaten via ffmpeg
Docker-Schnellstart verfügbar unter docs.openreader.richardr.dev; über 300 GitHub-Stars

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

OpenReader v3.0.0: Open-Source TTS-Dokumentenleser mit Audiobook-Export

Frag die KI zum Artikel

Verwandte Beiträge

OpenReader v3.0.0: Open-Source TTS-Dokumentenleser mit Audiobook-Export

Frag die KI zum Artikel

Verwandte Beiträge