Hedy-App bringt vollständig offline laufende Meeting-KI auf Apple Silicon
Hedy-Gründer /u/julp hat eine neue Version der gleichnamigen Meeting-App veröffentlicht, die die gesamte KI-Pipeline vollständig lokal ausführt – Spracherkennung (whisper.cpp, Parakeet), Zusammenfassungen, detaillierte Notizen, Meeting-Chat und Live-Coaching laufen via llama.cpp ohne Internetverbindung. Unterstützte Modelle umfassen Qwen 3.5, Qwen 3.6 (2B bis 35B) sowie die Gemma-4-Familie. Als Sweet Spot gilt das Qwen 3.5 9B mit Q4- oder Q8-Quantisierung. Hardware-Beschleunigung erfolgt über Metal auf Apple Silicon und Vulkan auf Windows-GPUs; Mac-Nutzer sind durch den Unified Memory lediglich durch den Gesamt-RAM begrenzt. Ein Modell-Picker zeigt vorab an, ob ein Modell gut, knapp oder gar nicht auf das jeweilige System passt. Nutzer können beliebige kompatible GGUF-Modelle von Hugging Face laden. Im Demo-Video auf einem M4 Max mit Qwen 3.5 4B dauerte die Zusammenfassung eines 10-Minuten-Meetings etwa 15 Sekunden. Mobile-Unterstützung ist auf iPhone 15 Pro und neuer sowie M-Series-iPads beschränkt; Android und Web befinden sich auf der Roadmap, sind aber noch nicht verfügbar.
- Unterstützte Modelle: Qwen 3.5, Qwen 3.6 (2B–35B) und Gemma-4-Familien, mehrere Quantisierungsstufen (z.B. Q4/Q8 für 9B)
- Spracherkennung läuft seit Beginn on-device via whisper.cpp und neu auch Parakeet
- Kein stiller Cloud-Fallback: Bei lokalem Fehler erscheint eine Fehlermeldung statt automatischem Wechsel zur Cloud
- Mobile-Unterstützung auf iPhone 15 Pro+ und M-Series-iPads; ältere Geräte sehen den Local-Toggle nicht
- Android- und Web-Support auf der Roadmap, aber noch nicht lieferbar wegen heterogener Hardware
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2w
ml-intern: HuggingFace-Agent-Harness jetzt mit llama.cpp und Ollama
- BENCHMARKreddit.com1w
VoiceFlow v1.6.0: Lokale Meeting-Zusammenfassung auf 6-GB-GPU mit qwen3.5:0.8b
- LAUNCHhuggingface.co1d
Reachy Mini läuft jetzt vollständig lokal mit speech-to-speech-Pipeline
- MEINUNGreddit.com2w
Qwen3.6-35B-A3B im Praxiseinsatz: Lokale LLMs als vollständige Workflow-Automatisierung
Hedy-App bringt vollständig offline laufende Meeting-KI auf Apple Silicon
Hedy-Gründer /u/julp hat eine neue Version der gleichnamigen Meeting-App veröffentlicht, die die gesamte KI-Pipeline vollständig lokal ausführt – Spracherkennung (whisper.cpp, Parakeet), Zusammenfassungen, detaillierte Notizen, Meeting-Chat und Live-Coaching laufen via llama.cpp ohne Internetverbindung. Unterstützte Modelle umfassen Qwen 3.5, Qwen 3.6 (2B bis 35B) sowie die Gemma-4-Familie. Als Sweet Spot gilt das Qwen 3.5 9B mit Q4- oder Q8-Quantisierung. Hardware-Beschleunigung erfolgt über Metal auf Apple Silicon und Vulkan auf Windows-GPUs; Mac-Nutzer sind durch den Unified Memory lediglich durch den Gesamt-RAM begrenzt. Ein Modell-Picker zeigt vorab an, ob ein Modell gut, knapp oder gar nicht auf das jeweilige System passt. Nutzer können beliebige kompatible GGUF-Modelle von Hugging Face laden. Im Demo-Video auf einem M4 Max mit Qwen 3.5 4B dauerte die Zusammenfassung eines 10-Minuten-Meetings etwa 15 Sekunden. Mobile-Unterstützung ist auf iPhone 15 Pro und neuer sowie M-Series-iPads beschränkt; Android und Web befinden sich auf der Roadmap, sind aber noch nicht verfügbar.
- Unterstützte Modelle: Qwen 3.5, Qwen 3.6 (2B–35B) und Gemma-4-Familien, mehrere Quantisierungsstufen (z.B. Q4/Q8 für 9B)
- Spracherkennung läuft seit Beginn on-device via whisper.cpp und neu auch Parakeet
- Kein stiller Cloud-Fallback: Bei lokalem Fehler erscheint eine Fehlermeldung statt automatischem Wechsel zur Cloud
- Mobile-Unterstützung auf iPhone 15 Pro+ und M-Series-iPads; ältere Geräte sehen den Local-Toggle nicht
- Android- und Web-Support auf der Roadmap, aber noch nicht lieferbar wegen heterogener Hardware
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2w
ml-intern: HuggingFace-Agent-Harness jetzt mit llama.cpp und Ollama
- BENCHMARKreddit.com1w
VoiceFlow v1.6.0: Lokale Meeting-Zusammenfassung auf 6-GB-GPU mit qwen3.5:0.8b
- LAUNCHhuggingface.co1d
Reachy Mini läuft jetzt vollständig lokal mit speech-to-speech-Pipeline
- MEINUNGreddit.com2w
Qwen3.6-35B-A3B im Praxiseinsatz: Lokale LLMs als vollständige Workflow-Automatisierung