DS4: Redis-Entwickler Sanfilippo bringt DeepSeek V4 Flash mit 1M-Kontext auf Mac Metal
Salvatore Sanfilippo, bekannt als Schöpfer von Redis (GitHub-Handle: antirez), hat ein neues Open-Source-Projekt namens DS4 veröffentlicht. Kernziel ist es, DeepSeek V4 Flash mit einem 1-Million-Token-Kontextfenster auf Apple-Mac-Hardware über das Metal-Framework zu betreiben. Das Projekt setzt dabei auf neuartige technische Ansätze, deren Details im GitHub-Repository beschrieben werden. Kurz nach Veröffentlichung zeigte Sanfilippo in einem Video auf X, wie DS4 auf einem NVIDIA DGX-System läuft. Community-Mitglieder spekulieren, dass auch eine NVIDIA Pro 6000 mit leicht reduziertem Kontextfenster in hoher Geschwindigkeit betrieben werden könnte. Mittelfristig wird auch AMD-GPU-Unterstützung für möglich gehalten. Der Server bietet bereits kompatible Endpunkte für die OpenAI- und Anthropic-API, sodass bestehende Agentic-Coding-Tools wie Cursor oder Claude Code direkt angebunden werden können. Der Reddit-Post ruft die Hardware-affine LocalLLaMA-Community zur Mitarbeit am Projekt auf.
- DS4 läuft laut Demo-Video von Sanfilippo bereits auf einem NVIDIA DGX-System.
- Der Server stellt OpenAI- und Anthropic-kompatible API-Endpunkte bereit.
- Zielplattform ist primär Mac Metal; AMD-GPU-Support wird als zukünftige Möglichkeit diskutiert.
- Projekt ist auf GitHub unter antirez/ds4 verfügbar und sucht Community-Beiträge.
- Sanfilippo ist auch Schöpfer von Redis und weiterer bekannter Open-Source-Infrastruktur.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2w
DS4: Spezialisierte Inference-Engine für DeepSeek 4 Flash auf 128-GB-MacBooks
- MEINUNGreddit.com23h
Community sucht funktionierende DeepSeek-V4-Flash-Quant für llama.cpp und vLLM
- FORSCHUNGreddit.com1w
DeepSeek-V4 auf 4× RTX 2080 Ti: 255 Prefill-Token/s für unter 2.500 USD
- FORSCHUNGthesequence.substack.com0mo
DeepSeek-V4: Architektur für Million-Token-Reasoning im Detail
DS4: Redis-Entwickler Sanfilippo bringt DeepSeek V4 Flash mit 1M-Kontext auf Mac Metal
Salvatore Sanfilippo, bekannt als Schöpfer von Redis (GitHub-Handle: antirez), hat ein neues Open-Source-Projekt namens DS4 veröffentlicht. Kernziel ist es, DeepSeek V4 Flash mit einem 1-Million-Token-Kontextfenster auf Apple-Mac-Hardware über das Metal-Framework zu betreiben. Das Projekt setzt dabei auf neuartige technische Ansätze, deren Details im GitHub-Repository beschrieben werden. Kurz nach Veröffentlichung zeigte Sanfilippo in einem Video auf X, wie DS4 auf einem NVIDIA DGX-System läuft. Community-Mitglieder spekulieren, dass auch eine NVIDIA Pro 6000 mit leicht reduziertem Kontextfenster in hoher Geschwindigkeit betrieben werden könnte. Mittelfristig wird auch AMD-GPU-Unterstützung für möglich gehalten. Der Server bietet bereits kompatible Endpunkte für die OpenAI- und Anthropic-API, sodass bestehende Agentic-Coding-Tools wie Cursor oder Claude Code direkt angebunden werden können. Der Reddit-Post ruft die Hardware-affine LocalLLaMA-Community zur Mitarbeit am Projekt auf.
- DS4 läuft laut Demo-Video von Sanfilippo bereits auf einem NVIDIA DGX-System.
- Der Server stellt OpenAI- und Anthropic-kompatible API-Endpunkte bereit.
- Zielplattform ist primär Mac Metal; AMD-GPU-Support wird als zukünftige Möglichkeit diskutiert.
- Projekt ist auf GitHub unter antirez/ds4 verfügbar und sucht Community-Beiträge.
- Sanfilippo ist auch Schöpfer von Redis und weiterer bekannter Open-Source-Infrastruktur.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2w
DS4: Spezialisierte Inference-Engine für DeepSeek 4 Flash auf 128-GB-MacBooks
- MEINUNGreddit.com23h
Community sucht funktionierende DeepSeek-V4-Flash-Quant für llama.cpp und vLLM
- FORSCHUNGreddit.com1w
DeepSeek-V4 auf 4× RTX 2080 Ti: 255 Prefill-Token/s für unter 2.500 USD
- FORSCHUNGthesequence.substack.com0mo
DeepSeek-V4: Architektur für Million-Token-Reasoning im Detail