
DeepSeek greift mit eigenem Code-Agenten Claude Code und OpenAI Codex an
DeepSeek baut in Peking ein neues Team für den KI-Coding-Agenten „DeepSeek Code" – ein direkter Konkurrent zu Claude Code, OpenAI Codex und Cursor.
Community fragt: DeepSeek-V4-Distillation für Qwen 3.6-27B möglich?
Reddit-Nutzer schlägt vor, ein Distillations-Modell von DeepSeek-V4 auf Basis von Qwen 3.6-27B zu erstellen, ähnlich wie DeepSeek-R1-Distill-Qwen. Open-Source-Zugang würde Datengrundlage für Training verbessern.
Community sucht funktionierende DeepSeek-V4-Flash-Quant für llama.cpp und vLLM
Ein Reddit-Nutzer berichtet von Qualitätsproblemen mit dem nsparks-DeepSeek-V4-Flash-FP4-FP8-GGUF-Quant und sucht eine stabile Alternative für llama.cpp oder vLLM – letzteres unterstützt DS4 derzeit nur auf H100s.
Community sucht Lösung für DeepSeek V4 FIM-Integration in Editoren
Ein Reddit-Nutzer berichtet von Problemen bei der Einrichtung von DeepSeek V4 FIM-Autovervollständigung in VSCode und Zed über die offizielle API. Der Fehler scheint im Request-Body zu liegen.

DeepSeek macht 75-%-Rabatt auf V4-Pro dauerhaft – Output-Token 34× günstiger als GPT-5.5
DeepSeek senkt den Preis für V4-Pro dauerhaft: 0,435 $ pro Million Input-Token, Output-Token mehr als 34× günstiger als GPT-5.5. Der Preisdruck auf westliche Anbieter steigt damit erheblich.

DeepSeek revolutioniert KI-basiertes Bildverstehen
Two Minute Papers bespricht einen neuen Ansatz von DeepSeek, der das visuelle Verstehen von KI-Modellen grundlegend verändern soll.
DeepSeek V4: 1M-Kontext-Fenster im Praxistest mit echten Codebases
Ein Community-Test von DeepSeek V4 zeigt: Unter 150k Tokens läuft der 1M-Kontext-Claim solide, ab 300k leidet die Präzision spürbar. Das praktische Optimum für Coding-Workflows liegt bei 150–250k Tokens.

DeepSeek-V4-Flash macht LLM-Steering für Entwickler erstmals praktikabel
Mit DeepSeek-V4-Flash gibt es erstmals ein lokales Open-Weights-Modell, das gut genug für agentic Coding ist – und damit Steering-Experimente für normale Entwickler zugänglich macht.
Deepseek-TUI vs. Alternativen: Wann der Wechsel vom Single-Model-Agent sinnvoll ist
Ein r/LocalLLaMA-Nutzer analysiert Alternativen zu Deepseek-TUI nach Wochen im produktiven Einsatz – darunter Aider, Cline, Claude Code und OpenCode – und benennt konkrete Wechselgründe wie Model-Lock-in und fehlendes IDE-Integrations.
DeepSeek V4 Pro als Q4_K_M lokal auf EPYC-Workstation betrieben
Reddit-Nutzer fairydreaming läuft DeepSeek V4 Pro quantisiert (Q4_K_M, 859 GB) lokal auf einer EPYC-Workstation mit 12 × 96 GB RAM und einer RTX PRO 6000 Blackwell Max-Q — mit 8,6 t/s Generationsgeschwindigkeit.
DeepSeek lehnt Alibaba-Investition ab und besteht auf Unabhängigkeit
Verhandlungen zwischen Alibaba und DeepSeek über eine Beteiligung sind gescheitert – zu unvereinbar sind Alibabas Ökosystem-Ambitionen und DeepSeeks Anspruch auf unternehmerische Unabhängigkeit.
DeepSeek sucht 7,35 Mrd. Dollar Kapital und plant V4.1-Release im Juni
DeepSeek will laut Insidern bis zu 50 Mrd. RMB (ca. 7,35 Mrd. USD) einsammeln – potenziell die größte Finanzierungsrunde eines chinesischen KI-Unternehmens. CEO Liang Wenfeng soll selbst den maximal zulässigen Betrag beisteuern.
DS4: Spezialisierte Inference-Engine für DeepSeek 4 Flash auf 128-GB-MacBooks
Der Reddit-Nutzer /u/antirez stellt DS4 vor – eine auf DeepSeek 4 Flash spezialisierte Inference-Engine, die für MacBooks mit 128 GB RAM optimiert ist.
DeepSeek v4 Pro im Roo Code Extension: Nutzer berichten hohe API-Kosten
Ein Nutzer berichtet, dass DeepSeek v4 Pro mit aktiviertem "high thinking" in der Roo Code VS-Code-Extension ähnlich hohe Kosten verursacht wie Claude Opus – etwa $10 in zwei Stunden.
llama.cpp-Fork bringt experimentellen DeepSeek V3.2-Support via PR
GitHub-Nutzer fairydreaming hat einen llama.cpp-Fork mit einem Pull-Request für DeepSeek V3.2 veröffentlicht. Unterstützt werden GGUF-Quantisierungen (Q4_K_M ~404 GB, Q8_0 ~714 GB) über HuggingFace-gehostete Modell-Weights.

DeepSeek V4 übertrifft Konkurrenz deutlich
Two Minute Papers analysiert DeepSeek V4 und dessen überlegene Performance gegenüber etablierten Spitzenmodellen. Das Video untersucht, wie das chinesische Modell in Benchmarks und praktischen Anwendungen konkurriert.
DeepSeek V4 Pro erreicht GPT-5.2-Niveau auf FoodTruck Bench — 17× günstiger
DeepSeek V4 Pro wurde auf FoodTruck Bench, einem agentic Benchmark mit Lebensmittelwagen-Simulation, getestet und erzielt dieselbe Performance wie GPT-5.2 (zehn Wochen später) bei 17× niedrigeren Kosten. Das Modell belegt Platz 4 hinter Opus 4.6, GPT-5.2 und Grok 4.3.
DeepClaude: Claude Code mit DeepSeek V4 Pro – 17x günstiger
DeepClaude ermöglicht die Nutzung des Claude-Code-Agenten mit DeepSeek V4 Pro statt Anthropic Claude und kostet damit nur $0.87/M Output-Tokens statt $15/M – bei gleicher Funktionalität und 96,4% LiveCodeBench-Score.

DeepSeek-V4: Architektur für Million-Token-Reasoning im Detail
DeepSeek-V4 unterstützt ein Kontextfenster von einer Million Token und adressiert dabei gezielt die systemischen Schwächen langer Kontexte – von KV-Cache über Attention-Mechaniken bis hin zur Inferenz-Ökonomie.

DeepSeek V4 Pro (1,6T-A49B) und Flash (284B-A13B) auf Huawei Ascend lauffähig
DeepSeek veröffentlicht V4 Pro mit 1,6 Billionen Parametern (49B aktiv) und das kleinere Flash-Modell (284B/13B aktiv) – beide in Base- und Instruct-Variante, kompatibel mit Huawei Ascend-Chips.

DeepSeek veröffentlicht Vorschau auf nächste Modellgeneration V4
DeepSeek hat eine Preview seines Open-Source-Modells V4 veröffentlicht, das laut Hersteller mit führenden Closed-Source-Systemen von Anthropic, Google und OpenAI konkurrieren soll – mit besonderem Fokus auf Coding und Huawei-Chip-Kompatibilität.

DeepSeek V4: Frontier-nah bei einem Bruchteil der Kosten
DeepSeek V4 positioniert sich laut Simon Willison nahe an frontier-Modellen, jedoch zu deutlich geringeren Kosten – ein weiterer Schritt in DeepSeeks Strategie für kosteneffiziente Spitzenmodelle.

DeepSeek V4 Pro und Flash jetzt auf Vercels AI Gateway verfügbar
Vercel integriert DeepSeek V4 in sein AI Gateway – in zwei Varianten: V4 Pro für agentic Coding und mathematisches Reasoning, V4 Flash für schnelle, kostengünstige High-Volume-Workloads. Beide Modelle bieten 1M Token Kontextfenster.
GH200 NVL2 vs. 8× RTX 6000 Blackwell: Welches Setup für Kimi K2.6 / DeepSeek V4?
Ein Entwickler-Team (5 Personen, agentisches Coding) sucht die beste Hardware für ~100–150k USD, um Kimi K2.6 und DeepSeek V4 lokal zu betreiben – zwischen GH200 NVL2 (~95k) und 8× RTX 6000 Pro Blackwell (~140k).
DeepSeek sichert 10,29-Milliarden-Dollar-Finanzierungsrunde – Fokus auf Open-Source-KI
DeepSeek treibt eine Finanzierungsrunde über 10,29 Milliarden Dollar voran. Gründer Liang Wenfeng bekräftigt, weiterhin auf Open-Source-KI und das AGI-Ziel zu setzen statt kurzfristige Kommerzialisierung zu verfolgen.
DeepSeek-V4 auf 4× RTX 2080 Ti: 255 Prefill-Token/s für unter 2.500 USD
Ein Entwickler betreibt DeepSeek-V4-Flash (284B Parameter, 13B aktiv) auf vier RTX 2080 Ti für unter 2.500 USD – mit custom Turing-CUDA-Kerneln, W8A8-Quantisierung und 255 Prefill-Token/s.