Mittwoch24. Juni

KI-Infrastruktur unter Druck: Chinas Supercomputer-Comeback, SpaceX als Neocloud und Oracles schuldenfinanzierter GPU-Ausbau zeigen, wie brutal der Kapitalwettbewerb wird. Dazu: konkrete Builder-Moves bei Coding-Agenten, Enterprise-Deployments und ein ernüchternder Blick auf Meta-Ausfälle durch unkontrollierten KI-Code.

Lead-Story

SpaceX als Neocloud: GPU-Deals summieren sich auf 28 Mrd. USD/Jahr

Briefing

Der Kapitalwettbewerb um KI-Infrastruktur hat eine neue Eskalationsstufe erreicht. Oracle entlässt 21.000 Mitarbeitende und finanziert seinen GPU-Ausbau über Schulden: Rund die Hälfte der geplanten 45 bis 50 Milliarden Dollar für Oracle Cloud Infrastructure soll über Fremdkapital eingesammelt werden – bei einem bereits bestehenden Schuldenberg von über 120 Milliarden Dollar. Gleichzeitig etabliert sich SpaceX als Neocloud mit annualisierten GPU-Deals von 28 Mrd. USD pro Jahr: Anthropic, Google und nun Reflection AI zahlen zusammen über 2,3 Milliarden Dollar monatlich für Zugang zu Blackwell GB300-Hardware – zu Preisen von über zehn Dollar pro Stunde, was in etwa dem Doppelten des aktuellen CoreWeave-Jahresumsatzes entspricht. Und im Hintergrund vollzieht sich ein geopolitischer Systemwechsel: Ein chinesischer Supercomputer hat US-Maschinen erstmals seit 2017 von der Spitze der Weltrangliste verdrängt – betrieben mit chinesischen Chips, trotz westlicher Exportbeschränkungen. Die Infrastrukturlandschaft fragmentiert sich schneller, als Governance-Konzepte folgen können.

Dass dieser Kapitaleinsatz ökonomisch nicht selbsttragend ist, zeigen die Zahlen hinter den Zahlen. OpenAI verbuchte 2025 einen Nettoverlust von 38,5 Mrd. USD bei 13,07 Mrd. USD Umsatz – ein Verhältnis, das die strukturelle Subventionierung des gesamten KI-Marktes offenbart. Analysen legen nahe, dass Anthropic Enterprise-Kunden mit bis zum 40-fachen des tatsächlichen Token-Preises subventioniert, OpenAI sogar mit dem 70-fachen. Oracles Abhängigkeit von OpenAI als noch unrentablem Großkunden verschärft das Risiko weiter: Bondholders haben Oracle bereits verklagt, weil das Unternehmen die Notwendigkeit weiterer Schuldenaufnahme für den KI-Ausbau verschleiert haben soll. Das Modell – massive Subventionierung jetzt, Monetarisierung später – funktioniert nur, solange Kapital günstig fließt und Nutzer abhängig bleiben.

Während die Infrastrukturschicht unter Kostendruck steht, liefert die Serving-Seite konkrete Effizienzgewinne. SGLang hat den DeepSeek-V4-Durchsatz auf GB300-Hardware seit dem Day-0-Launch um den Faktor fünf gesteigert – durch Kernel-Optimierungen wie MHC-Fusion, W4A4 MegaMoE und KV Compression V2. Besonders relevant: Die Kurven halten Durchsatz jetzt deutlich stabiler im interaktiven Bereich von 40 bis 90 Tokens pro Sekunde und User, genau dort, wo produktive Deployments operieren. Das bedeutet, dass dieselbe Hardware signifikant mehr Anfragen bedienen kann – ein direkter Hebel auf die Kapitaleffizienz. Auf der Gegenseite des Spektrums zeigt ein Schritt-für-Schritt-Guide zu lokalen Coding-Agenten mit Gemma 4 und OpenCode, dass leistungsfähige Agenten-Setups mittlerweile auf einem Laptop mit Consumer-GPU laufen – ohne Cloud-Kosten und ohne Code an externe Anbieter zu senden.

Im Enterprise-Deployment-Bereich verdichten sich die Bewegungen. Anthropic bringt Claude Tag als dauerhaften KI-Teamkollegen in Slack: Die Funktion ermöglicht persistente Kontextakkumulation über Kanäle hinweg, automatisches Initiativhandeln im Ambient-Modus und aufgabenbasiertes Arbeiten mit Tool-Zugang – beschränkt auf Administrator-definierte Channels, sodass ein Claude für Legal-Arbeit keine Daten in den Engineering-Kanal einstreuen kann. Parallel kündigt Cursor ein eigenes, von Grund auf trainiertes KI-Modell, eine neue Git-Plattform namens Origin und eine iOS-App an: Das Modell wird gemeinsam mit SpaceX trainiert, nutzt zehn- bis zwanzigmal mehr Compute als frühere Cursor-Modelle und soll über reines Coding hinausgehen. Origin wiederum ist eine Git-Plattform für Menschen und KI-Agenten gleichzeitig, die Merge-Konflikte auflöst, fehlgeschlagene CI-Tests behebt und in Lasttests mit tausenden parallelen Agenten-Schreibzugriffen auf ein Repository getestet wurde. Für Entwickler, die Agenten-Frameworks lieber deklarativ aufsetzen wollen, bietet IBMs CUGA einen Open-Source-Ansatz, bei dem ein vollständiger Agent per `pip install cuga` aus Tool-Liste und Prompt konfiguriert wird – inklusive OpenAPI-, MCP- und LangChain-Tool-Unterstützung sowie Multi-Agent-Delegation via A2A.

Die Kehrseite beschleunigter KI-Adoption liefert das deutlichste Warnsignal der Woche. Meta erlebte nach Einschätzung des Pragmatic Engineer seinen schlimmsten Ausfall der Firmengeschichte: KI-generierter, KI-reviewter Code ermöglichte es, durch eine einfache Anfrage an den Meta-AI-Bot die E-Mail-Adresse beliebiger Accounts zu ändern – auch fremder, darunter hochrangige öffentliche Profile. Laut Ingenieuren im Unternehmen war die Ursache eine Kombination aus KI-generiertem Code ohne menschliche Überprüfung, Entlassungen und Zwangsumsetzungen von Integrity-Teams auf KI-Labeling-Aufgaben. Das Muster ist systemisch: Geschwindigkeit bei der KI-Adoption ohne proportionale Investition in Reliability- und Security-Kapazitäten erzeugt Risiken, die sich erst in der Produktion materialisieren – und dann öffentlich. Für Engineering-Leader ist das weniger eine Frage der Technologie als eine der organisatorischen Priorisierung.

— Lumeric Redaktion

Frag das Briefing

Pro

Stelle Folgefragen zum Briefing — über alle 10 Posts hinweg synthetisiert, mit Verweis auf die konkreten Headlines. Pro-Feature. Pro freischalten →

Mehr von Lumeric

Predictions Ledger Trust Index Podcast abonnieren Privacy-First ★ Pro

Themen heute

Cursor kündigt eigenes KI-Modell, neue Git-Plattform und Mobile App an

Anthropic bringt Claude Tag als dauerhaften KI-Teamkollegen in Slack

IBM CUGA: Zwei Dutzend Beispiel-Apps für agentic Enterprise-Entwicklung

Frühere Briefings