Dienstag26. Mai
KI-ROI unter Beschuss, autonome Systeme in Recht und Krieg — und Google prescht mit drei neuen Gemini-Produkten vor. Dazu konkrete Builder-Tools: lokale Voice-Alternativen, offene Modelle und RLVR-Pipelines.


Die zentrale Frage dieser Woche lautet: Wer zahlt für die KI-Rechnung — und wer bekommt dafür etwas zurück? Uber-Präsident Andrew Macdonald liefert die bisher deutlichste Unternehmenskritik: Trotz eines verbrauchten KI-Jahresbudgets schon nach vier Monaten und eines F&E-Aufwands von 3,4 Milliarden Dollar im Jahr 2025 sieht er keinen messbaren Zusammenhang zwischen Token-Volumen und nutzbaren Consumer-Features. "That link is not there yet" — ein Satz, der in den Vorstandsetagen weit über den Transportsektor hinaus nachhallen dürfte. Dass KI-Ausgaben Headcount substituieren sollen, macht den Druck nicht geringer: Die stillere Schattenseite beschreibt ein MIT-Technology-Review-Beitrag zu Einstiegsjobs, der auf eine Stanford-Studie verweist, wonach Arbeitnehmer zwischen 22 und 25 Jahren in stark KI-exponierten Berufen bereits eine 16-prozentige relative Beschäftigungseinbuße verzeichnen — während ältere Kollegen und weniger exponierte Sektoren weitgehend stabil bleiben. Fehlen die Juniorpositionen, fehlt mittelfristig die Talentpipeline.

Parallel befeuert Google den Wettbewerb, statt ihn zu bremsen. Das LWiAI-Podcast-Briefing zu Google I/O listet drei neue Systeme: Gemini 3.5 Flash für Speed und Benchmarks, den stets aktiven Cloud-Agenten Gemini Spark mit MCP-Tool-Support sowie Gemini Omni für multimodale Video-Generierung und -Bearbeitung. Hinzu kommen Cursor Composer 2.5 — feinjustiert auf Moonshots Kimi K2.5 — und der frühe Launch von xAIs Grok Build als Coding-Agent. Auf der Geschäftsseite schließt Anthropic eine 30-Milliarden-Dollar-Finanzierungsrunde bei einer Bewertung von 900 Milliarden Dollar ab und prognostiziert sein erstes profitables Quartal. Der Kontrast zur Uber-Skepsis könnte nicht schärfer sein: Während der eine Großkunde den ROI anzweifelt, schiessen die Bewertungen der Anbieter gen Himmel. Wer die nächste Kurve im RSI-Narrativ schon einpreist: Das AI-Supremacy-Essay zu Recursive Self-Improving AI sieht 2027 als möglichen Wendepunkt — wobei selbst DeepMind-CEO Demis Hassabis aktuelle Systeme ausdrücklich weit von echter AGI entfernt sieht.

KI verändert nicht nur Märkte, sondern auch Institutionen — und schneller als erwartet. Eine MIT-/USC-Studie, ausgewertet anhand von 4,5 Millionen Zivilklagen zwischen 2005 und 2026, zeigt: Die Flut KI-generierter Pro-se-Klagen an US-Bundesgerichten hat die Selbstvertretungsquote von stabilen 11 Prozent auf 16,8 Prozent in 2025 getrieben — 41.490 Einreichungen, fast doppelt so viele wie im Vor-KI-Durchschnitt. Der KI-Textdetektor Pangram flaggte in frühen 2026er Beschwerden bereits 18 Prozent als KI-generiert. Parallel eskaliert die Debatte um letale autonome Waffensysteme: Anthropic versucht als bislang einziger Militärauftragnehmer zwei "Red Lines" zu ziehen — ein Verbot von Massenüberwachung im Inland und von Waffen, die Ziele ohne menschliche Beteiligung identifizieren, verfolgen und töten können. Die UN-Konvention über bestimmte konventionelle Waffen, die sich mit letalen autonomen Systemen befasst, hält mit dieser Entwicklung kaum Schritt.

Für Builder-Teams, die unabhängig von Cloud-Anbietern agieren wollen, liefert die Woche zwei konkrete Werkzeuge. OmniVoice Studio ist eine quelloffene Desktop-Applikation, die Voice-Cloning aus einem Drei-Sekunden-Clip, Video-Dubbing, Echtzeit-Diktat, Vokal-Isolierung und Speaker-Diarization vollständig lokal ausführt — ohne Daten an externe Server zu senden — und sich über einen MCP-Server direkt in Claude, Cursor oder eigene Toolchains einbinden lässt. Als Gegenstück zu kommerziellen Diensten wie ElevenLabs, die zwischen 5 und 330 Dollar monatlich kosten, ist es ein direktes Argument für Datenschutz-konforme Pipelines. Auf Modell-Ebene erscheint Qwen3.5-27B Uncensored Heretic — eine abliterierte Version mit allen 15 nativen Multi-Token-Prediction-Köpfen, in fünf Formaten (Safetensors, GGUF, NVFP4, NVFP4-GGUF, GPTQ-Int4) quantisiert. Für diejenigen, die Reinforcement Learning mit verifizierbaren Belohnungen testen möchten, gibt das Open-MM-RL-RLVR-Tutorial eine praxisnahe Vorlage: Es lädt den TuringEnterprises/Open-MM-RL-Datensatz, analysiert Domänen und Antworttypen, baut eine leichtgewichtige Reward-Funktion und exportiert alles in eine GRPO-kompatible Struktur für multimodales RL-Training.

Der rote Faden durch all das: Vertrauen wird zur knappen Ressource — gegenüber KI-Ausgaben ohne messbaren Return, gegenüber Systemen in Gerichten und Schlachtfeldern, und auch im Zwischenmenschlichen. Y-Combinator-Gründer Paul Graham bringt das auf den Punkt: KI-geschriebene Gründer-E-Mails fühlen sich für ihn an wie eine Lüge. Eine Studie der Ohio State University mit 208 Teilnehmern bestätigt das Muster — Empfänger bewerten KI-generierte Nachrichten als Zeichen von Nachlässigkeit und mangelnder Aufrichtigkeit. Eine BetterUp-Labs-Umfrage unter 1.150 US-Beschäftigten ergab, dass 40 Prozent regelmäßig substanzlose KI-Inhalte von Kollegen erhalten; rund die Hälfte stuft deren Absender als weniger kreativ, kompetent und vertrauenswürdig ein. Die Technologie ist mächtig — aber ihr Einsatz ohne Urteilsvermögen zerstört genau das soziale Kapital, auf das sie aufbauen müsste.
Frag das Briefing
Pro- Do., 28. MaiOpenAIs IPO-Weg ist frei, Snowflake bindet sich für 6 Mrd. an AWS-Chips, und NVIDIA verdreifacht Taiwans Stellenwert als KI-Epizentrum — während auf der Werkzeugseite neue Agent-Frameworks, Inferenz-Rekorde und ein selbstverbessernder Steuer-Agent zeigen, was Builder heute schon umsetzen können.10
- Mi., 27. MaiSicherheit dominiert heute: von kritischen Lücken in KI-Agenten-Infrastruktur über Deepfake-Verhaftungen bis zu halluzinierten Zitaten in Medizinleitlinien. Daneben treiben Routing-Effizienz, Open-Source-Realismus und die Frage, was Agenten außerhalb Dev-Tooling tatsächlich einsatzfähig macht, die Builder-Agenda.10
- Mo., 25. MaiAgent-Infrastruktur reift zur Produktionsreife: AWS MCP geht GA, Google Genkit bekommt Middleware — während Shadow AI und Chatbot-Exploits zeigen, dass Security nicht nachgerüstet werden kann. Parallel bestimmt Kapitalstruktur das Frontier-Spiel: HBM-Kosten, Cerebras-IPO und 45-Mrd.-Compute-Deals setzen neue Selektionskriterien.10
- So., 24. MaiAgent-Infrastruktur und Modellkosten dominieren heute: DeepSeek zwingt die Branche zur Preisdiskussion, während neue Tools für lokale Agent-Gedächtnisse und Workflow-Orchestrierung reif für den Einsatz werden. Dazu: warum OCR Vision-LLMs bei PDFs schlägt und Anthropics selbstkritische Warnung vor der Bug-Patch-Lücke.






