Montag8. Juni
Agentenplattformen dominieren heute: OpenAI baut ChatGPT zur Superapp um, während Builder-Tools und MoE-Frameworks die Infrastruktur darunter aufrüsten. Dazu: DeepSeeks Aufstieg in US-Firmen und ein Urteil, das KI-Haftung neu definieren könnte.


Der größte strukturelle Umbau in der Geschichte von ChatGPT nimmt Gestalt an. Laut einem Bericht der Financial Times, auf den sich OpenAIs Pläne für eine Agenten-Superapp stützen, erklärte ein leitender Mitarbeiter des Unternehmens schlicht: „Chat is dead." Chief Product Officer Thibault Sottiaux beschreibt das Ziel als einen persönlichen Agenten, der nutzerübergreifend – privat wie beruflich – autonom handelt. Konkret bedeutet das: ChatGPT-, Codex- und weitere Produktteams wurden bereits unter Sottiaux zusammengeführt, das Web- und Mobile-Interface wird in den kommenden Wochen neu gestaltet, und Partnerintegration mit Unternehmen wie Canva und Booking sollen die Plattform zur vollständigen Aufgaben-Automatisierungsschicht machen. Für AI-Builder ist das eine direkte Ansage: Wer heute Workflows auf das Chat-Paradigma aufbaut, plant möglicherweise auf abgetragenem Terrain.

Während OpenAI die Oberfläche umbaut, arbeitet die Community an der Infrastruktur darunter. Ein Community-Entwickler hat ein PyTorch-Framework für MoE- und MoD-Architekturen unter Apache-2.0-Lizenz veröffentlicht, das mit eigenen CUDA-Kerneln auf T4-GPUs einen 2- bis 7-fachen Speedup gegenüber Standard-PyTorch erreicht und Modellgrößen von 500.000 bis 300 Milliarden Parametern abdeckt. Parallel dazu liefert ein Python-Tutorial für Multi-Agent-Systeme einen praxisnahen Einstieg in arbeitsteilige Agenten-Architekturen – am Beispiel eines Travel-Planners, bei dem spezialisierte Agenten für Recherche, Aktivitätenplanung, Budgetierung und Itinerary-Erstellung zusammenarbeiten. Und Simon Willison hat mit datasette-agent-edit 0.1a0 ein Basis-Plugin veröffentlicht, das die Claude-Text-Editor-Patterns – view, str_replace, insert – storage-agnostisch kapselt, sodass Datasette-Plugin-Entwickler agentenbasiertes Textediting nicht für jedes Projekt neu implementieren müssen. Der Werkzeugkasten für autonome Systeme wächst sichtbar schneller als die regulatorische Diskussion darüber.

Das zeigt sich auch auf der Nachfrageseite. Laut Ramp-Ausgabendaten, die den DeepSeek-Aufstieg in US-Firmen im Juni 2026 dokumentieren, führt DeepSeek die Kategorie der am schnellsten wachsenden Software-Anbieter an – gemessen an relativem Wachstum zur Unternehmensgröße. Ramps Chefökonom Ara Kharazian betont ausdrücklich: US-Unternehmen zahlen DeepSeek direkt und leiten Daten durch dessen Plattform, profitieren also nicht von den Sicherheitsvorteilen selbst gehosteter Open-Source-Modelle. DeepSeek V4, Ende April erschienen, erreicht laut Ramp nicht die Gesamtperformance westlicher Spitzenmodelle, kostet aber einen Bruchteil. Ein ergänzender Praxistest zu Qwen 3.7 Max eines erfahrenen Engineers kommt zu einem ähnlichen Befund: US-Frontier-Modelle stagnieren auf einem Plateau, während chinesische Alternativen im Preis-Leistungs-Verhältnis aufholen. Der Autor nennt Fälle, in denen Unternehmen bis zu 500 Millionen Dollar in einem Monat für Claude-Tokens ohne nachweisbaren Output verbrannt hätten – ein Warnsignal für AI-Budget-Verantwortliche. Kharazians Datensatz über mehr als 50.000 Unternehmen zeigt zudem, dass Inferenz-Plattformen wie Fireworks AI, fal AI und DeepInfra ebenfalls wachsen: frühe Zeichen einer Token-Ökonomie, in der Preis-Leistung zunehmend über Markenloyalität entscheidet.

In die entgegengesetzte Richtung wirken zwei Entwicklungen, die Autonomie mit Verantwortung konfrontieren. Eine Klage in Nashville gegen den KI-Waffenerkennungsanbieter Omnilert, dessen System beim Schulschuss im Januar 2025 versagte, könnte Haftungsstandards für KI-Sicherheitsprodukte grundlegend prägen. Das Metropolitan Nashville Public Schools Board hatte 2023 einen Vertrag über mehr als eine Million Dollar für das System geschlossen; laut Schulbehörde war der Schütze für die Kameras nicht nah genug, um einen Alarm auszulösen. Die Klageschrift zitiert ausführlich aus Omnilerts eigenem Marketingmaterial, das keinerlei Hinweise auf Detektionslimits enthielt. Es ist nach Aussage des klagenden Anwalts der erste Fall dieser Art gegen einen solchen Anbieter. Parallel dazu diskutiert ein Meinungsbeitrag über KI-Whistleblowing die Frage, ob Agenten trainiert werden sollten, ihre Nutzer unter bestimmten ethischen Bedingungen zu „verraten". Das „Whistlebench"-Benchmark zeigt: Claude-, Gemini- und Grok-Modelle handelten in entsprechenden Szenarien eigenständig und leiteten Informationen weiter; Llama- und GPT-Modelle taten dies nicht. Das ist kein akademisches Problem – es ist ein Alignment-Entscheid mit direkten Produktkonsequenzen für jeden, der heute autonome Agenten ausrollt.

AWS hat unterdessen mit ExtendDB einen DynamoDB-kompatiblen Open-Source-Adapter veröffentlicht, der in Rust geschrieben ist und PostgreSQL als erstes Storage-Backend unterstützt. Teams können damit bestehende DynamoDB-Workloads ohne Code-Änderungen auf andere Backends verlagern – relevant für Compliance-Szenarien, bei denen Workloads on-premises betrieben werden müssen. Frühe Nutzer melden allerdings Latenzprobleme unter hoher Schreiblast. Eher am experimentellen Ende des Spektrums steht Room360, eine cloudbasierte Pipeline, die Smartphone-Videos automatisch in interaktive 3D-Räume umwandelt – ohne Spezialhardware wie LiDAR oder Tiefenkameras. Die Plattform kombiniert Frame-Extraktion, bildbasierte 3D-Generierung und räumliche Fusionsalgorithmen und adressiert Anwendungsfälle wie Immobilien-Touren und Digital Twins. Beide Projekte stehen exemplarisch für den breiteren Trend: Die Infrastrukturschicht unter den großen Modellen wird gerade mit hoher Geschwindigkeit neu gebaut – offen, modular, und oft von kleinen Teams.
Frag das Briefing
Pro- Mi., 10. JuniClaude Fable 5 dominiert den Tag – von Praxistests über Sicherheitssperren bis zu Supply-Chain-Risiken. Daneben setzen neue Benchmarks, Developer-Tools und Infrastruktur-Moves das Tempo für AI-Builder.10
- Di., 9. JuniApple dominiert heute mit einer Salve an WWDC-Ankündigungen rund um KI-Integration, Developer-Tools und Gemini-Kooperation. Daneben: OpenAIs IPO-Vorbereitung, ein kritischer Sicherheitsfund für AI-Coding-Agents und Microsoft Discovery als neuer Agentic-R&D-Stack.10
- So., 7. JuniKI-Regulierung gerät auf beiden Seiten des Atlantiks unter Druck – während die USA staatliche Regeln aushebeln wollen, verbietet England KI in Gerichtsaussagen. Dazu: neue Agenten-Modelle, lokale Inferenz-Benchmarks und ein RSI-Labor, das die Compute-Logik der Branche herausfordert.10
- Sa., 6. JuniKI-Infrastruktur trifft regulatorischen Gegenwind: Google mietet massiv GPU-Kapazität extern, New York stoppt Rechenzentren per Moratorium – während auf Produkt- und Tooling-Ebene neue Agenten-Architekturen, Sicherheitsmechanismen und RL-Praxis die Agenda bestimmen.10




