Sonntag7. Juni
KI-Regulierung gerät auf beiden Seiten des Atlantiks unter Druck – während die USA staatliche Regeln aushebeln wollen, verbietet England KI in Gerichtsaussagen. Dazu: neue Agenten-Modelle, lokale Inferenz-Benchmarks und ein RSI-Labor, das die Compute-Logik der Branche herausfordert.


Die regulatorische Tektonik verschiebt sich auf beiden Seiten des Atlantiks – und zwar in entgegengesetzte Richtungen. In Washington hat das US-Repräsentantenhaus einen Gesetzesentwurf vorgelegt, der einzelnen Bundesstaaten untersagen würde, eigene KI-Regulierungen zu erlassen – ein Schritt, der den regulatorischen Flickenteppich beseitigen, zugleich aber strenge Verbraucherschutzregeln etwa Kaliforniens aushebeln würde. Passend dazu verlässt Sriram Krishnan das Weiße Haus Ende Juni: Der Senior Policy Advisor für KI, der zuvor bei Microsoft, Twitter und Andreessen Horowitz tätig war, hatte die Administrations-KI-Agenda mitgeprägt – darunter den AI Action Plan, der Rechenzentrumsausbau über Regulierung und Sicherheit priorisierte, sowie eine Executive Order zur Bekämpfung staatlicher KI-Regeln. Nach dem Abgang von David Sacks ist Krishnan damit eine weitere Schlüsselfigur, die das Feld verlässt, wenngleich er laut Washington Post plant, eine externe Institution zu gründen, um weiterhin Einfluss auf Trumps KI-Politik zu nehmen. In England läuft die Entwicklung in die andere Richtung: Behörden haben der Polizei in England und Wales angewiesen, KI bei der Erstellung von Gerichtsaussagen vorläufig zu stoppen – ein Signal, dass Legal-AI-Tools im Justizsystem unter verschärften Compliance-Druck geraten.

Während die Politik über Leitplanken streitet, liefern die Labs neue Fakten. Alibaba hat Qwen3.7-Plus veröffentlicht, ein multimodales Modell, das visuelle Wahrnehmung, GUI-Bedienung und Coding in einem einzigen Agenten-Loop vereint. In Demos ließ das Modell einen Agenten über elf Stunden autonom eine App mit mehr als 10.000 Codezeilen entwickeln und die native macOS-Stocks-App eigenständig nachbauen. Auf GUI-Benchmarks wie AndroidWorld und ScreenSpot Pro übertrifft Qwen3.7-Plus laut Alibabas eigenen Messungen Konkurrenzmodelle – bei reinen Reasoning-Benchmarks wie MedXpertQA-MM bleibt es hinter Gemini 3.1 Pro zurück. Das Modell ist proprietär und über Alibaba Cloud verfügbar. Deutlich radikaler setzt die japanische Startup Sakana AI an: Das Unternehmen hat das Sakana AI RSI Lab gegründet, eine Forschungsgruppe für rekursive Selbstverbesserung. Der Ansatz: statt immer größerer Modelle mit massivem Compute-Einsatz setzt Sakana auf evolutionäre Optimierung, bei der KI-Agenten aktiv an ihren eigenen technischen Grundlagen arbeiten und Code für ihre eigenen Architekturen schreiben. Ein Vorläufer-Projekt, The AI Scientist, schrieb laut Sakana ein Paper, das ein Peer-Review-Verfahren bestand – die zugrundeliegende Forschung wurde im März 2026 in Nature veröffentlicht. Das RSI-Labor skizziert einen Vier-Phasen-Fahrplan, der auf moderate Compute-Ressourcen ausgelegt ist – eine direkte Herausforderung an das Skalierungsparadigma der großen US-Labs.

Für Entwickler, die Modelle lokal betreiben, liefert die Community derweil ernüchternde Befunde: Ein Community-Benchmark zu Gemma 4 31B zeigt, dass Googles offizielles QAT-Q4_0-Quantisierungsformat auf wikitext-2 nur 50,43 % Top-1-Accuracy gegenüber der Q8_0-Referenz erreicht, während das klassische Q4_K_M-Format 66,06 % erzielt – ein Ergebnis, das Googles implizitem QAT-Versprechen widerspricht und unabhängige Reproduktion verdient. Ergänzend dazu bietet das Open-Source-Projekt open-deepthink in Version Beta-0.0.3 strukturierte Knowledge Distillation aus LLMs über einen mehrschichtigen Agenten-Graphen: Entwickler können damit domänenspezifisches Wissen aus geschlossenen Modellen extrahieren und als JSON-Datensätze für Fine-Tuning nutzen – lokal via llama.cpp oder über OpenRouter. Die aktuelle Version bringt einen stabilen Distillation-Modus sowie 195 bestandene Tests. Wer den Forschungsstand auf einem breiteren Level einordnen möchte, findet bei Sebastian Raschka eine kuratierte LLM-Paper-Liste für Januar bis Mai 2026, die zehn Kategorien von Hybrid-Architekturen über Inferenz-Effizienz bis hin zu Agentensystemen abdeckt – mit explizitem Fokus auf Long-Context-Effizienz als prägende Anforderung des Jahres.

Am anderen Ende des Qualitätsspektrums steht ein Befund, der die Desinformationsdebatte neu befeuert: Die Meta AI App zeigte einen vollständig KI-generierten Clickbait-Newsfeed mit einer „For You"-Sektion, deren Themen, Bilder und Texte ausschließlich von KI erzeugt wurden – ohne Quellenangaben, mit erfundenen Expertenaussagen und fiktiven Recherchen. Erst nachdem The Verge Fragen an Meta stellte, kündigte das Unternehmen an, das Feature zurückzuziehen. Der Fall illustriert, wie schnell KI-generierte Inhalte als scheinbar redaktionelles Format auftreten können – und welche Qualitätskontrolle dabei ausbleibt. Dass Teams bei der Wahl ihrer eigenen Daten- und Experimentierinfrastruktur gleichzeitig strukturierter vorgehen, zeigt ein Praxisbericht von ManyChat zur Wahl zwischen Eppo und Statsig: Das beschriebene Phasenmodell aus Desk Research, Demos und Proof of Concept liefert ein konkretes Gegenstück zur Schnellentscheidung – und mahnt zur Vorsicht bei Plattformen mit Lock-in-Potenzial, gerade in einem Marktumfeld, in dem Anbieter wie Statsig während der Evaluation den Eigentümer wechselten.
Frag das Briefing
Pro- Mi., 10. JuniClaude Fable 5 dominiert den Tag – von Praxistests über Sicherheitssperren bis zu Supply-Chain-Risiken. Daneben setzen neue Benchmarks, Developer-Tools und Infrastruktur-Moves das Tempo für AI-Builder.10
- Di., 9. JuniApple dominiert heute mit einer Salve an WWDC-Ankündigungen rund um KI-Integration, Developer-Tools und Gemini-Kooperation. Daneben: OpenAIs IPO-Vorbereitung, ein kritischer Sicherheitsfund für AI-Coding-Agents und Microsoft Discovery als neuer Agentic-R&D-Stack.10
- Mo., 8. JuniAgentenplattformen dominieren heute: OpenAI baut ChatGPT zur Superapp um, während Builder-Tools und MoE-Frameworks die Infrastruktur darunter aufrüsten. Dazu: DeepSeeks Aufstieg in US-Firmen und ein Urteil, das KI-Haftung neu definieren könnte.10
- Sa., 6. JuniKI-Infrastruktur trifft regulatorischen Gegenwind: Google mietet massiv GPU-Kapazität extern, New York stoppt Rechenzentren per Moratorium – während auf Produkt- und Tooling-Ebene neue Agenten-Architekturen, Sicherheitsmechanismen und RL-Praxis die Agenda bestimmen.10




