Reve 2.0 und Ideogram 4.0: Layoutsteuerung revolutioniert Bildgenerierung

ToolsOllama Claude GPT Ideogram Llama Hugging Face

CompaniesHugging Face Microsoft AI Google DeepMind Meta AI

Warum es zählt

Layout-Kontrolle via Bounding Boxes macht präzise Bildkomposition erstmals zuverlässig und skalierbar – Ideograms Open-Weights-Release auf Hugging Face senkt die Einstiegshürde für produktionsreife Bildgenerierung erheblich.

— Lumeric Redaktion

Am 3. Juni 2026 brachten Reve und Ideogram quasi zeitgleich neue Bildgenerierungsmodelle auf den Markt, die beide eine präzise Layout-Steuerung per Bounding Boxes als zentrales Feature betonen. Reve 2.0 bezeichnet sich selbst als „bestes 4K-Bildmodell der Welt" und ermöglicht laut Ankündigung erstmals die Erzeugung und Bearbeitung von Bildern über exakte Layouts. Ideogram 4.0 wurde hingegen als „bestes offenes Bildmodell der Welt" positioniert und auf Hugging Face sowie via fal veröffentlicht – ein strategischer Schwenk, da Ideogram bisher als geschlossenes, Design-orientiertes Produkt galt. In der Image Arena landete Ideogram-4.0-Quality auf Platz 8 insgesamt und Platz 1 unter den offenen Modellen, mit besonders starken Ergebnissen bei Textrendering und kommerziellem Design. Parallel dazu veröffentlichte Microsoft seinen MAI-Thinking-1 Tech Report (109 Seiten), der 97 % auf AIME 2025 und 53 % auf SWE-Bench Pro ausweist – trainiert ohne Drittanbieter-Destillation. Auch Google stellte Gemma 4 12B vor, ein Apache-2.0-Multimodal-Modell ohne separaten Vision-Encoder, das bereits in vLLM, Ollama und llama.cpp verfügbar ist.

Quelle lesenlatent.space

Image Arena Overall Ranking · Spitzenwert

GPT-Image-2

Multimodal Open Source Foundation Modelle