Google Gemini Omni: Hands-on mit dem Anything-to-Anything-KI-Modell

Warum es zählt

Realistische KI-Videogenerierung ist mit Gemini Omni bereits mit minimalem Aufwand und Vorwissen möglich – das senkt die Einstiegshürde für Entwickler und Content-Ersteller erheblich, wirft aber gleichzeitig Fragen zu Deepfake-Missbrauch auf.

— Lumeric Redaktion

The Verge hat Googles neues Gemini-Omni-Modell in einem Hands-on-Test ausprobiert, das als „Anything-to-Anything"-System konzipiert ist – also beliebige Kombinationen von Text, Bild, Audio und Video als Ein- und Ausgabe unterstützt. Im Test wurde demonstriert, wie das Modell verwendet wurde, um realistische Deepfake-Videos eines Kuscheltiers zu erstellen, das scheinbar im Urlaub ist. Das Experiment knüpft an einen Gemini-Werbespot von Google an und zeigt, wie niedrig die technische Hürde für überzeugende KI-generierte Videos inzwischen ist. Der Autor beschreibt die Balance zwischen harmlosem Kreativ-Einsatz und der Produktion von KI-Slop als zunehmend schwer zu ziehen. Das Modell erfordert laut Bericht überraschend wenig Aufwand oder Fachkenntnisse, um täuschend echte Ergebnisse zu erzielen – ein Trend, der sich laut Autor weiter fortsetzt.

Was wir noch wissen

Gemini Omni unterstützt beliebige Kombination von Modalitäten als Ein- und Ausgabe (Text, Bild, Audio, Video).
Praxistest: Deepfake-Videos eines Kuscheltiers wurden mit minimalem Aufwand und Know-how erstellt.
Autorin verweist auf einen früheren Gemini-Werbespot von Google als Inspiration für den Experiment-Ansatz.
Der Beitrag diskutiert die fließende Grenze zwischen kreativem KI-Einsatz und der Produktion von KI-Slop.

Quelle lesentheverge.com

Multimodal Videogenerierung Foundation Modelle

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Google Gemini Omni: Hands-on mit dem Anything-to-Anything-KI-Modell

ToolsGemini

CompaniesGoogle DeepMind

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Gemini Omni unterstützt beliebige Kombination von Modalitäten als Ein- und Ausgabe (Text, Bild, Audio, Video).
Praxistest: Deepfake-Videos eines Kuscheltiers wurden mit minimalem Aufwand und Know-how erstellt.
Autorin verweist auf einen früheren Gemini-Werbespot von Google als Inspiration für den Experiment-Ansatz.
Der Beitrag diskutiert die fließende Grenze zwischen kreativem KI-Einsatz und der Produktion von KI-Slop.

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Google Gemini Omni: Hands-on mit dem Anything-to-Anything-KI-Modell

Frag die KI zum Artikel

Verwandte Beiträge

Google Gemini Omni: Hands-on mit dem Anything-to-Anything-KI-Modell

Frag die KI zum Artikel

Verwandte Beiträge