
Google Gemini Omni: Hands-on mit dem Anything-to-Anything-KI-Modell
The Verge hat Googles neues Gemini-Omni-Modell in einem Hands-on-Test ausprobiert, das als „Anything-to-Anything"-System konzipiert ist – also beliebige Kombinationen von Text, Bild, Audio und Video als Ein- und Ausgabe unterstützt. Im Test wurde demonstriert, wie das Modell verwendet wurde, um realistische Deepfake-Videos eines Kuscheltiers zu erstellen, das scheinbar im Urlaub ist. Das Experiment knüpft an einen Gemini-Werbespot von Google an und zeigt, wie niedrig die technische Hürde für überzeugende KI-generierte Videos inzwischen ist. Der Autor beschreibt die Balance zwischen harmlosem Kreativ-Einsatz und der Produktion von KI-Slop als zunehmend schwer zu ziehen. Das Modell erfordert laut Bericht überraschend wenig Aufwand oder Fachkenntnisse, um täuschend echte Ergebnisse zu erzielen – ein Trend, der sich laut Autor weiter fortsetzt.
- Gemini Omni unterstützt beliebige Kombination von Modalitäten als Ein- und Ausgabe (Text, Bild, Audio, Video).
- Praxistest: Deepfake-Videos eines Kuscheltiers wurden mit minimalem Aufwand und Know-how erstellt.
- Autorin verweist auf einen früheren Gemini-Werbespot von Google als Inspiration für den Experiment-Ansatz.
- Der Beitrag diskutiert die fließende Grenze zwischen kreativem KI-Einsatz und der Produktion von KI-Slop.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge

Google Gemini Omni: Hands-on mit dem Anything-to-Anything-KI-Modell
The Verge hat Googles neues Gemini-Omni-Modell in einem Hands-on-Test ausprobiert, das als „Anything-to-Anything"-System konzipiert ist – also beliebige Kombinationen von Text, Bild, Audio und Video als Ein- und Ausgabe unterstützt. Im Test wurde demonstriert, wie das Modell verwendet wurde, um realistische Deepfake-Videos eines Kuscheltiers zu erstellen, das scheinbar im Urlaub ist. Das Experiment knüpft an einen Gemini-Werbespot von Google an und zeigt, wie niedrig die technische Hürde für überzeugende KI-generierte Videos inzwischen ist. Der Autor beschreibt die Balance zwischen harmlosem Kreativ-Einsatz und der Produktion von KI-Slop als zunehmend schwer zu ziehen. Das Modell erfordert laut Bericht überraschend wenig Aufwand oder Fachkenntnisse, um täuschend echte Ergebnisse zu erzielen – ein Trend, der sich laut Autor weiter fortsetzt.
- Gemini Omni unterstützt beliebige Kombination von Modalitäten als Ein- und Ausgabe (Text, Bild, Audio, Video).
- Praxistest: Deepfake-Videos eines Kuscheltiers wurden mit minimalem Aufwand und Know-how erstellt.
- Autorin verweist auf einen früheren Gemini-Werbespot von Google als Inspiration für den Experiment-Ansatz.
- Der Beitrag diskutiert die fließende Grenze zwischen kreativem KI-Einsatz und der Produktion von KI-Slop.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.