Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

Video-Ki Gemini Omni vorgestellt - PCtipp hat sie ausprobiert

Google präsentiert mit Gemini Omni ein neues Modell, das aus allen möglichen Eingaben wie Audio, Text, Video oder Bildern vielfältige Ausgaben erzeugen kann – angefangen bei Videos. Wir haben es getestet.
Screenshot von einem Video, das mit der Omni KI von Gemini erstellt wurde
© Google / Youtube

An der Entwicklerkonferenz Google I/O 2026 wurde unter anderem Gemini Omni vorgestellt.

Das neue Gemini Omni kombiniert Geminis Fähigkeiten zum Schlussfolgern mit der Fähigkeit, Neues zu kreieren. Omni ist ein neues Modell von Google, das aus allen möglichen Eingaben vielfältige Ausgaben erzeugen kann – angefangen bei Videos. Mit Omni können die Nutzer bei der Eingabe Bilder, Audio, Video und Text kombinieren und so hochwertige Videos erstellen, die auf Geminis Allgemeinwissen fundiert sind.

Wir vom PCtipp haben Gemini Omni einem ersten kurzen Test unterzogen. Hier das Resultat im Video:

Der Prompt dazu

Für das Video haben wir ein Foto des Journalisten sowie ein Bild vom PCtipp-Logo und den folgenden Prompt verwendet:

let this person fly in an open old style airplane over switzerland. show the plane from outside. at any moment show a close up of the upper part of the person. The plane is trailing a banner featuring the logo shown in the picture.

An der I/O wurde das erste Modell der Omni-Familie vorgestellt: Gemini Omni Flash. Es ist für alle Abonnenten von Google AI Plus, Pro und Ultra weltweit über die Gemini App sowie Google Flow verfügbar. Gemini Omni Flash wird ausserdem kostenlos für die Nutzer von YouTube Shorts und YouTube Create eingeführt. Schon bald sollen Ausgabeformate wie Bild und Audio unterstützt werden.

Videos per Spracheingabe bearbeiten

Mit Gemini Omni lassen sich Videos einfacher bearbeiten, und zwar mit natürlicher Sprache. Jede Anweisung baut auf der vorherigen auf.Charaktere bleiben konsistent, physische Eigenschaften sind realitätsgetreu und Szenen basieren auf dem, was vorher geschah.

Videos aus jeder beliebigen Kombination von Eingaben

Alles referenzieren. Omni verwandelt jede Referenz – sei es Bild, Text, Video oder Audio – in ein einziges, stimmiges Ergebnis. Während zu Beginn erstmal nur Sprachreferenzen für Audio unterstützt werden, wird Google schon bald weitere Arten von Audio-Eingaben einführen.

Wasserzeichen SynthID

Alle mit Omni erstellten Videos enthalten das unsichtbare digitale Wasserzeichen SynthID. Mit der Gemini App, Gemini in Chrome und der Google Suche lässt sich einfach überprüfen, ob Videos mit Gemini Omni erstellt wurden.

Google
Anzeige

Neueste Beiträge

IFA 2026 im Wandel: Samsung fehlt, Xiaomi kommt
Die IFA 2026 ist praktisch ausverkauft, und trotzdem verändert sie sich gerade grundlegend. Neue Aussteller drängen nach Berlin, etablierte ordnen sich neu. Was das für den Fachhandel bedeutet.
4 Minuten
ORCA Services Gründer Rolf Gerber übergibt operative Leitung an Nicole Buser
Nach 21 Jahren an der Spitze der ORCA Services AG leitet Unternehmensgründer Rolf Gerber den Generationenwechsel ein. Zum 1. Juni 2026 zieht er sich aus der operativen Geschäftsführung zurück. Die Nachfolge übernimmt Nicole Buser, die das Unternehmen künftig als Geschäftsführerin leitet.
2 Minuten
Davos wird zur ersten Robot City Europas
Mehr als 50 Roboter aus Europa, China und den USA arbeiten derzeit mitten in Davos. Der erste Davos Tech Summit zeigt damit erstmals Robotik-Anwendungen im öffentlichen Raum. Fachleute diskutieren zudem über Physical AI, Cybersecurity und Europas Rolle in der Robotik.
2 Minuten

Das könnte Sie auch interessieren

«Zwischen KI-Vision und Prozessrealität» - Quotes & Thoughts
Mit Thomas Hottinger, Managing Director des SAP-Partners Innflow, habe ich mich über die neue Strategie des «Autonomous Enterprise» von SAP unterhalten. Im Gespräch erklärte er, weshalb Prozessreife und Datenqualität die entscheidenden Voraussetzungen für den erfolgreichen KI-Einsatz sind, welche Themen Schweizer Unternehmen aktuell beschäftigen und warum Cloud-Strategien nicht zwangsläufig im Widerspruch zu Datensouveränität stehen.
5 Minuten
«Echtzeit wird zum entscheidenden Faktor» - Digital Insights
Im Gespräch mit Computerworld erläutert Alexander Finger, weshalb moderne Datenarchitekturen heute stärker auf Echtzeitfähigkeit, Datenverantwortung und Transparenz ausgerichtet sein müssen, damit KI im Unternehmen tatsächlich produktiv eingesetzt werden kann.
3 Minuten
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige