Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

Video-Ki Gemini Omni vorgestellt - PCtipp hat sie ausprobiert

Google präsentiert mit Gemini Omni ein neues Modell, das aus allen möglichen Eingaben wie Audio, Text, Video oder Bildern vielfältige Ausgaben erzeugen kann – angefangen bei Videos. Wir haben es getestet.
Screenshot von einem Video, das mit der Omni KI von Gemini erstellt wurde
© Google / Youtube

An der Entwicklerkonferenz Google I/O 2026 wurde unter anderem Gemini Omni vorgestellt.

Das neue Gemini Omni kombiniert Geminis Fähigkeiten zum Schlussfolgern mit der Fähigkeit, Neues zu kreieren. Omni ist ein neues Modell von Google, das aus allen möglichen Eingaben vielfältige Ausgaben erzeugen kann – angefangen bei Videos. Mit Omni können die Nutzer bei der Eingabe Bilder, Audio, Video und Text kombinieren und so hochwertige Videos erstellen, die auf Geminis Allgemeinwissen fundiert sind.

Wir vom PCtipp haben Gemini Omni einem ersten kurzen Test unterzogen. Hier das Resultat im Video:

Der Prompt dazu

Für das Video haben wir ein Foto des Journalisten sowie ein Bild vom PCtipp-Logo und den folgenden Prompt verwendet:

let this person fly in an open old style airplane over switzerland. show the plane from outside. at any moment show a close up of the upper part of the person. The plane is trailing a banner featuring the logo shown in the picture.

An der I/O wurde das erste Modell der Omni-Familie vorgestellt: Gemini Omni Flash. Es ist für alle Abonnenten von Google AI Plus, Pro und Ultra weltweit über die Gemini App sowie Google Flow verfügbar. Gemini Omni Flash wird ausserdem kostenlos für die Nutzer von YouTube Shorts und YouTube Create eingeführt. Schon bald sollen Ausgabeformate wie Bild und Audio unterstützt werden.

Videos per Spracheingabe bearbeiten

Mit Gemini Omni lassen sich Videos einfacher bearbeiten, und zwar mit natürlicher Sprache. Jede Anweisung baut auf der vorherigen auf.Charaktere bleiben konsistent, physische Eigenschaften sind realitätsgetreu und Szenen basieren auf dem, was vorher geschah.

Videos aus jeder beliebigen Kombination von Eingaben

Alles referenzieren. Omni verwandelt jede Referenz – sei es Bild, Text, Video oder Audio – in ein einziges, stimmiges Ergebnis. Während zu Beginn erstmal nur Sprachreferenzen für Audio unterstützt werden, wird Google schon bald weitere Arten von Audio-Eingaben einführen.

Wasserzeichen SynthID

Alle mit Omni erstellten Videos enthalten das unsichtbare digitale Wasserzeichen SynthID. Mit der Gemini App, Gemini in Chrome und der Google Suche lässt sich einfach überprüfen, ob Videos mit Gemini Omni erstellt wurden.

Google
Anzeige

Neueste Beiträge

QuickZoll berücksichtigt neu beide Mehrwertsteuersätze
Das Bundesamt für Zoll und Grenzsicherheit (BAZG) hat die App QuickZoll weiterentwickelt.
3 Minuten
Christian Straube wird Head of Industry Insurance Adnovum
Adnovum erweitert Expertise und Angebot für Versicherungen mit Christian Straube.
2 Minuten
Wissenschaftsrat SWR publiziert seine Evaluation von Innosuisse
Der Schweizerische Wissenschaftsrat SWR hat heute seinen Evaluationsbericht zum Förderportfolio von Innosuisse veröffentlicht. Die Evaluation kommt zum Schluss, dass Innosuisse ihren gesetzlichen Auftrag erfüllt und über ein kohärentes Förderportfolio verfügt.
3 Minuten

Das könnte Sie auch interessieren

«Echtzeit wird zum entscheidenden Faktor» - Digital Insights
Im Gespräch mit Computerworld erläutert Alexander Finger, weshalb moderne Datenarchitekturen heute stärker auf Echtzeitfähigkeit, Datenverantwortung und Transparenz ausgerichtet sein müssen, damit KI im Unternehmen tatsächlich produktiv eingesetzt werden kann.
3 Minuten
KI-Agenten verändern Firmenprozesse - Agentensysteme
KI-Tools, Agenten und Chatbots automatisieren Prozesse, steigern die Servicequalität und eröffnen neue Geschäftschancen. Dennoch scheitern viele KI-Projekte. Wie kann die Integration im Unternehmensalltag gelingen?
6 Minuten
19. Mai 2026
Immer mehr Nutzer sind bereit, für die KI zu zahlen
Eine Umfrage des Bitkom zeigt, dass immer mehr Deutsche für die Nutzung einer Künstlichen Intelligenz Geld ausgeben und auch die Bereitschaft dies künftig zu tun, steigt. Dafür erwarten die Anwender vor allem eine bessere Leistung der KI und mehr Qualität bei den Ergebnissen.
3 Minuten
18. Mai 2026
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige