NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·NEUE MODELLE

Gemini Omni Flash: Google macht aus einem Satz ein Video – mit Wasserzeichen

Google hat an der I/O 2026 sein erstes Omni-Modell vorgestellt. Es generiert aus Text, Bild und Audio gleichzeitig ein 10-Sekunden-Video – ab sofort in YouTube Shorts mit SynthID-Watermark.

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
21. MAI 2026
3 MIN. LESEZEIT
Illustration zum Artikel «Gemini Omni Flash: Google macht aus einem Satz ein Video – m», kinewsletter.ch Stil
Illustration zum Artikel 02-gemini-omni, kinewsletter.ch Stil (dark)
INHALT
01Ein Modell statt einer Pipeline02Was du heute schon machen kannst03Jedes Video bekommt einen Stempel04Der Druck auf OpenAI wächst05Für dich als Nutzer06Avatar-Mode kommt – aber nicht heute
INHALT
01Ein Modell statt einer Pipeline02Was du heute schon machen kannst03Jedes Video bekommt einen Stempel04Der Druck auf OpenAI wächst05Für dich als Nutzer06Avatar-Mode kommt – aber nicht heute
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

Google bringt mit Gemini Omni Flash das erste massentaugliche Video-Modell mit nicht-optionalem SynthID-Wasserzeichen – ein neuer Provenance-Standard.

Google hat an der I/O 2026 sein erstes Omni-Modell vorgestellt: Gemini Omni Flash. Ein Modell, das Text, Bild, Audio und Video gleichzeitig versteht und daraus ein 10-Sekunden-Video mit synchronisiertem Ton erzeugt. Live seit 19. Mai – in der Gemini-App, in Google Flow und in den YouTube Shorts.

Ein Modell statt einer Pipeline

Bisher mussten Video-Generatoren wie Veo, Sora oder Runway mehrere spezialisierte Modelle hintereinanderschalten: eines für die Bildkomposition, eines für die Bewegung, eines für den Ton. Omni Flash macht das in einem einzigen Forward-Pass: Du wirfst Text, ein paar Bilder, eine Sprachaufnahme rein – und bekommst einen fertigen Clip zurück, der alle Modalitäten konsistent verbindet.

Demis Hassabis sprach an der Keynote von einem «World Model»: Omni soll nicht nur hübsche Bilder generieren, sondern Physik, Kausalität und narrative Struktur verstehen. Konkret: Wenn du eine Tasse vom Tisch fallen lässt, soll sie unten zerbrechen – und nicht in Zeitlupe wegfliegen.

Was du heute schon machen kannst

Gemini Omni Flash ist live in folgenden Produkten:

  • Gemini-App (Plus, Pro, Ultra) – Text-zu-Video, Bild-zu-Video, Bild+Audio-zu-Video
  • Google Flow – professionelle Video-Storyboards mit mehreren Szenen
  • YouTube Shorts und YouTube Create – kostenlos, mit Remix-Funktion

Eine Funktion fehlt bewusst: Audio-Editing innerhalb eines generierten Videos. Du kannst also nicht nachträglich die Stimme im Clip ändern oder eine andere Sprache reinsetzen. Google nennt das eine «zurückgehaltene Capability» – mit Verweis auf Deepfake-Risiken.

Jedes Video bekommt einen Stempel

Das Sicherheits-Pendant zum Modell ist SynthID. Jeder Clip, der mit Omni Flash erzeugt wird, bekommt ein unsichtbares Wasserzeichen direkt im Bild- und Audiosignal. Verifizieren kannst du es über die Gemini-App, über Google Chrome oder über die Google-Suche – einfach das Video reinziehen, und du siehst, ob es KI-generiert ist.

SynthID ist nicht optional. Jeder Output trägt ein imperzeptibles Wasserzeichen, das in der Gemini-App, in Chrome und in der Google-Suche verifizierbar ist.

Damit setzt Google einen Standard, den weder OpenAI noch xAI bisher flächendeckend ausrollen. Wenn YouTube Shorts ab dieser Woche markierte Omni-Videos in den Feed kippt, wird SynthID quasi über Nacht zur weltweit am breitesten ausgerollten Provenance-Technologie.

Der Druck auf OpenAI wächst

Sora 2 von OpenAI gilt qualitativ als ebenbürtig, ist aber nicht in einem Massenprodukt mit dreistelligen Millionen-Nutzern verfügbar. Mit Omni Flash kombiniert Google drei Vorteile, die OpenAI fehlen:

  1. Verteilungskanal – YouTube hat über 2 Milliarden Nutzer
  2. Konsumenten-Hardware – Android-Geräte mit Gemini ab Werk
  3. Provenance-Infrastruktur – SynthID + C2PA in Search und Chrome

Das ist die eigentliche I/O-Botschaft: Google verschenkt Video-Generation nicht aus Grosszügigkeit, sondern macht sie zum Standard – damit Sora, Veo und Runway nicht zum Standard werden.

Für dich als Nutzer

Wenn du YouTube Shorts oder die Gemini-App nutzt, kannst du diese Woche das erste Mal Videos direkt per Chat erzeugen. Für Schweizer Content-Creators heisst das: Ein Drehtag wird oft günstiger durch ein 20-Sekunden-Prompt-Set. Aber: Sobald dein Clip eine Person zeigt, die etwas sagt, was sie nie gesagt hat, weist SynthID ihn als KI-generiert aus. Was wie eine Einschränkung wirkt, ist faktisch ein Branchenvorteil – wer ehrlich kommuniziert, gewinnt Vertrauen.

Avatar-Mode kommt – aber nicht heute

Google hat einen zweiten Omni-Modus angeteasert: Avatar Mode. Damit könnte ein Nutzer sich selbst in beliebige Videos hineinsetzen lassen. Diese Fähigkeit ist explizit «held back» bis weitere Sicherheitsmechanismen greifen. Heisst: Spätestens Anfang 2027 dürfte dieser Modus kommen – und dann wird die nächste Welle der Deepfake-Debatten losgehen.

Quellen

Introducing Gemini Omni (Google Blog)↗ EXTERNER LINKGoogle's Gemini Omni turns images, audio, and text into video (TechCrunch)↗ EXTERNER LINKGoogle launches Gemini Omni Flash (The Next Web)↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Skizze eines freundlichen Roboters am Schreibtisch, der eine Hand mit einer kleinen Warnflagge hebt, davor ein Laptop mit Code und eine Lupe
Skizze eines freundlichen Roboters am Schreibtisch, der eine Hand mit einer kleinen Warnflagge hebt, davor ein Laptop mit Code und eine Lupe (Dark)
NEUE MODELLE·29. MAI 2026

Anthropic bringt Claude Opus 4.8 – und macht das Modell vor allem ehrlicher

Anthropic hat am 28. Mai Claude Opus 4.8 vorgestellt. Das neue Spitzenmodell ist beim Programmieren und bei agentischen Aufgaben stärker – vor allem aber rund viermal seltener bereit, eigene Fehler unkommentiert durchgehen zu lassen.

Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr
Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr (Dark)
NEUE MODELLE·26. MAI 2026

Qwen3.7-Max läuft 35 Stunden autonom – und optimiert Code für Alibabas eigenen Chip

Alibabas neues Top-Modell arbeitet 35 Stunden ohne Unterbruch an einer Kernel-Optimierung. Auf Standard-Benchmarks zieht es mit Claude Opus 4.6 gleich.

Skizze DeepSeek Preisschild mit Walfisch und wankenden Konkurrenz-Türmen
Skizze DeepSeek Preisschild Dark Mode, kinewsletter.ch Stil
NEUE MODELLE·25. MAI 2026

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Der chinesische Anbieter DeepSeek macht den 75-Prozent-Rabatt auf sein Flaggschiff V4-Pro dauerhaft. Output-Tokens kosten 34-mal weniger als GPT-5.5 – mit Compliance-Haken für die Schweiz.