NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·NEUE MODELLE

Googles Modell schreibt Text, wie ein Bild entsteht

Googles neues, offenes Modell DiffusionGemma erzeugt Text nicht Wort für Wort, sondern ganze Blöcke auf einmal – wie ein Bildgenerator aus Rauschen ein Motiv schärft. Das macht es bis zu viermal schneller und lässt es lokal auf dem eigenen Rechner laufen.

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
12. JUNI 2026
2 MIN. LESEZEIT
Handgezeichnete Skizze eines Blatt Papiers, auf dem sich aus einer Wolke verstreuter Tintenpunkte Textzeilen bilden, daneben ein Füllfederhalter und ein kleiner Computer
Handgezeichnete Skizze eines Blatt Papiers, auf dem sich aus einer Wolke verstreuter Tintenpunkte Textzeilen bilden, daneben ein Füllfederhalter und ein kleiner Computer (Dark Mode)
INHALT
01Schreiben, wie ein Bild entsteht02Viermal schneller – mit einem Haken03Läuft auf dem eigenen Rechner
INHALT
01Schreiben, wie ein Bild entsteht02Viermal schneller – mit einem Haken03Läuft auf dem eigenen Rechner
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

DiffusionGemma überträgt den Trick der Bildgeneratoren auf Text: ganze Blöcke statt Wort für Wort – viermal schneller und offen für den eigenen Rechner.

Die meisten KI-Modelle schreiben Text Wort für Wort, von links nach rechts. Googles neues DiffusionGemma macht es anders – und ist dabei bis zu viermal schneller.

Schreiben, wie ein Bild entsteht

Der Name verrät den Trick. Bildgeneratoren wie Midjourney starten mit einem Bild aus reinem Rauschen und schärfen es Schritt für Schritt zum fertigen Motiv – das nennt man Diffusion. DiffusionGemma überträgt genau dieses Prinzip auf Text: Statt ein Wort nach dem anderen vorherzusagen, entwirft das Modell einen ganzen Block von bis zu 256 Zeicheneinheiten auf einmal und verfeinert ihn parallel.

Weil dabei viele Teile gleichzeitig statt nacheinander entstehen, wird das Ganze deutlich schneller. Auf einer professionellen NVIDIA-H100-Grafikkarte schafft das Modell über 1000 Zeicheneinheiten pro Sekunde, auf einer High-End-Gamerkarte (RTX 5090) immerhin noch über 700.

Viermal schneller – mit einem Haken

Das Tempo hat seinen Preis. Google selbst nennt DiffusionGemma ein experimentelles Modell und räumt ein: Die Textqualität liegt unter der des regulären Gemma 4. Wer maximale Qualität braucht, soll laut Google weiterhin das Standardmodell nehmen.

Technisch ist DiffusionGemma ein Mixture-of-Experts-Modell – vereinfacht gesagt sind im Modell viele Spezialisten versammelt, von denen je nach Aufgabe nur ein Teil aktiv wird. Von insgesamt 26 Milliarden Parametern sind pro Anfrage nur rund 3,8 Milliarden im Einsatz. Das hält den Rechenaufwand tief.

Läuft auf dem eigenen Rechner

Der für viele wichtigste Punkt: DiffusionGemma ist offen und unter der freien Apache-2.0-Lizenz verfügbar. Quantisiert (also auf weniger Speicher zusammengestaucht) passt es in die 18 Gigabyte einer guten Consumer-Grafikkarte.

Konkret heisst das: Man kann das Modell lokal auf dem eigenen Gerät laufen lassen, ohne dass Daten an einen Cloud-Anbieter wandern. Gerade in der Schweiz, wo Datenschutz und digitale Souveränität hoch im Kurs stehen – Stichwort das hiesige offene Sprachmodell Apertus – ist das ein Argument. Für schnelle Entwürfe, Autovervollständigung oder Tests ist ein vier Mal schnelleres Modell auf dem eigenen Laptop attraktiv, auch wenn der letzte Schliff dann von einem stärkeren Modell kommt.

Quellen

Google – DiffusionGemma: 4x faster text generation↗ EXTERNER LINKMarkTechPost – Google AI Releases DiffusionGemma, a 26B MoE Open Model Using Text Diffusion↗ EXTERNER LINKTechnology.org – Google's DiffusionGemma Generates Text 4x Faster on Local GPUs↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Handgezeichnete Skizze eines grossen Notbremshebels an einem Schaltpult mit einem Schmetterling und elektroblauem Akzent
Handgezeichnete Skizze eines grossen Notbremshebels an einem Schaltpult mit einem Schmetterling und elektroblauem Akzent
NEUE MODELLE·10. JUNI 2026

Claude Fable 5: Anthropics stärkstes Modell – mit Notbremse

Anthropic hat am 9. Juni Claude Fable 5 veröffentlicht – das fähigste Modell, das je für alle zugänglich war. Bei heiklen Themen wie Cybersecurity übergibt es heimlich an das schwächere Opus 4.8. Parallel kommt Mythos 5 für Cyber-Verteidiger.

Handgezeichnete Skizze eines elektroblau leuchtenden Computerchips auf einem Holzschreibtisch, daneben eine Sanduhr, aufgefaecherte Buchseiten und eine Schreibtischlampe
Handgezeichnete Skizze eines elektroblau leuchtenden Computerchips auf einem Holzschreibtisch, daneben eine Sanduhr, aufgefaecherte Buchseiten und eine Schreibtischlampe (Dark Mode)
NEUE MODELLE·5. JUNI 2026

MiniMax M3: viel Kontext, wenig Rechenaufwand

Das chinesische Labor MiniMax bringt mit M3 ein offenes Modell, das eine Million Token verarbeitet – und dafür nur ein Zwanzigstel der Rechenleistung des Vorgängers braucht. Gewichte folgen in zehn Tagen.

Skizze einer Werkbank, an der eine Person eine Reihe kleiner elektroblauer Roboterfiguren zusammenbaut, offener Werkzeugkasten, Bauplan an der Wand, Fenster mit Morgenlicht
Skizze einer Werkbank, an der eine Person eine Reihe kleiner elektroblauer Roboterfiguren zusammenbaut, offener Werkzeugkasten, Bauplan an der Wand, Fenster mit Morgenlicht (Dark)
NEUE MODELLE·3. JUNI 2026

Microsoft baut sieben eigene KI-Modelle – und löst sich von OpenAI

An der Build 2026 hat Microsoft sieben eigene MAI-Modelle vorgestellt – fürs Schlussfolgern, Programmieren, Sprache und Bild. Das erklärte Ziel: weniger Abhängigkeit von Partner OpenAI.