NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·NEUE MODELLE

Google öffnet Gemma 4 für alle unter Apache 2.0

Google hat am 2. April seine neue Gemma-4-Familie veröffentlicht – jetzt unter der offenen Apache-2.0-Lizenz statt hinter Googles proprietärem Schleier. Das könnte bedeutender sein als die Benchmarks selbst.

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
7. APRIL 2026
2 MIN. LESEZEIT
Aufgeschlagenes Buch mit Edelsteinen und Apache-Federkiel – Gemma 4 Open Source
Aufgeschlagenes Buch mit Edelsteinen und Apache-Federkiel – Gemma 4 Open Source
INHALT
01Die Lizenz zählt mehr als die Performance02Klein, schnell, überall lauffähig03Warum diese Update überhaupt spannend ist04Was kommt jetzt?
INHALT
01Die Lizenz zählt mehr als die Performance02Klein, schnell, überall lauffähig03Warum diese Update überhaupt spannend ist04Was kommt jetzt?
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

Apache 2.0 macht Gemma 4 zur ersten echten Open-Source-Alternative für die Entwicklung auf Unternehmensebene.

Die Lizenz zählt mehr als die Performance

Ja, die 31B-Dense-Variante ist mit einem Arena-AI-ELO von 1'452 global die #3 unter den Open-Source-Modellen. Die 26B MoE (Mixture-of-Experts) aktiviert nur 4B Parameter gleichzeitig – eine Quote von "Intelligenz pro Parameter", die es so noch nicht gab. Aber ehrlich? Die echte Nachricht ist die Apache-2.0-Lizenz.

Das bedeutet für dich: Du darfst Gemma 4 trainieren, finetunen, kommerziell nutzen – ohne juristische Hürden. Google hat damit eine echte Barriere abgebaut. VentureBeat fasst es treffend zusammen: Diese Lizenzänderung könnte wichtiger sein als jeder Benchmark-Punkt.

Klein, schnell, überall lauffähig

Die 31B-Version zeigt beeindruckende Zahlen: 89,2 % auf AIME 2026 (mathematisches Denken), 80 % auf LiveCodeBench v6 (Code-Verständnis). Das ist kein Spielzeug-Modell. Gleichzeitig läuft die Variante überraschend schnell. Georgi Gerganov (bekannt von llama.cpp) zeigte, dass Gemma 4 auf M2-Ultra-Hardware 300 Token pro Sekunde verarbeitet.

Noch interessanter: Die Edge-Modelle E2B und E4B. Die E4B-Variante schafft immer noch 42,5 % auf AIME 2026. Das ist nicht wenig für 4 Milliarden Parameter.

Warum diese Update überhaupt spannend ist

Sebastian Raschka merkte an, dass der architektonische Sprung von 27B auf 31B klein ausfällt. Die echten Gewinne kommen aus dem Training-Setup und der Daten-Kurierung. Das zeigt: Google bastelt jetzt an Effizienzmechanismen statt nur an Rohkraft.

Nathan Lambert ist vorsichtig optimistisch, warnt aber vor bekannten Finetuning- und Tooling-Problemen. Die Community muss hier noch nachziehen. Cloudflare hat Gemma 4 bereits auf Workers AI verfügbar gemacht – das bedeutet: Deine nächste Edge-Function könnte damit laufen.

Lightning AI zeigt mit 105,4 Token pro Sekunde bei nur 0,20 Dollar pro Million Tokens, dass das Deployment skaliert. NVIDIA hat mit NVFP4-Quantisierung eine 4-Bit-Kompression veröffentlicht, die 99,7 % der Baseline-Genauigkeit hält.

Was kommt jetzt?

Gemma 4 ist nicht das grösste Modell. Es ist aber das offenste Modell dieser Grösse – und das ist ein echter Shift. Für Teams, die an KI-Anwendungen bauen, ohne sich an OpenAI, Anthropic oder Meta binden zu wollen, ist das eine echte Option geworden. Die Infrastruktur-Partner haben bereits reagiert. Jetzt ist die Frage: Werden die Developer-Tools und Fine-Tuning-Recipes folgen?

Das Potenzial steckt in der Kombination: offene Lizenz, solide Performance auf kleinerer Hardware, aktive Deployment-Partner. Nicht revolutionär – aber pragmatisch. Und genau das braucht es gerade in der KI-Infrastruktur.

Quellen

VentureBeat↗ EXTERNER LINKLatent Space↗ EXTERNER LINKInterconnects↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr
Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr (Dark)
NEUE MODELLE·26. MAI 2026

Qwen3.7-Max läuft 35 Stunden autonom – und optimiert Code für Alibabas eigenen Chip

Alibabas neues Top-Modell arbeitet 35 Stunden ohne Unterbruch an einer Kernel-Optimierung. Auf Standard-Benchmarks zieht es mit Claude Opus 4.6 gleich.

Skizze DeepSeek Preisschild mit Walfisch und wankenden Konkurrenz-Türmen
Skizze DeepSeek Preisschild Dark Mode, kinewsletter.ch Stil
NEUE MODELLE·25. MAI 2026

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Der chinesische Anbieter DeepSeek macht den 75-Prozent-Rabatt auf sein Flaggschiff V4-Pro dauerhaft. Output-Tokens kosten 34-mal weniger als GPT-5.5 – mit Compliance-Haken für die Schweiz.

Illustration zum Artikel «Gemini Omni Flash: Google macht aus einem Satz ein Video – m», kinewsletter.ch Stil
Illustration zum Artikel 02-gemini-omni, kinewsletter.ch Stil (dark)
NEUE MODELLE·21. MAI 2026

Gemini Omni Flash: Google macht aus einem Satz ein Video – mit Wasserzeichen

Google hat an der I/O 2026 sein erstes Omni-Modell vorgestellt. Es generiert aus Text, Bild und Audio gleichzeitig ein 10-Sekunden-Video – ab sofort in YouTube Shorts mit SynthID-Watermark.