NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·NEUE MODELLE

Gemini 3.5 Flash schlägt seinen eigenen Pro – Google macht Frontier-KI billig

Google hat an der I/O 2026 mit Gemini 3.5 Flash ein mittleres Modell vorgestellt, das den eigenen Gemini 3.1 Pro auf praktisch jedem agentischen Benchmark schlägt – zu einem Drittel des Preises. Auf dem unabhängigen Intelligence Index liegt es nur zwei Punkte hinter Claude Opus 4.7, kostet aber rund ein Drittel pro Token.

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
20. MAI 2026
3 MIN. LESEZEIT
Skizze einer Werkstatt mit modularen Kisten in unterschiedlichen Grössen, eine kleine helle Kiste wird mit einer grossen verglichen — Symbol für Gemini 3.5 Flash, kinewsletter.ch Stil
Skizze einer Werkstatt mit modularen Kisten, Dark Mode — Symbol für Gemini 3.5 Flash, kinewsletter.ch Stil
INHALT
01Was bedeutet «Flash schlägt Pro»?02Der Pricing-Hammer03Sofort überall verfügbar04Was das für die Schweiz bedeutet05Einordnung
INHALT
01Was bedeutet «Flash schlägt Pro»?02Der Pricing-Hammer03Sofort überall verfügbar04Was das für die Schweiz bedeutet05Einordnung
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

Gemini 3.5 Flash schlägt Pro auf agentischen Benchmarks und kostet nur ein Drittel von Claude Opus 4.7 – Google macht Frontier-KI plötzlich billig.

Google hat an der I/O 2026 nicht das Frontier-Modell vorgestellt, das alle erwarteten. Stattdessen kam Gemini 3.5 Flash – das mittlere Modell der Familie. Und das hat es in sich: Es schlägt den eigenen Vorgänger Gemini 3.1 Pro auf praktisch jedem agentischen Benchmark – zu einem Drittel des Preises. Auf dem unabhängigen Artificial Analysis Intelligence Index liegt es bei 55 Punkten und damit nur zwei Zähler hinter Anthropics Claude Opus 4.7 – kostet aber rund ein Drittel pro Token.

Was bedeutet «Flash schlägt Pro»?

Bisher galt eine simple Regel im Markt: Flash-Modelle sind günstig und schnell, Pro-Modelle sind teuer und smart. Mit 3.5 Flash kippt Google diese Logik. Konkret:

  • 76,2 % auf Terminal-Bench 2.1 (ein Standard-Test für agentisches Kommandozeilen-Können)
  • 83,6 % auf MCP Atlas (Tool-Use über das Model-Context-Protocol)
  • 84,2 % auf CharXiv Reasoning (visuelle Diagramm-Auswertung)
  • 4-mal schneller als andere Frontier-Modelle

Damit liegt 3.5 Flash überall vor Gemini 3.1 Pro – und das, obwohl es technisch der «kleinere» Bruder ist. Eine 3.5-Pro-Variante ist in internem Test und soll im Juni folgen.

Der Pricing-Hammer

Hier wird es interessant für jeden, der KI im Geschäft einsetzt:

Modell | Input (pro 1M Tokens) | Output (pro 1M Tokens)

Gemini 3 Flash (alt) | 0,50 $ | 3,00 $

Gemini 3.5 Flash (neu) | 1,50 $ | 9,00 $

Gemini 3.1 Pro | 2,50 $ | 15,00 $

Claude Opus 4.7 | 5,00 $ | 25,00 $

3.5 Flash ist also dreimal teurer als das alte Flash – aber 40 % günstiger als Pro bei besserer Leistung. Und es ist rund ein Drittel des Preises von Claude Opus 4.7 bei nur zwei Indexpunkten Rückstand.

Simon Willison fasste es trocken zusammen: «Google plant offenbar, Flash für alles zu verwenden.»

Sofort überall verfügbar

Im Unterschied zu vielen Releases der vergangenen Monate ist 3.5 Flash nicht «coming soon», sondern ab dem 19. Mai live in:

  • der Gemini-App (consumer)
  • Google AI Studio
  • Antigravity (Googles Agent-Plattform)
  • der Gemini API (für Entwickler)
  • AI Mode in Google Search – jenem Such-Modus, der laut Pichai inzwischen über eine Milliarde monatliche Nutzer hat

Das Modell beherrscht Text, Bilder, Audio und Video als Input. Der Output-Tokenpool liegt bei 65 536 Tokens, das Kontextfenster bei einer Million. «Dynamic Thinking» – also der Wechsel zwischen schnellen und nachdenklicheren Antworten – ist standardmässig aktiviert.

Was das für die Schweiz bedeutet

Für Schweizer Unternehmen, die KI in Workflows einbauen, verschiebt sich die Rechnung neu. Wer bisher bei Pro-Modellen blieb, weil Flash nicht genug konnte, kann jetzt für unter der Hälfte des Token-Preises auf 3.5 Flash umsteigen – ohne Qualitätsverlust. Vor allem in Agent-Pipelines, wo schnell viele kurze Calls anfallen, wird das spürbar billiger.

Auch für API-Konkurrenten wird es enger: Anthropic muss bei Opus 4.7 entweder massiv im Preis runter oder klar im Leistungsabstand vorlegen. OpenAI hatte mit GPT-5.5 Instant am 5. Mai bereits einen ähnlichen Schritt gemacht – jetzt zieht Google nach und legt sogar drauf.

Einordnung

Google macht hier zwei Dinge gleichzeitig: Es positioniert Flash als das neue «Default-Modell» für die breite Masse und hält Pro als Premium-Stufe für die wenigen Aufgaben zurück, bei denen 5 Punkte mehr auf dem Intelligence Index die fünffachen Token-Kosten rechtfertigen. Für die Hälfte aller produktiven KI-Workloads dürfte 3.5 Flash ab heute das vernünftigste Werkzeug sein.

Und für alle, die noch auf das «echte» Frontier-Modell warten: Gemini 3.5 Pro kommt im Juni. Bis dahin reicht der Flash – und das ist die eigentliche Nachricht.

Quellen

Gemini 3.5: frontier intelligence with action (Google Blog)↗ EXTERNER LINKGemini 3.5 Flash: more expensive, but Google plan to use it for everything (Simon Willison)↗ EXTERNER LINKGemini 3.5 Flash: Benchmarks, Pricing, and Complete Specs (llm-stats)↗ EXTERNER LINKGemini 3.5 Flash scores within two points of Claude Opus 4.7 (R&D World)↗ EXTERNER LINKGoogle debuts Gemini 3.5 and Gemini Spark (CNBC)↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Skizze eines freundlichen Roboters am Schreibtisch, der eine Hand mit einer kleinen Warnflagge hebt, davor ein Laptop mit Code und eine Lupe
Skizze eines freundlichen Roboters am Schreibtisch, der eine Hand mit einer kleinen Warnflagge hebt, davor ein Laptop mit Code und eine Lupe (Dark)
NEUE MODELLE·29. MAI 2026

Anthropic bringt Claude Opus 4.8 – und macht das Modell vor allem ehrlicher

Anthropic hat am 28. Mai Claude Opus 4.8 vorgestellt. Das neue Spitzenmodell ist beim Programmieren und bei agentischen Aufgaben stärker – vor allem aber rund viermal seltener bereit, eigene Fehler unkommentiert durchgehen zu lassen.

Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr
Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr (Dark)
NEUE MODELLE·26. MAI 2026

Qwen3.7-Max läuft 35 Stunden autonom – und optimiert Code für Alibabas eigenen Chip

Alibabas neues Top-Modell arbeitet 35 Stunden ohne Unterbruch an einer Kernel-Optimierung. Auf Standard-Benchmarks zieht es mit Claude Opus 4.6 gleich.

Skizze DeepSeek Preisschild mit Walfisch und wankenden Konkurrenz-Türmen
Skizze DeepSeek Preisschild Dark Mode, kinewsletter.ch Stil
NEUE MODELLE·25. MAI 2026

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Der chinesische Anbieter DeepSeek macht den 75-Prozent-Rabatt auf sein Flaggschiff V4-Pro dauerhaft. Output-Tokens kosten 34-mal weniger als GPT-5.5 – mit Compliance-Haken für die Schweiz.