NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·NEUE MODELLE

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Der chinesische Anbieter DeepSeek macht den 75-Prozent-Rabatt auf sein Flaggschiff V4-Pro dauerhaft. Output-Tokens kosten 34-mal weniger als GPT-5.5 – mit Compliance-Haken für die Schweiz.

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
25. MAI 2026
3 MIN. LESEZEIT
Skizze DeepSeek Preisschild mit Walfisch und wankenden Konkurrenz-Türmen
Skizze DeepSeek Preisschild Dark Mode, kinewsletter.ch Stil
INHALT
01Aus der Promo wird der neue Preis02Architektur und Hardware machen es möglich03Reaktion der Konkurrenz: bisher still04Für dich konkret – und der Compliance-Haken05Ausblick
INHALT
01Aus der Promo wird der neue Preis02Architektur und Hardware machen es möglich03Reaktion der Konkurrenz: bisher still04Für dich konkret – und der Compliance-Haken05Ausblick
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

DeepSeek zementiert seinen Preiskampf-Vorsprung – wer auf Open-Weights ausweicht, kann den Schweizer Datenschutz-Vorteil sogar mitnehmen.

Der chinesische KI-Anbieter DeepSeek hat am 22. Mai bekannt gegeben, dass der ursprünglich befristete 75-Prozent-Rabatt auf sein Flaggschiff-Modell V4-Pro nicht ausläuft – sondern zum dauerhaften neuen Standardpreis wird. Output-Tokens kosten jetzt rund 34-mal weniger als bei GPT-5.5.

Aus der Promo wird der neue Preis

Der Rabatt sollte ursprünglich am 31. Mai um 15:59 UTC enden. Stattdessen kommuniziert DeepSeek auf WeChat und X: Die reduzierten Preise bleiben. Konkret heisst das pro Million Tokens:

  • Input (Cache-Miss): $0.435 (vorher $1.74)
  • Input (Cache-Hit): $0.003625 (vorher $0.0145)
  • Output: $0.87 (vorher $3.48)

Zum Vergleich: Bei GPT-5.5 zahlst du derzeit $5 pro Million Input-Tokens und $30 pro Million Output-Tokens. Bei Claude Opus 4.7 sind es $5 Input und $25 Output. Damit ist DeepSeek V4-Pro je nach Tarif 11- bis 34-mal günstiger als die westlichen Frontier-Modelle – bei einem Kontextfenster von 1 Million Tokens und kompatibel mit OpenAI- und Anthropic-API-Formaten.

Architektur und Hardware machen es möglich

V4-Pro nutzt laut DeepSeek einen hybriden Aufmerksamkeitsmechanismus, der die Rechenlast pro Inferenz auf rund 27 Prozent der Vorgängergeneration drückt und den Speicherbedarf auf ein Zehntel. Bloomberg und Cryptopolitan vermuten zudem, dass DeepSeek inzwischen Huawei Ascend 950-Chips in grösserer Stückzahl nutzt – statt der unter US-Exportkontrolle stehenden Nvidia-Hardware. DeepSeek selbst kommentiert das nicht, aber genau diese Hardware-Unabhängigkeit würde die Marge selbst zu Schleuderpreisen erklären.

Der Effekt: Was als Marketing-Aktion gestartet ist, wird zum strukturellen Wettbewerbsmoat. The Decoder spricht von einer neuen Eskalationsstufe im globalen Preiskrieg.

Reaktion der Konkurrenz: bisher still

OpenAI, Anthropic und Google haben sich bisher nicht öffentlich zu DeepSeeks Permanent-Pricing geäussert. Das ist auffällig, denn die strategische Lage ist unbequem: GPT-5.5 wurde gegenüber GPT-5.4 sogar im Preis verdoppelt (Input von $2.50 auf $5), Claude bleibt stabil, aber alle westlichen Frontier-Modelle sind jetzt zehn- bis dreissigmal teurer als der chinesische Marktführer mit vergleichbarem Kontextfenster.

Für dich konkret – und der Compliance-Haken

Für Schweizer Unternehmen verändert sich die Make-or-Buy-Rechnung. Ein KMU, das heute CHF 5'000 pro Monat für GPT-5.5-basierte Workflows ausgibt, käme auf DeepSeek V4-Pro mit vergleichbarer Modellklasse auf rund CHF 150 bis 450 pro Monat. Bei Customer-Support-Bots, RAG-Pipelines oder grossvolumiger Dokumentenverarbeitung sind das schnell fünfstellige Einsparungen pro Jahr.

Aber: DeepSeek ist ein chinesisches Unternehmen, und die offizielle API verarbeitet Daten in China. Das kollidiert direkt mit:

  • revDSG/EDÖB-Anforderungen für Personendaten
  • FINMA-Outsourcing-Richtlinien im Finanzsektor
  • Berufsgeheimnissen (Anwälte, Ärzte, Treuhänder)
  • Intern oft strengen «No-China»-Policies in regulierten Branchen

Der Workaround: DeepSeek-Modelle sind Open Weights. Du kannst sie über Anbieter wie OpenRouter, Together AI oder Fireworks beziehen – oder bei Schweizer Hostern wie Exoscale oder Infomaniak auf europäischen GPUs selbst betreiben. Dann bleibt der Preisvorteil, aber die Daten verlassen die Schweiz nicht.

Ausblick

Der Preiskrieg um Frontier-Modelle ist seit April 2026 spürbar – DeepSeek hatte damals bereits Zhipu und MiniMax in China unter Druck gesetzt. Mit der Permanent-Erklärung verlagert sich der Druck jetzt internationale. Für die nächsten Monate erwartet The Next Web Reaktionen aus dem Westen: entweder direkte Preissenkungen bei OpenAI und Anthropic – oder eine stärkere Betonung von Latenz, Zuverlässigkeit und Datenschutz als Differenzierungsmerkmale.

Quellen

DeepSeek API Pricing (offiziell)↗ EXTERNER LINKBloomberg↗ EXTERNER LINKThe Decoder (DE)↗ EXTERNER LINKEngadget↗ EXTERNER LINKThe Next Web↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Skizze eines freundlichen Roboters am Schreibtisch, der eine Hand mit einer kleinen Warnflagge hebt, davor ein Laptop mit Code und eine Lupe
Skizze eines freundlichen Roboters am Schreibtisch, der eine Hand mit einer kleinen Warnflagge hebt, davor ein Laptop mit Code und eine Lupe (Dark)
NEUE MODELLE·29. MAI 2026

Anthropic bringt Claude Opus 4.8 – und macht das Modell vor allem ehrlicher

Anthropic hat am 28. Mai Claude Opus 4.8 vorgestellt. Das neue Spitzenmodell ist beim Programmieren und bei agentischen Aufgaben stärker – vor allem aber rund viermal seltener bereit, eigene Fehler unkommentiert durchgehen zu lassen.

Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr
Skizze Qwen3.7-Max Roboter optimiert blau leuchtenden Chip auf Workbench mit Sanduhr (Dark)
NEUE MODELLE·26. MAI 2026

Qwen3.7-Max läuft 35 Stunden autonom – und optimiert Code für Alibabas eigenen Chip

Alibabas neues Top-Modell arbeitet 35 Stunden ohne Unterbruch an einer Kernel-Optimierung. Auf Standard-Benchmarks zieht es mit Claude Opus 4.6 gleich.

Illustration zum Artikel «Gemini Omni Flash: Google macht aus einem Satz ein Video – m», kinewsletter.ch Stil
Illustration zum Artikel 02-gemini-omni, kinewsletter.ch Stil (dark)
NEUE MODELLE·21. MAI 2026

Gemini Omni Flash: Google macht aus einem Satz ein Video – mit Wasserzeichen

Google hat an der I/O 2026 sein erstes Omni-Modell vorgestellt. Es generiert aus Text, Bild und Audio gleichzeitig ein 10-Sekunden-Video – ab sofort in YouTube Shorts mit SynthID-Watermark.