DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Der chinesische KI-Anbieter DeepSeek hat am 22. Mai bekannt gegeben, dass der ursprünglich befristete 75-Prozent-Rabatt auf sein Flaggschiff-Modell V4-Pro nicht ausläuft – sondern zum dauerhaften neuen Standardpreis wird. Output-Tokens kosten jetzt rund 34-mal weniger als bei GPT-5.5.

Der Rabatt sollte ursprünglich am 31. Mai um 15:59 UTC enden. Stattdessen kommuniziert DeepSeek auf WeChat und X: Die reduzierten Preise bleiben. Konkret heisst das pro Million Tokens:

Input (Cache-Miss): $0.435 (vorher $1.74)
Input (Cache-Hit): $0.003625 (vorher $0.0145)
Output: $0.87 (vorher $3.48)

Zum Vergleich: Bei GPT-5.5 zahlst du derzeit $5 pro Million Input-Tokens und $30 pro Million Output-Tokens. Bei Claude Opus 4.7 sind es $5 Input und $25 Output. Damit ist DeepSeek V4-Pro je nach Tarif 11- bis 34-mal günstiger als die westlichen Frontier-Modelle – bei einem Kontextfenster von 1 Million Tokens und kompatibel mit OpenAI- und Anthropic-API-Formaten.

Architektur und Hardware machen es möglich

V4-Pro nutzt laut DeepSeek einen hybriden Aufmerksamkeitsmechanismus, der die Rechenlast pro Inferenz auf rund 27 Prozent der Vorgängergeneration drückt und den Speicherbedarf auf ein Zehntel. Bloomberg und Cryptopolitan vermuten zudem, dass DeepSeek inzwischen Huawei Ascend 950-Chips in grösserer Stückzahl nutzt – statt der unter US-Exportkontrolle stehenden Nvidia-Hardware. DeepSeek selbst kommentiert das nicht, aber genau diese Hardware-Unabhängigkeit würde die Marge selbst zu Schleuderpreisen erklären.

Der Effekt: Was als Marketing-Aktion gestartet ist, wird zum strukturellen Wettbewerbsmoat. The Decoder spricht von einer neuen Eskalationsstufe im globalen Preiskrieg.

Reaktion der Konkurrenz: bisher still

OpenAI, Anthropic und Google haben sich bisher nicht öffentlich zu DeepSeeks Permanent-Pricing geäussert. Das ist auffällig, denn die strategische Lage ist unbequem: GPT-5.5 wurde gegenüber GPT-5.4 sogar im Preis verdoppelt (Input von $2.50 auf $5), Claude bleibt stabil, aber alle westlichen Frontier-Modelle sind jetzt zehn- bis dreissigmal teurer als der chinesische Marktführer mit vergleichbarem Kontextfenster.

Für dich konkret – und der Compliance-Haken

Für Schweizer Unternehmen verändert sich die Make-or-Buy-Rechnung. Ein KMU, das heute CHF 5'000 pro Monat für GPT-5.5-basierte Workflows ausgibt, käme auf DeepSeek V4-Pro mit vergleichbarer Modellklasse auf rund CHF 150 bis 450 pro Monat. Bei Customer-Support-Bots, RAG-Pipelines oder grossvolumiger Dokumentenverarbeitung sind das schnell fünfstellige Einsparungen pro Jahr.

Aber: DeepSeek ist ein chinesisches Unternehmen, und die offizielle API verarbeitet Daten in China. Das kollidiert direkt mit:

revDSG/EDÖB-Anforderungen für Personendaten
FINMA-Outsourcing-Richtlinien im Finanzsektor
Berufsgeheimnissen (Anwälte, Ärzte, Treuhänder)
Intern oft strengen «No-China»-Policies in regulierten Branchen

Der Workaround: DeepSeek-Modelle sind Open Weights. Du kannst sie über Anbieter wie OpenRouter, Together AI oder Fireworks beziehen – oder bei Schweizer Hostern wie Exoscale oder Infomaniak auf europäischen GPUs selbst betreiben. Dann bleibt der Preisvorteil, aber die Daten verlassen die Schweiz nicht.

Ausblick

Der Preiskrieg um Frontier-Modelle ist seit April 2026 spürbar – DeepSeek hatte damals bereits Zhipu und MiniMax in China unter Druck gesetzt. Mit der Permanent-Erklärung verlagert sich der Druck jetzt internationale. Für die nächsten Monate erwartet The Next Web Reaktionen aus dem Westen: entweder direkte Preissenkungen bei OpenAI und Anthropic – oder eine stärkere Betonung von Latenz, Zuverlässigkeit und Datenschutz als Differenzierungsmerkmale.

Der Rabatt sollte ursprünglich am 31. Mai um 15:59 UTC enden. Stattdessen kommuniziert DeepSeek auf WeChat und X: Die reduzierten Preise bleiben. Konkret heisst das pro Million Tokens:

Input (Cache-Miss): $0.435 (vorher $1.74)
Input (Cache-Hit): $0.003625 (vorher $0.0145)
Output: $0.87 (vorher $3.48)

Architektur und Hardware machen es möglich

Der Effekt: Was als Marketing-Aktion gestartet ist, wird zum strukturellen Wettbewerbsmoat. The Decoder spricht von einer neuen Eskalationsstufe im globalen Preiskrieg.

Reaktion der Konkurrenz: bisher still

Für dich konkret – und der Compliance-Haken

Aber: DeepSeek ist ein chinesisches Unternehmen, und die offizielle API verarbeitet Daten in China. Das kollidiert direkt mit:

revDSG/EDÖB-Anforderungen für Personendaten
FINMA-Outsourcing-Richtlinien im Finanzsektor
Berufsgeheimnissen (Anwälte, Ärzte, Treuhänder)
Intern oft strengen «No-China»-Policies in regulierten Branchen

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Architektur und Hardware machen es möglich

Reaktion der Konkurrenz: bisher still

Für dich konkret – und der Compliance-Haken

Ausblick

Quellen

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Architektur und Hardware machen es möglich

Reaktion der Konkurrenz: bisher still

Für dich konkret – und der Compliance-Haken

Ausblick

Quellen

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Aus der Promo wird der neue Preis

Architektur und Hardware machen es möglich

Reaktion der Konkurrenz: bisher still

Für dich konkret – und der Compliance-Haken

Ausblick

Quellen

WEITERLESENDas könnte dich auch interessieren.

GPT-5.6 für alle: OpenAI bringt drei Modelle zu drei Preisen

Grok 4.5: SpaceXAIs günstiger Angriff auf Claude Opus

OpenAIs neue Sprachmodelle antworten schneller – und eines wird günstiger

Tencent bringt Hy3: offenes 295-Milliarden-Modell, das über seiner Klasse boxt

Claude Fable 5 ist zurück – mit Gratis-Woche und Benchmark-Sieg

Claude Sonnet 5: fast Opus-Niveau zum Sonnet-Preis

DeepSeek macht 75-Prozent-Rabatt permanent – und ist 34-mal günstiger als GPT-5.5

Aus der Promo wird der neue Preis

Architektur und Hardware machen es möglich

Reaktion der Konkurrenz: bisher still

Für dich konkret – und der Compliance-Haken

Ausblick

Quellen

WEITERLESENDas könnte dich auch interessieren.

GPT-5.6 für alle: OpenAI bringt drei Modelle zu drei Preisen

Grok 4.5: SpaceXAIs günstiger Angriff auf Claude Opus

OpenAIs neue Sprachmodelle antworten schneller – und eines wird günstiger

Tencent bringt Hy3: offenes 295-Milliarden-Modell, das über seiner Klasse boxt

Claude Fable 5 ist zurück – mit Gratis-Woche und Benchmark-Sieg

Claude Sonnet 5: fast Opus-Niveau zum Sonnet-Preis