Der chinesische Anbieter DeepSeek macht den 75-Prozent-Rabatt auf sein Flaggschiff V4-Pro dauerhaft. Output-Tokens kosten 34-mal weniger als GPT-5.5 – mit Compliance-Haken für die Schweiz.
Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.
DeepSeek zementiert seinen Preiskampf-Vorsprung – wer auf Open-Weights ausweicht, kann den Schweizer Datenschutz-Vorteil sogar mitnehmen.
Der chinesische KI-Anbieter DeepSeek hat am 22. Mai bekannt gegeben, dass der ursprünglich befristete 75-Prozent-Rabatt auf sein Flaggschiff-Modell V4-Pro nicht ausläuft – sondern zum dauerhaften neuen Standardpreis wird. Output-Tokens kosten jetzt rund 34-mal weniger als bei GPT-5.5.
Der Rabatt sollte ursprünglich am 31. Mai um 15:59 UTC enden. Stattdessen kommuniziert DeepSeek auf WeChat und X: Die reduzierten Preise bleiben. Konkret heisst das pro Million Tokens:
Zum Vergleich: Bei GPT-5.5 zahlst du derzeit $5 pro Million Input-Tokens und $30 pro Million Output-Tokens. Bei Claude Opus 4.7 sind es $5 Input und $25 Output. Damit ist DeepSeek V4-Pro je nach Tarif 11- bis 34-mal günstiger als die westlichen Frontier-Modelle – bei einem Kontextfenster von 1 Million Tokens und kompatibel mit OpenAI- und Anthropic-API-Formaten.
V4-Pro nutzt laut DeepSeek einen hybriden Aufmerksamkeitsmechanismus, der die Rechenlast pro Inferenz auf rund 27 Prozent der Vorgängergeneration drückt und den Speicherbedarf auf ein Zehntel. Bloomberg und Cryptopolitan vermuten zudem, dass DeepSeek inzwischen Huawei Ascend 950-Chips in grösserer Stückzahl nutzt – statt der unter US-Exportkontrolle stehenden Nvidia-Hardware. DeepSeek selbst kommentiert das nicht, aber genau diese Hardware-Unabhängigkeit würde die Marge selbst zu Schleuderpreisen erklären.
Der Effekt: Was als Marketing-Aktion gestartet ist, wird zum strukturellen Wettbewerbsmoat. The Decoder spricht von einer neuen Eskalationsstufe im globalen Preiskrieg.
OpenAI, Anthropic und Google haben sich bisher nicht öffentlich zu DeepSeeks Permanent-Pricing geäussert. Das ist auffällig, denn die strategische Lage ist unbequem: GPT-5.5 wurde gegenüber GPT-5.4 sogar im Preis verdoppelt (Input von $2.50 auf $5), Claude bleibt stabil, aber alle westlichen Frontier-Modelle sind jetzt zehn- bis dreissigmal teurer als der chinesische Marktführer mit vergleichbarem Kontextfenster.
Für Schweizer Unternehmen verändert sich die Make-or-Buy-Rechnung. Ein KMU, das heute CHF 5'000 pro Monat für GPT-5.5-basierte Workflows ausgibt, käme auf DeepSeek V4-Pro mit vergleichbarer Modellklasse auf rund CHF 150 bis 450 pro Monat. Bei Customer-Support-Bots, RAG-Pipelines oder grossvolumiger Dokumentenverarbeitung sind das schnell fünfstellige Einsparungen pro Jahr.
Aber: DeepSeek ist ein chinesisches Unternehmen, und die offizielle API verarbeitet Daten in China. Das kollidiert direkt mit:
Der Workaround: DeepSeek-Modelle sind Open Weights. Du kannst sie über Anbieter wie OpenRouter, Together AI oder Fireworks beziehen – oder bei Schweizer Hostern wie Exoscale oder Infomaniak auf europäischen GPUs selbst betreiben. Dann bleibt der Preisvorteil, aber die Daten verlassen die Schweiz nicht.
Der Preiskrieg um Frontier-Modelle ist seit April 2026 spürbar – DeepSeek hatte damals bereits Zhipu und MiniMax in China unter Druck gesetzt. Mit der Permanent-Erklärung verlagert sich der Druck jetzt internationale. Für die nächsten Monate erwartet The Next Web Reaktionen aus dem Westen: entweder direkte Preissenkungen bei OpenAI und Anthropic – oder eine stärkere Betonung von Latenz, Zuverlässigkeit und Datenschutz als Differenzierungsmerkmale.