NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·NEUE MODELLE

DeepSeek V4 und Qwen3.6 setzen proprietäre Labs unter Druck – Open Weights auf Rekordniveau

Zwei Tage, zwei Meilensteine: DeepSeek liefert das grösste Open-Weights-Modell der Geschichte, Alibabas Qwen3.6 schlägt mit 27 Milliarden Parametern ein 15-mal grösseres Modell beim Coding.

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
24. APRIL 2026
2 MIN. LESEZEIT
Handgezeichnete Skizze einer offenen Schatztruhe mit Chips und einer Waage
Handgezeichnete Skizze einer offenen Schatztruhe mit Chips und einer Waage
INHALT
011,6 Billionen Parameter unter MIT-Lizenz0227 Milliarden schlagen 397 Milliarden03Tencent und Alibaba wollen bei DeepSeek einsteigen04Schweiz-Kontext
INHALT
011,6 Billionen Parameter unter MIT-Lizenz0227 Milliarden schlagen 397 Milliarden03Tencent und Alibaba wollen bei DeepSeek einsteigen04Schweiz-Kontext
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

DeepSeek V4-Pro ist mit 1,6 Billionen Parametern das grösste Open-Weights-Modell der Geschichte, während Qwen3.6-27B beweist, dass ein kompaktes Modell auf einer einzelnen GPU Flagship-Coding-Performance liefern kann – der Druck auf proprietäre Labs war nie grösser.

1,6 Billionen Parameter unter MIT-Lizenz

Am 24. April veröffentlichte DeepSeek zwei Modelle unter MIT-Lizenz: DeepSeek V4-Pro mit 1,6 Billionen Gesamtparametern (49 Milliarden aktiv) und V4-Flash mit 284 Milliarden (13 Milliarden aktiv). Beide nutzen eine Mixture-of-Experts-Architektur mit einem Kontextfenster von einer Million Tokens. V4-Pro ist damit das grösste Open-Weights-Modell überhaupt – grösser als Kimi K2.6 (1,1 Billionen) und mehr als doppelt so gross wie DeepSeeks eigener Vorgänger V3.2.

Beim Coding erreicht V4-Pro einen Codeforces-Score von 3’206 – über GPT-5.4 xHigh – und 55,4 Prozent auf SWE-Bench Pro. V4-Flash ist das eigentliche Preisbrecher-Modell: Nur $0,14 pro Million Input-Tokens und $0,28 pro Million Output-Tokens – das günstigste Frontier-Modell am Markt.

27 Milliarden schlagen 397 Milliarden

Zwei Tage zuvor hatte Alibabas Qwen-Team mit Qwen3.6-27B vorgelegt – ein dichtes (kein MoE) Modell unter Apache-2.0-Lizenz. Das Bemerkenswerte: Es übertrifft das hauseigene, 15-mal grössere Qwen3.5-397B-MoE auf den wichtigsten Coding-Benchmarks. Die Zahlen: 77,2 Prozent auf SWE-Bench Verified (vs. 76,2 beim 397B-Modell), 59,3 Prozent auf Terminal-Bench 2.0 (vs. 52,5) und 48,2 auf SkillsBench (vs. 30,0). Damit liegt Qwen3.6-27B auf dem Niveau von Claude Opus 4.5 und 4.6.

Der Clou: Das Modell läuft auf einer einzigen RTX 4090 mit 18 GB VRAM – Flagship-Coding-Performance für Hardware, die in vielen Büros steht. Innerhalb von 24 Stunden: 23’964 Downloads auf Hugging Face und 113 Community-Quantisierungen.

Tencent und Alibaba wollen bei DeepSeek einsteigen

Parallel zur Modell-Offensive verdichtete sich die Funding-Story: Bloomberg meldete am 24. April, dass Tencent und Alibaba mit DeepSeek über die erste externe Finanzierungsrunde verhandeln. Tencent schlug bis zu 20 Prozent Anteil vor – wurde aber abgewiesen. Die anvisierte Bewertung liegt bei über 20 Milliarden Dollar. DeepSeek gehört dem chinesischen Hedgefonds High-Flyer Capital Management und hat bisher keine externen Investoren.

Schweiz-Kontext

Die Open-Weights-Offensive ist für Schweizer Unternehmen besonders relevant: DeepSeek V4-Flash und Qwen3.6-27B erlauben lokales Deployment auf eigener Hardware – ein wichtiges Argument für Branchen mit strengen Datenschutzanforderungen wie Finanzdienstleistungen, Pharma und öffentliche Verwaltung. Die ETH Zürich und das Swiss AI Center arbeiten bereits mit Open-Weights-Modellen in Forschungsprojekten. Die Preisgestaltung von V4-Flash ($0,14/Mio. Tokens) unterbietet selbst die günstigsten europäischen Hosting-Angebote.

Quellen

Simon Willison: DeepSeek V4 – almost on the frontier, a fraction of the price↗ EXTERNER LINKHugging Face: DeepSeek-V4-Pro↗ EXTERNER LINKSimon Willison: Qwen3.6-27B – Flagship-Level Coding in a 27B Dense Model↗ EXTERNER LINKHugging Face: Qwen3.6-27B↗ EXTERNER LINKBloomberg: Tencent, Alibaba in Talks to Join DeepSeek’s First Funding Round↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Handgezeichnete Skizze eines Blatt Papiers, auf dem sich aus einer Wolke verstreuter Tintenpunkte Textzeilen bilden, daneben ein Füllfederhalter und ein kleiner Computer
Handgezeichnete Skizze eines Blatt Papiers, auf dem sich aus einer Wolke verstreuter Tintenpunkte Textzeilen bilden, daneben ein Füllfederhalter und ein kleiner Computer (Dark Mode)
NEUE MODELLE·12. JUNI 2026

Googles Modell schreibt Text, wie ein Bild entsteht

Googles neues, offenes Modell DiffusionGemma erzeugt Text nicht Wort für Wort, sondern ganze Blöcke auf einmal – wie ein Bildgenerator aus Rauschen ein Motiv schärft. Das macht es bis zu viermal schneller und lässt es lokal auf dem eigenen Rechner laufen.

Handgezeichnete Skizze eines grossen Notbremshebels an einem Schaltpult mit einem Schmetterling und elektroblauem Akzent
Handgezeichnete Skizze eines grossen Notbremshebels an einem Schaltpult mit einem Schmetterling und elektroblauem Akzent
NEUE MODELLE·10. JUNI 2026

Claude Fable 5: Anthropics stärkstes Modell – mit Notbremse

Anthropic hat am 9. Juni Claude Fable 5 veröffentlicht – das fähigste Modell, das je für alle zugänglich war. Bei heiklen Themen wie Cybersecurity übergibt es heimlich an das schwächere Opus 4.8. Parallel kommt Mythos 5 für Cyber-Verteidiger.

Handgezeichnete Skizze eines elektroblau leuchtenden Computerchips auf einem Holzschreibtisch, daneben eine Sanduhr, aufgefaecherte Buchseiten und eine Schreibtischlampe
Handgezeichnete Skizze eines elektroblau leuchtenden Computerchips auf einem Holzschreibtisch, daneben eine Sanduhr, aufgefaecherte Buchseiten und eine Schreibtischlampe (Dark Mode)
NEUE MODELLE·5. JUNI 2026

MiniMax M3: viel Kontext, wenig Rechenaufwand

Das chinesische Labor MiniMax bringt mit M3 ein offenes Modell, das eine Million Token verarbeitet – und dafür nur ein Zwanzigstel der Rechenleistung des Vorgängers braucht. Gewichte folgen in zehn Tagen.