NewsKategorienNewsletter-ArchivÜber unsKostenlos abonnieren

Der wöchentliche KI-Newsletter für die Schweiz. Kompakt, relevant, zero Bullshit. 5 Minuten lesen, 1 Woche informiert.

FOLGE UNS
LIXIG
NAVIGATION
Alle NewsNewsletter-ArchivAutorenÜber unsKontakt
KATEGORIEN
KI-ForschungKI-BusinessRegulierung & EthikKI in der SchweizKI-Tools & AppsNeue Modelle
RECHTLICHES
ImpressumDatenschutzAGB
© 2026 Inoo GmbH · Altstätten SG · Schweiz
Ein Produkt von InooSwiss Made Software
HOME·NEWS·NEUE MODELLE

MiniMax M3: viel Kontext, wenig Rechenaufwand

Das chinesische Labor MiniMax bringt mit M3 ein offenes Modell, das eine Million Token verarbeitet – und dafür nur ein Zwanzigstel der Rechenleistung des Vorgängers braucht. Gewichte folgen in zehn Tagen.

Pascal Eugster
Pascal Eugster
GRÜNDER & ENTWICKLER
5. JUNI 2026
2 MIN. LESEZEIT
Handgezeichnete Skizze eines elektroblau leuchtenden Computerchips auf einem Holzschreibtisch, daneben eine Sanduhr, aufgefaecherte Buchseiten und eine Schreibtischlampe
Handgezeichnete Skizze eines elektroblau leuchtenden Computerchips auf einem Holzschreibtisch, daneben eine Sanduhr, aufgefaecherte Buchseiten und eine Schreibtischlampe (Dark Mode)
INHALT
01Eine Million Token, ein Zwanzigstel Rechenaufwand02Bilder, Videos und der eigene Desktop03Offen schlägt teuer
INHALT
01Eine Million Token, ein Zwanzigstel Rechenaufwand02Bilder, Videos und der eigene Desktop03Offen schlägt teuer
in
PARTNER · INOO GMBH
Wie viel KI verträgt dein Betrieb? In 30 Minuten Klartext.

Kostenloses Erstgespräch — herstellerneutral, direkt aus dem Rheintal.

Gespräch buchen →
DAS WICHTIGSTE IN KÜRZE

Offene Modelle aus China holen rasant auf – M3 macht langen Kontext billig und setzt den westlichen Anbietern beim Preis zu.

Das chinesische KI-Labor MiniMax hat am 1. Juni sein neues Modell M3 vorgestellt – ein offenes Sprachmodell, das eine Million Wörter Kontext verarbeitet und dabei deutlich weniger Rechenleistung braucht als seine Vorgänger. Die API ist bereits live, die Modellgewichte und der technische Bericht sollen innerhalb von zehn Tagen frei verfügbar sein.

Eine Million Token, ein Zwanzigstel Rechenaufwand

Das Herzstück von M3 ist eine neue Technik namens MSA (MiniMax Sparse Attention). Vereinfacht gesagt löst sie ein altes Problem: Normalerweise steigt der Rechenaufwand eines Modells im Quadrat zur Textlänge – doppelt so viel Text bedeutet viermal so viel Arbeit. MSA filtert vorab, welche Textteile überhaupt zueinander gehören, und spart damit massiv.

Das Ergebnis ist beachtlich: Bei einem Kontext von einer Million Token – das sind grob 750'000 Wörter, etwa zehn dicke Romane auf einmal – braucht M3 laut MiniMax nur noch ein Zwanzigstel der Rechenleistung des Vorgängers M2. Die Antwortgeschwindigkeit liegt je nach Phase neun- bis fünfzehnmal höher.

Bilder, Videos und der eigene Desktop

M3 wurde von Anfang an multimodal trainiert. Es versteht also nicht nur Text, sondern auch Bilder und Videos – und kann sogar einen Computer selbstständig bedienen, etwa Programme öffnen und Daten eintippen. Beim Programmieren erreicht das Modell nach eigenen Angaben 59 Prozent im anspruchsvollen SWE-Bench-Pro-Test und schlägt damit GPT-5.5 und Gemini 3.1 Pro.

Wichtig zur Einordnung: Diese Zahlen stammen bislang von MiniMax selbst. Unabhängige Tests stehen noch aus, ebenso die versprochenen Modellgewichte.

Offen schlägt teuer

Für dich bedeutet das vor allem eines: Die offene Konkurrenz aus China holt rasant auf. Wer ein Modell mit derart langem Gedächtnis selbst betreiben will – etwa um sensible Firmendaten nicht in fremde Clouds zu schicken – bekommt mit M3 bald eine frei verfügbare Option. Der Einstieg ins Token-Abo beginnt bei 20 Dollar im Monat. Damit setzt MiniMax den westlichen Anbietern genau dort zu, wo es weh tut: beim Preis.

Quellen

MarkTechPost – MiniMax Releases MiniMax M3 with MSA Architecture Supporting 1M-Token Context↗ EXTERNER LINKMiniMax – Models Intro (offizielle Dokumentation)↗ EXTERNER LINKTech Times – MiniMax M3 Open-Weight Coding Model: Frontier Claims, Unverified Benchmarks↗ EXTERNER LINKPandaily – MiniMax Launches M3 Model With 1M Context and Native Multimodal Capabilities↗ EXTERNER LINK
TEILEN
LinkedIn→X / Twitter→E-Mail→
KOSTENLOS ABONNIEREN
Diese News jeden Freitag in dein Postfach?

WEITERLESENDas könnte dich auch interessieren.

Handgezeichnete Skizze eines Blatt Papiers, auf dem sich aus einer Wolke verstreuter Tintenpunkte Textzeilen bilden, daneben ein Füllfederhalter und ein kleiner Computer
Handgezeichnete Skizze eines Blatt Papiers, auf dem sich aus einer Wolke verstreuter Tintenpunkte Textzeilen bilden, daneben ein Füllfederhalter und ein kleiner Computer (Dark Mode)
NEUE MODELLE·12. JUNI 2026

Googles Modell schreibt Text, wie ein Bild entsteht

Googles neues, offenes Modell DiffusionGemma erzeugt Text nicht Wort für Wort, sondern ganze Blöcke auf einmal – wie ein Bildgenerator aus Rauschen ein Motiv schärft. Das macht es bis zu viermal schneller und lässt es lokal auf dem eigenen Rechner laufen.

Handgezeichnete Skizze eines grossen Notbremshebels an einem Schaltpult mit einem Schmetterling und elektroblauem Akzent
Handgezeichnete Skizze eines grossen Notbremshebels an einem Schaltpult mit einem Schmetterling und elektroblauem Akzent
NEUE MODELLE·10. JUNI 2026

Claude Fable 5: Anthropics stärkstes Modell – mit Notbremse

Anthropic hat am 9. Juni Claude Fable 5 veröffentlicht – das fähigste Modell, das je für alle zugänglich war. Bei heiklen Themen wie Cybersecurity übergibt es heimlich an das schwächere Opus 4.8. Parallel kommt Mythos 5 für Cyber-Verteidiger.

Skizze einer Werkbank, an der eine Person eine Reihe kleiner elektroblauer Roboterfiguren zusammenbaut, offener Werkzeugkasten, Bauplan an der Wand, Fenster mit Morgenlicht
Skizze einer Werkbank, an der eine Person eine Reihe kleiner elektroblauer Roboterfiguren zusammenbaut, offener Werkzeugkasten, Bauplan an der Wand, Fenster mit Morgenlicht (Dark)
NEUE MODELLE·3. JUNI 2026

Microsoft baut sieben eigene KI-Modelle – und löst sich von OpenAI

An der Build 2026 hat Microsoft sieben eigene MAI-Modelle vorgestellt – fürs Schlussfolgern, Programmieren, Sprache und Bild. Das erklärte Ziel: weniger Abhängigkeit von Partner OpenAI.