MiniMax M3: viel Kontext, wenig Rechenaufwand

Das chinesische KI-Labor MiniMax hat am 1. Juni sein neues Modell M3 vorgestellt – ein offenes Sprachmodell, das eine Million Wörter Kontext verarbeitet und dabei deutlich weniger Rechenleistung braucht als seine Vorgänger. Die API ist bereits live, die Modellgewichte und der technische Bericht sollen innerhalb von zehn Tagen frei verfügbar sein.

Eine Million Token, ein Zwanzigstel Rechenaufwand

Das Herzstück von M3 ist eine neue Technik namens MSA (MiniMax Sparse Attention). Vereinfacht gesagt löst sie ein altes Problem: Normalerweise steigt der Rechenaufwand eines Modells im Quadrat zur Textlänge – doppelt so viel Text bedeutet viermal so viel Arbeit. MSA filtert vorab, welche Textteile überhaupt zueinander gehören, und spart damit massiv.

Das Ergebnis ist beachtlich: Bei einem Kontext von einer Million Token – das sind grob 750'000 Wörter, etwa zehn dicke Romane auf einmal – braucht M3 laut MiniMax nur noch ein Zwanzigstel der Rechenleistung des Vorgängers M2. Die Antwortgeschwindigkeit liegt je nach Phase neun- bis fünfzehnmal höher.

Bilder, Videos und der eigene Desktop

M3 wurde von Anfang an multimodal trainiert. Es versteht also nicht nur Text, sondern auch Bilder und Videos – und kann sogar einen Computer selbstständig bedienen, etwa Programme öffnen und Daten eintippen. Beim Programmieren erreicht das Modell nach eigenen Angaben 59 Prozent im anspruchsvollen SWE-Bench-Pro-Test und schlägt damit GPT-5.5 und Gemini 3.1 Pro.

Wichtig zur Einordnung: Diese Zahlen stammen bislang von MiniMax selbst. Unabhängige Tests stehen noch aus, ebenso die versprochenen Modellgewichte.

Offen schlägt teuer

Für dich bedeutet das vor allem eines: Die offene Konkurrenz aus China holt rasant auf. Wer ein Modell mit derart langem Gedächtnis selbst betreiben will – etwa um sensible Firmendaten nicht in fremde Clouds zu schicken – bekommt mit M3 bald eine frei verfügbare Option. Der Einstieg ins Token-Abo beginnt bei 20 Dollar im Monat. Damit setzt MiniMax den westlichen Anbietern genau dort zu, wo es weh tut: beim Preis.