Hinweis: Dieser Beitrag enthält Affiliate-Links (mit * gekennzeichnet). Kaufst du über einen dieser Links, erhalte ich eine kleine Provision — für dich ändert sich der Preis nicht.
Aus Shanghai kommt der nächste Paukenschlag im KI-Rennen: Das Labor MiniMax hat am 1. Juni sein neues Spitzenmodell MiniMax M3 veröffentlicht — und das Besondere ist nicht nur die Leistung, sondern die Offenheit. Die Gewichte sind frei verfügbar (open-weight), du darfst das Modell also selbst herunterladen und betreiben.
Drei Dinge auf einmal — erstmals offen
MiniMax bewirbt M3 als das erste offene Modell, das drei Dinge in einer Architektur vereint: Spitzen-Leistung beim Programmieren, einen riesigen Kontext von 1 Million Token und native Multimodalität (es versteht also Bilder und Videos direkt). Bisher musste man sich meist entscheiden — viel Kontext oder Multimodal oder Top-Coding. M3 will alles zusammenbringen.
Die Benchmark-Ansage
Der Wert, der für Aufsehen sorgt: 59,0 % auf SWE-Bench Pro, einem anspruchsvollen Test für echte Software-Aufgaben. Laut MiniMax liegt M3 damit vor OpenAIs GPT-5.5 und Googles Gemini 3.1 Pro und nähert sich Claude Opus 4.7. Für ein frei verfügbares Modell ist das eine Hausnummer — denn üblicherweise hinken offene Modelle den geschlossenen Spitzenreitern hinterher.
Der Trick steckt in der Aufmerksamkeit
Technisch baut M3 auf einem neuen Mechanismus namens MSA auf. Vereinfacht gesagt teilt er die Datenblöcke beim „Nachdenken“ präziser auf und spart so massiv Rechenleistung. Das Ergebnis: Der Aufwand pro Token sinkt auf rund ein Zwanzigstel der Vorgänger-Generation. Bei vollem 1-Million-Token-Kontext meldet MiniMax einen 9,7-fachen Geschwindigkeitsschub beim Befüllen und einen 15,6-fachen beim Generieren gegenüber dem Vorgänger M2. Mehr Kontext, weniger Kosten — das ist die Botschaft.
Was das für dich heißt
Zwei Wege führen zu M3. Erstens die API: Mit 0,30 US-Dollar pro Million Eingabe-Token ist M3 ausgesprochen günstig — interessant für alle, die KI in eigene Projekte einbauen. Zweitens das Selbst-Hosten: Weil die Gewichte offen sind, kannst du M3 grundsätzlich auf eigener Hardware betreiben. Das verlangt allerdings ordentlich Speicher und Rechenkraft. Eine Karte wie die ASUS RTX 5060 Ti 16 GB* ist ein bezahlbarer Einstieg fürs Experimentieren mit kleineren Modellen; für die volle Größe von M3 braucht es deutlich mehr — und reichlich schnellen DDR5-Arbeitsspeicher*.
Häufige Fragen
Was bedeutet ‚open-weight‘ bei MiniMax M3?
Ist MiniMax M3 wirklich besser als GPT-5.5?
Was kostet die Nutzung?
Kann ich M3 zu Hause selbst hosten?
Fazit
MiniMax M3 verschiebt die Grenze dessen, was offene Modelle leisten: viel Kontext, Multimodalität und Top-Coding in einem Paket — günstig per API und frei zum Selbst-Hosten. Das chinesische KI-Lager macht damit weiter Druck auf die geschlossenen Platzhirsche.
Quellen: MiniMax (minimax.io), The Decoder, DataNorth, BenchLM.