MiniMax M3: Open-Weight-Modell schlägt GPT-5.5

Hinweis: Dieser Beitrag enthält Affiliate-Links (mit * gekennzeichnet). Kaufst du über einen dieser Links, erhalte ich eine kleine Provision — für dich ändert sich der Preis nicht.

Aus Shanghai kommt der nächste Paukenschlag im KI-Rennen: Das Labor MiniMax hat am 1. Juni sein neues Spitzenmodell MiniMax M3 veröffentlicht — und das Besondere ist nicht nur die Leistung, sondern die Offenheit. Die Gewichte sind frei verfügbar (open-weight), du darfst das Modell also selbst herunterladen und betreiben.

Drei Dinge auf einmal — erstmals offen

MiniMax bewirbt M3 als das erste offene Modell, das drei Dinge in einer Architektur vereint: Spitzen-Leistung beim Programmieren, einen riesigen Kontext von 1 Million Token und native Multimodalität (es versteht also Bilder und Videos direkt). Bisher musste man sich meist entscheiden — viel Kontext oder Multimodal oder Top-Coding. M3 will alles zusammenbringen.

Die Benchmark-Ansage

Der Wert, der für Aufsehen sorgt: 59,0 % auf SWE-Bench Pro, einem anspruchsvollen Test für echte Software-Aufgaben. Laut MiniMax liegt M3 damit vor OpenAIs GPT-5.5 und Googles Gemini 3.1 Pro und nähert sich Claude Opus 4.7. Für ein frei verfügbares Modell ist das eine Hausnummer — denn üblicherweise hinken offene Modelle den geschlossenen Spitzenreitern hinterher.

Der Trick steckt in der Aufmerksamkeit

Technisch baut M3 auf einem neuen Mechanismus namens MSA auf. Vereinfacht gesagt teilt er die Datenblöcke beim „Nachdenken“ präziser auf und spart so massiv Rechenleistung. Das Ergebnis: Der Aufwand pro Token sinkt auf rund ein Zwanzigstel der Vorgänger-Generation. Bei vollem 1-Million-Token-Kontext meldet MiniMax einen 9,7-fachen Geschwindigkeitsschub beim Befüllen und einen 15,6-fachen beim Generieren gegenüber dem Vorgänger M2. Mehr Kontext, weniger Kosten — das ist die Botschaft.

Was das für dich heißt

Zwei Wege führen zu M3. Erstens die API: Mit 0,30 US-Dollar pro Million Eingabe-Token ist M3 ausgesprochen günstig — interessant für alle, die KI in eigene Projekte einbauen. Zweitens das Selbst-Hosten: Weil die Gewichte offen sind, kannst du M3 grundsätzlich auf eigener Hardware betreiben. Das verlangt allerdings ordentlich Speicher und Rechenkraft. Eine Karte wie die ASUS RTX 5060 Ti 16 GB* ist ein bezahlbarer Einstieg fürs Experimentieren mit kleineren Modellen; für die volle Größe von M3 braucht es deutlich mehr — und reichlich schnellen DDR5-Arbeitsspeicher*.

Häufige Fragen

Was bedeutet ‚open-weight‘ bei MiniMax M3?

Die trainierten Modell-Gewichte sind frei verfügbar. Du kannst das Modell herunterladen und auf eigener Hardware betreiben — anders als bei geschlossenen Modellen, die nur über die API des Anbieters laufen.

Ist MiniMax M3 wirklich besser als GPT-5.5?

Im Benchmark SWE-Bench Pro erreicht M3 laut MiniMax 59,0 % und liegt damit vor GPT-5.5 und Gemini 3.1 Pro. Das ist ein spezifischer Coding-Test — über alle Aufgaben hinweg kann das Bild anders aussehen.

Was kostet die Nutzung?

Über die API ab 0,30 US-Dollar pro Million Eingabe-Token, was vergleichsweise günstig ist. Beim Selbst-Hosten zahlst du keine Token-Gebühr, brauchst aber leistungsfähige Hardware mit viel Speicher.

Kann ich M3 zu Hause selbst hosten?

Grundsätzlich ja, weil die Gewichte offen sind. In voller Größe ist M3 aber sehr anspruchsvoll. Für erste Gehversuche eignen sich kleinere offene Modelle auf einer GPU mit reichlich Videospeicher.

Fazit

MiniMax M3 verschiebt die Grenze dessen, was offene Modelle leisten: viel Kontext, Multimodalität und Top-Coding in einem Paket — günstig per API und frei zum Selbst-Hosten. Das chinesische KI-Lager macht damit weiter Druck auf die geschlossenen Platzhirsche.

Quellen: MiniMax (minimax.io), The Decoder, DataNorth, BenchLM.

OPEN-SOURCE-HAMMER! Dieses chinesische KI-Modell schlägt JETZT GPT-5.5 — und du darfst die Gewichte behalten