Das Rennen um das schlauste KI-Modell geht in die nächste Runde. Google macht ernst: Gemini 3.5 Pro soll noch im Juni allgemein verfügbar werden — mit einem Kontextfenster, das selbst Power-User staunen lässt.
UNGLAUBLICH: 2 Millionen Token am Stück
Das Topmodell zielt auf ein Kontextfenster von 2 Millionen Token. Zur Einordnung: Damit lassen sich ganze Code-Bases, dicke Vertragsstapel oder komplette Buchmanuskripte auf einen Schlag verarbeiten, ohne dass das Modell den Faden verliert.
Dazu kommt ein „Deep Think“-Modus: ein Reasoning-Verfahren, bei dem sich das Modell für knifflige Aufgaben mehr Bedenkzeit nimmt, statt einfach die erste Antwort herauszuhauen. Google verspricht außerdem Spitzenleistung beim multimodalen Verständnis — also Text, Bild, Audio und Video gemeinsam.
KAMPFANSAGE an Claude und GPT
Vorgestellt wurde Gemini 3.5 Pro bereits auf der Google I/O am 19. Mai. Die schnellere Variante Gemini 3.5 Flash ist schon allgemein verfügbar. Das Pro-Modell ist Googles direkte Ansage an die Premium-Liga — gegen Anthropics Claude und OpenAIs GPT.
Spannend für Homelab- und Self-Hosting-Fans: Mit dem riesigen Kontext und Agenten-Fähigkeiten zielt Google klar auf Coding und autonome Workflows — genau die Disziplin, in der sich gerade alle großen Anbieter überbieten.
Der Haken: der Preis
Spitzenleistung kostet. Branchenschätzungen gehen davon aus, dass Gemini 3.5 Pro rund zehnmal so teuer wird wie das Flash-Modell — grob 15 Dollar je Million Token Eingabe und 60 Dollar je Million Token Ausgabe. Für gelegentliche Fragen ist das überdimensioniert, für ernsthafte Agenten- und Coding-Workloads aber ein realistischer Tarif.
WICHTIG: Stand Anfang Juni ist das Modell offiziell noch im begrenzten Vorab-Zugang. Die breite Verfügbarkeit ist angekündigt, aber noch nicht final ausgerollt. Wer es testen will, sollte die offiziellen Release-Notes im Auge behalten.