Gemini 3.5 Pro: 2 Mio. Token Kontext und Deep Think

Das Rennen um das schlauste KI-Modell geht in die nächste Runde. Google macht ernst: Gemini 3.5 Pro soll noch im Juni allgemein verfügbar werden — mit einem Kontextfenster, das selbst Power-User staunen lässt.

UNGLAUBLICH: 2 Millionen Token am Stück

Das Topmodell zielt auf ein Kontextfenster von 2 Millionen Token. Zur Einordnung: Damit lassen sich ganze Code-Bases, dicke Vertragsstapel oder komplette Buchmanuskripte auf einen Schlag verarbeiten, ohne dass das Modell den Faden verliert.

Dazu kommt ein „Deep Think“-Modus: ein Reasoning-Verfahren, bei dem sich das Modell für knifflige Aufgaben mehr Bedenkzeit nimmt, statt einfach die erste Antwort herauszuhauen. Google verspricht außerdem Spitzenleistung beim multimodalen Verständnis — also Text, Bild, Audio und Video gemeinsam.

KAMPFANSAGE an Claude und GPT

Vorgestellt wurde Gemini 3.5 Pro bereits auf der Google I/O am 19. Mai. Die schnellere Variante Gemini 3.5 Flash ist schon allgemein verfügbar. Das Pro-Modell ist Googles direkte Ansage an die Premium-Liga — gegen Anthropics Claude und OpenAIs GPT.

Spannend für Homelab- und Self-Hosting-Fans: Mit dem riesigen Kontext und Agenten-Fähigkeiten zielt Google klar auf Coding und autonome Workflows — genau die Disziplin, in der sich gerade alle großen Anbieter überbieten.

Der Haken: der Preis

Spitzenleistung kostet. Branchenschätzungen gehen davon aus, dass Gemini 3.5 Pro rund zehnmal so teuer wird wie das Flash-Modell — grob 15 Dollar je Million Token Eingabe und 60 Dollar je Million Token Ausgabe. Für gelegentliche Fragen ist das überdimensioniert, für ernsthafte Agenten- und Coding-Workloads aber ein realistischer Tarif.

WICHTIG: Stand Anfang Juni ist das Modell offiziell noch im begrenzten Vorab-Zugang. Die breite Verfügbarkeit ist angekündigt, aber noch nicht final ausgerollt. Wer es testen will, sollte die offiziellen Release-Notes im Auge behalten.

Häufige Fragen

Was ändert sich für mich als Nutzer?

Du bekommst ein Modell, das extrem lange Eingaben am Stück verarbeitet — etwa komplette Projekt-Codebases oder lange Dokumente. Der Deep-Think-Modus liefert bei schwierigen Aufgaben durchdachtere Antworten. Für einfache Fragen bleibt das günstigere Gemini 3.5 Flash die sinnvollere Wahl.

Wann ist Gemini 3.5 Pro verfügbar?

Google peilt die allgemeine Verfügbarkeit für Juni 2026 an. Vorgestellt wurde das Modell bereits auf der Google I/O am 19. Mai. Anfang Juni läuft es noch im begrenzten Vorab-Zugang — der breite Rollout ist angekündigt, aber noch nicht abgeschlossen.

Was kostet das Modell?

Offizielle Endpreise stehen noch aus. Branchenschätzungen gehen von etwa 15 Dollar je Million Token Eingabe und 60 Dollar je Million Token Ausgabe aus — rund zehnmal so viel wie beim Flash-Modell. Verbindlich wird das erst mit dem finalen Release.

Welche Konkurrenz ist betroffen?

Gemini 3.5 Pro positioniert sich gegen die Premium-Modelle von Anthropic (Claude) und OpenAI (GPT). Vor allem beim langen Kontext und bei Agenten- und Coding-Aufgaben will Google punkten — genau dort, wo die Anbieter aktuell am härtesten konkurrieren.

KAMPFANSAGE AN CLAUDE! Google bringt JETZT seinen 2-Millionen-Token-Riesen — und der denkt richtig nach