#Künstliche Intelligenz · 3 Min. Lesezeit · Tim Rinkel

OPENAI-HAMMER! GPT-5.2-Codex zermalmt JETZT SWE-Bench Pro — Claude Code muss zittern, Windows-Coder jubeln

OPENAI-HAMMER! GPT-5.2-Codex zermalmt JETZT SWE-Bench Pro — Claude Code muss zittern, Windows-Coder jubeln

OpenAI hat GPT-5.2-Codex veröffentlicht — laut eigener Aussage das fortschrittlichste agentische Coding-Modell bisher. Es ist eine spezialisierte Variante von GPT-5.2, optimiert für komplexe Software-Engineering-Aufgaben. Heißt im Klartext: Refactors, Migrationen, große Codeänderungen sollen jetzt zuverlässiger durch das Modell laufen. Und: spürbar bessere Performance unter Windows.

HAMMER: Was GPT-5.2-Codex besser macht

OpenAI nennt vier konkrete Verbesserungen gegenüber dem Vorgänger:

  1. Long-Horizon-Work dank Context-Compaction — das Modell behält über lange Sessions hinweg Konsistenz, ohne in der eigenen Vergangenheit zu vergessen.
  2. Stärker bei großen Code-Änderungen — Refactors über viele Dateien, Migrationen zwischen Frameworks, größere Architektur-Updates.
  3. Verbesserte Windows-Performance — bisher waren GPT-Modelle in Codex auf Linux/Mac merklich besser, das soll Geschichte sein.
  4. Cybersecurity-Capabilities deutlich gestärkt — Vulnerability-Hunting, Patch-Generierung, Penetration-Test-Skripte.

UNGLAUBLICH: SWE-Bench Pro und Terminal-Bench 2.0

Die Benchmarks, die OpenAI vorlegt, sind für Coder-Modelle die wichtigsten Maßstäbe:

  • SWE-Bench Pro — realistische Software-Engineering-Tasks aus echten Open-Source-Projekten
  • Terminal-Bench 2.0 — agentische Aufgaben in echten Linux-Shell-Umgebungen

OpenAI behauptet State-of-the-Art auf beiden — heißt: besser als Claude Sonnet 4.6 und Gemini 2.5 Pro auf diesen Benchmarks. Unabhängige Verifikation durch die Community läuft, erste Hinweise deuten darauf hin, dass die Zahlen halten.

SCHOCK für Anthropic: Druck auf Claude Code

Claude Code ist seit 2025 das Aushängeschild von Anthropic im Developer-Tooling. Mit GPT-5.2-Codex zieht OpenAI gleich — oder vorbei. Anthropics Antwort: Pricing-Reform (siehe News um 11:00) und neue Features in Claude Code, die in den nächsten Wochen erwartet werden.

Für Entwickler bedeutet das: Konkurrenz ist gut für die Preise. Wer Codex und Claude Code parallel testet, hat in den nächsten Monaten gute Karten — beide Anbieter legen sich ins Zeug.

HAMMER: Wie du GPT-5.2-Codex JETZT ausprobierst

Verfügbarkeit:

  • Codex CLI: Auto-Update auf neueste Version, dann codex --model gpt-5.2-codex
  • OpenAI API: Modell-ID gpt-5.2-codex in deinen Calls
  • ChatGPT: Im Coding-Modus für Pro- und Team-Abos automatisch
  • Cursor / Aider / Continue: Modellauswahl in den Settings

EXTRA-TIPP: Cybersecurity-Workflows neu benchmarken

Wer GPT-5.2-Codex für Sicherheits-Aufgaben einsetzen will, sollte ein paar Standard-Workflows in der eigenen Pipeline benchmarken:

  • CVE-Triage: Wie schnell und korrekt klassifiziert das Modell neue CVEs?
  • Patch-Generierung: Wie sauber sind die Diffs für bekannte Lücken?
  • Static-Analysis-Begleitung: Wie gut interpretiert das Modell SAST-Findings?

FAZIT: Coder-Modell-Krieg geht in die nächste Runde

GPT-5.2-Codex ist ein ernsthafter Schritt nach vorn — vor allem für Windows-Coder und Long-Horizon-Tasks. Wer Anthropic Claude Code nutzt, sollte GPT-5.2-Codex in der nächsten Sprint-Iteration testen, um zu sehen, ob ein Wechsel oder Mix sinnvoll ist.

Häufige Fragen

Was ändert sich für mich als Nutzer?
Du hast jetzt ein deutlich stärkeres OpenAI-Modell für Coding-Tasks zur Verfügung — speziell für längere Sessions, große Refactors und Windows-Workflows. In Codex und über die OpenAI API ist es bereits als gpt-5.2-codex ansprechbar.
Wann ist das Feature verfügbar?
Sofort. OpenAI hat das Modell zur Veröffentlichung sofort über Codex, ChatGPT (Pro und Team) sowie die API bereitgestellt. In Drittanbieter-Tools wie Cursor, Aider und Continue ist es ebenfalls bereits ausgewählt-werden.
Was kostet GPT-5.2-Codex?
Über die OpenAI API gilt das Standard-GPT-5.2-Pricing zuzüglich Codex-Aufschlag — finale Token-Preise stehen im API-Dashboard. In ChatGPT Pro/Team ist die Nutzung im Standard-Pricing inkludiert. Für Heavy-User lohnt der Vergleich gegen das neue Anthropic-Agent-Credit-Modell ab 15. Juni.
Welche Konkurrenz-Produkte sind betroffen?
Allen voran Anthropic Claude Code, Google Gemini Code Assist und Mistral Devstral 2. Auch Tooling-Anbieter wie Cursor, Aider, Cline und Sweep stehen unter Druck, da viele Power-User jetzt auf GPT-5.2-Codex wechseln werden.

Quellen: OpenAI Newsroom, OpenAI Release Notes, Releasebot OpenAI

Kommentar hinterlassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert