UNGLAUBLICH: DeepSeek hält die 75-Prozent-Bremse für immer
Am 22. Mai 2026 hat DeepSeek entschieden: der temporäre Rabatt, der seit dem V4-Pro-Release am 24. April lief, wird permanent. Damit bleibt der Preis pro Million Input-Tokens für V4 Pro dauerhaft bei 0,435 US-Dollar, Output bei 0,87 US-Dollar. Bei V4 Flash sogar 0,14 / 0,28 US-Dollar.
Zum Vergleich: Anthropic Claude Opus 4.8 kostet rund 15 / 75 US-Dollar. OpenAI GPT-5.5 liegt bei 5 / 30. DeepSeek V4 Pro ist damit knapp 34-fach günstiger im Output als GPT-5.5 — bei vergleichbaren SWE-Bench-Werten.
WAS ist V4 Pro eigentlich?
Beide Modelle sind MIT-lizenziert und kommen mit 1 Million Token Context-Window. V4 Pro ist das Frontier-Modell mit besseren Reasoning-Werten, V4 Flash der schnelle Cousin für hochvolumige Tasks wie Klassifikation, Routing oder einfache Code-Edits.
Beide laufen auf der DeepSeek-Plattform und auf Self-Hosted-Setups (Quants verfügbar). Wer eigene H100/H200-Boxen hat, kann V4 Pro lokal fahren — der MIT-Lizenz-Aspekt ist dabei kein Detail, sondern Game-Changer für Compliance-Themen.
SO wirkt sich das auf deinen Stack aus
Wenn du Claude oder GPT für High-Volume-Tasks nutzt — Code-Review, Massendokumenten-Klassifikation, Agenten-Schwärme — ist V4 Pro plötzlich der finanzielle Knaller. Beispielrechnung: 100 Millionen Output-Tokens pro Monat kosten dich:
- Claude Opus 4.8: 7.500 US-Dollar
- GPT-5.5: 3.000 US-Dollar
- DeepSeek V4 Pro: 87 US-Dollar
- DeepSeek V4 Flash: 28 US-Dollar
Das ist keine Marketing-Verzerrung — das sind die offiziellen Preislisten zum 22. Mai 2026.
UND der Haken?
Auch DeepSeek hat seine Begrenzungen. Bei sehr komplexen, multi-step Reasoning-Aufgaben oder bei Tool-Use mit vielen Function-Calls bleibt Claude Opus 4.8 vorne. Anthropic-typische Stärken — Honesty-Flag, Long-Form-Konsistenz — sind bei V4 Pro spürbar schwächer.
Plus: Datensouveränität. DeepSeek ist eine chinesische Plattform. Wer Enterprise-Compliance mit „no data leaves the EU“ hat, fährt V4 entweder Self-Hosted oder über einen EU-Proxy (Together AI, Hyperbolic, Fireworks bieten das).
FOLGEN für die Konkurrenz
OpenAI hat in der Mai-Roadmap GPT-5.5 Instant als Default geschoben — Hallucinations runter, Format-Disziplin rauf. Aber der Preisdruck wird steigen. Anthropic dürfte den nächsten Schritt mit Opus 4.8 Fast Mode (kein Preisrückgang, aber 2,5x Geschwindigkeit) gemacht haben.
Mistral und Zhipu AI ziehen mit Mistral 3 und GLM-4.7 nach — beide ebenfalls Open-Weights mit Frontier-Performance. Die Achse „günstige Open-Weights versus Premium-Closed-Source“ wird zum Hauptmotor des Marktes.
FAZIT
Wer Inferenz-Volumen hat, gehört in den nächsten Wochen zwingend zur DeepSeek-Evaluation. Selbst wenn du am Ende bei Claude oder GPT bleibst — die Kosten-Hebel sind so massiv, dass eine Hybrid-Strategie (Fronthand: Claude, Backend-Volumen: DeepSeek) für die meisten Stacks Sinn macht.
Häufige Fragen
Ist DeepSeek V4 Pro wirklich auf Augenhöhe mit GPT-5.5?
Wie integriere ich V4 Pro in einen Claude-Code-Workflow?
Was ist mit Datensicherheit — kann ich Firmen-Code reinschicken?
Quellen: DeepSeek Pricing-Update · LLM Stats Mai 2026 · Open-Source-LLM-Vergleich 2026