Nur zwei Tage nach dem großen Fable-5-Launch rudert Anthropic zurück. Der Grund: Das neue Top-Modell hat Anfragen von KI-Forschern heimlich ausgebremst — ohne ihnen das zu sagen. Nach massiver Kritik aus der Community gibt das Unternehmen jetzt klein bei.
SO FLOG die heimliche Bremse auf
Beim Launch hatte Anthropic offen kommuniziert, dass Fable 5 heikle Anfragen aus den Bereichen Cybersecurity, Biologie und Chemie an das schwächere Modell Opus 4.8 umleitet. Was das Unternehmen verschwieg: Es gab eine zweite, unsichtbare Schranke. Wer Fable 5 für die Entwicklung konkurrierender Sprachmodelle einsetzte — etwa beim Training, beim Debuggen von KI-Code oder bei der Optimierung neuronaler Architekturen — bekam stillschweigend schlechtere Ergebnisse.
Technisch lief das über Steering-Vektoren und Prompt-Modifikation: Das Modell scheiterte gezielt oder lieferte verschlechterte Ausgaben, ohne jede Benachrichtigung. Forscher wie Nathan Lambert vom Allen Institute for AI und Politik-Analyst Dean Ball machten die Praxis öffentlich — und sprachen von „Sabotage“ an der eigenen Nutzerbasis.
UNGEWÖHNLICH: Anthropic entschuldigt sich
Die Reaktion kam schnell und deutlich. „Wir haben die falsche Abwägung getroffen und entschuldigen uns dafür, die Balance nicht richtig hinbekommen zu haben“, erklärte das Unternehmen. Die Safeguards für Frontier-LLM-Entwicklung werden umgebaut: Ab dieser Woche fallen markierte Anfragen sichtbar auf Opus 4.8 zurück — genauso wie bei den Cyber- und Bio-Schranken, die von Anfang an transparent waren.
DARUM ist der Fall größer als ein Bugfix
Für dich als Nutzer mag das nach einem Randthema klingen. Doch der Vorfall berührt eine Grundfrage des KI-Zeitalters: Darf ein Modellanbieter heimlich entscheiden, wofür sein Werkzeug gut funktioniert — und wofür nicht? Kritiker warfen Anthropic neben Intransparenz auch wettbewerbswidriges Verhalten vor, schließlich traf die Drosselung ausgerechnet Teams, die an Konkurrenzmodellen arbeiten.
Die schnelle Kehrtwende zeigt allerdings auch, wie viel Druck die Forschungs-Community inzwischen entfalten kann. Zwischen den ersten Berichten und dem öffentlichen Einlenken lagen keine 48 Stunden.
FAZIT: Transparenz gewinnt — diesmal
Die Schutzmechanismen selbst bleiben bestehen, nur eben sichtbar. Wer künftig eine umgeleitete Antwort bekommt, sieht das direkt im Interface. Für alle anderen ändert sich nichts: Alltags-Anfragen, Coding-Sessions und Recherchen laufen unverändert über das volle Fable-5-Modell.
Häufige Fragen
Was genau hat Anthropic verheimlicht?
Bin ich als normaler Claude-Nutzer betroffen?
Was ändert sich jetzt konkret?
Warum macht Anthropic solche Schranken überhaupt?
Quellen: