Wer KI-Modelle in der eigenen App nutzt, kennt die Angst vor der Rechnung. Ein Bug in einer Schleife, ein durchgedrehter Agent — und plötzlich hast du Tausende Anfragen abgefeuert. Cloudflare baut jetzt einen Notausschalter ein: Spend-Limits im AI Gateway.
WIE das Budget-Limit funktioniert
Bisher konntest du im AI Gateway nur die Anzahl der Anfragen begrenzen (Rate Limiting). Das neue Feature geht weiter: Du legst ein Dollar-Budget fest. Cloudflare trackt den tatsächlichen Geldbetrag, den deine KI-Aufrufe verursachen — und blockt automatisch, sobald das Limit erreicht ist. Der Unterschied ist entscheidend: Nicht jede Anfrage kostet gleich viel, ein teures Modell mit langem Kontext kann ein Vielfaches kosten. Ein Geld-Limit trifft also genau den Punkt, der wehtut: die Rechnung.
Bonus: Eine Identität für viele Konten
Cloudflare hat im selben Zug Cloudflare One erweitert. Mit der neuen IdP-Föderation für Cloudflare Access kannst du einen einzigen Identity Provider über mehrere Konten teilen. Das automatisiert das Lifecycle-Management — neue Mitarbeiter rein, alte raus, an einer zentralen Stelle. Für Agenturen und Firmen mit mehreren Cloudflare-Accounts ist das eine echte Erleichterung.
Ein Beispiel aus der Praxis
Stell dir vor, du baust einen kleinen Chatbot für deine Webseite und schickst die Anfragen über das AI Gateway an ein Sprachmodell. Ein Fehler in deinem Code schickt die letzte Nachricht in einer Schleife immer wieder los — ohne Limit würden hunderte teure Aufrufe durchrauschen, bevor du es merkst. Mit einem Spend-Limit von etwa fünf Dollar pro Tag stoppt Cloudflare die Sause automatisch, sobald das Budget erreicht ist. Statt einer Schock-Rechnung bekommst du einen Fehler zurück — und kannst den Bug in Ruhe beheben. Genau diese Gelassenheit ist der eigentliche Gewinn.
EXTRA-TIPP: Warum dich das interessieren sollte
Auch im Homelab gilt: Wenn du eigene KI-Tools baust und Anfragen über ein zentrales Gateway leitest, sind harte Kostengrenzen Gold wert. Gerade bei autonom laufenden Agenten ist ein automatischer Stopp der beste Schutz vor einer dreistelligen Überraschungsrechnung. Richte das Budget so niedrig ein, wie dein Normalbetrieb es zulässt — du kannst es jederzeit erhöhen.
FAZIT: Ein kleines Feature mit großer Wirkung. Spend-Limits nehmen einem die größte Sorge beim Experimentieren mit KI-APIs: die unkalkulierbare Rechnung.
Häufige Fragen
Was ist der Unterschied zwischen Rate Limiting und Spend-Limit?
Brauche ich einen kostenpflichtigen Cloudflare-Plan dafür?
Was passiert, wenn das Budget erreicht ist?
Quellen: