Hinweis: Dieser Beitrag enthält Affiliate-Links (mit * gekennzeichnet). Kaufst du über einen dieser Links, erhalte ich eine kleine Provision — für dich ändert sich der Preis nicht.
Mozilla.ai pumpt JETZT die nächste Stufe raus! Nach Llamafile und der any-llm-Beta kommt jetzt die v1.0 — production-ready, standardisierter Reasoning-Output, Auto-Provider-Detection. Wer ein eigenes KI-Tool baut, kann ab heute mit einer einzigen API gegen Dutzende LLM-Provider sprechen.
HAMMER: Eine API für ALLES
Die Idee ist simpel, der Effekt riesig: Statt für jeden Provider ein eigenes SDK zu pflegen (Anthropic Python SDK hier, OpenAI dort, eine Custom-Wrapper-Klasse für Gemini drumherum), reicht ein Aufruf gegen any-llm. Der ruft hinten den richtigen Provider auf, einheitlich. Wer einen Provider tauschen will, ändert einen Konfigurations-Wert — nicht eine halbe Codebase.
UNGLAUBLICH: Auto-Provider-Detection
any-llm 1.0 erkennt anhand des Modellnamens automatisch, welcher Provider angesprochen werden soll. Schreibst du claude-opus-4-7, geht der Call zu Anthropic. gpt-5.5-instant landet bei OpenAI. llama-3.3-70b bei deinem lokalen Server. Keine Provider-Strings mehr in Configs — die Modell-ID reicht.
SCHOCK: Alte Gateway wird am 18. Mai abgeschaltet
Achtung, Stolperstein: Das mit dem alten any-llm gebündelte Gateway wird am 18. Mai 2026 entfernt. Wer das im Produktivsystem nutzt, muss auf das standalone-Gateway umsteigen (github.com/mozilla-ai/gateway). Klingt nach Detail, schmerzt aber, wenn dein Chatbot in der nächsten Woche überraschend leise wird.
So integrierst du any-llm in 15 MINUTEN
- Install:
pip install any-llm(Python) odernpm install @mozilla-ai/any-llm(Node). - Provider-Keys: Anthropic, OpenAI, Gemini-Keys als Env-Variablen hinterlegen.
- Erster Call:
response = any_llm.complete(model="claude-opus-4-7", messages=[...]). Fertig. - Standalone-Gateway: Wenn du den Routing-Layer brauchst, das separate
mozilla-ai/gateway-Repo deployen — Container-Image gibt es bereits. Für einen schmerzfreien Sandbox-Spielplatz reicht eine kleine VM bei Hetzner Cloud* ab rund 5 Euro pro Monat — Provider-Keys gegen das Gateway feuern, Antworten vergleichen, fertig. - Reasoning parsen:
response.reasoning_stepsist über alle Provider gleich strukturiert — das ist neu in 1.0.
EXTRA-TIPP: Cost-Routing per Regel
Wer Geld sparen will, definiert einfache Regeln: kurze Prompts < 100 Tokens → lokales Llama 3.3; lange Prompts mit Reasoning → Opus 4.7. Das ist mit any-llm in zehn Zeilen Code abbildbar — und spart in produktiven Apps fast immer mindestens 30 Prozent Inferenz-Kosten.
FAZIT: Open-Source-Standard für LLM-APIs
any-llm 1.0 ist ein wichtiger Schritt: Mozilla.ai etabliert einen offenen Standard für LLM-Kommunikation. Vendor-Lock-In wird kostspielig, Migrationen werden günstig, A/B-Tests werden Tag-eins-Workflow. Wer einen produktiven KI-Stack baut, sollte 2026 nicht mehr SDK-pro-Provider denken — sondern Gateway-pro-Stack.
Häufige Fragen
Was ist any-llm?
Wie unterscheidet sich any-llm von LiteLLM?
Was bringt mir das praktisch?
Was passiert mit dem alten any-llm-Gateway?
github.com/mozilla-ai/gateway migrieren. Heißt: Jetzt umstellen, sonst gibt es einen unerwarteten Ausfall in einer Woche.