Mozilla Thunderbolt: Open-Source-AI-Client für Self-Hosting

Q: Welche Modelle unterstützt Thunderbolt?

Über das angebundene any-llm-Gateway prinzipiell alles, was die OpenAI-API spricht — also OpenAI selbst, Anthropic, Gemini, lokale Llama.cpp/Ollama, Mistral, Groq und so weiter. Das macht Thunderbolt zur idealen Frontend-Wahl, wenn du eine Multi-Provider-Strategie fahren willst und Vendor-Lock-In vermeiden möchtest.

Hinweis: Dieser Beitrag enthält Affiliate-Links (mit * gekennzeichnet). Kaufst du über einen dieser Links, erhalte ich eine kleine Provision — für dich ändert sich der Preis nicht.

Mozilla mischt JETZT den Self-Hosted-AI-Markt auf! Die Tochter MZLA Technologies (genau, die mit Thunderbird) hat einen Open-Source-AI-Client raus: Thunderbolt. Zielgruppe sind Unternehmen, die KI-Chatbots selbst betreiben wollen — ohne Cloud-Abhängigkeit, ohne Vendor-Lock-In, ohne Daten-Reise nach Übersee.

HAMMER: Open Source und AGPL

Thunderbolt ist nicht das nächste Closed-Source-Copilot-Klon. Die Codebase steht auf GitHub, Lizenz ist AGPL — also: Wer den Client kommerziell weiterentwickelt, muss seine Änderungen offen legen. Das ist Mozilla in alter Schule: Browser-Wars-Mentalität, übertragen auf die KI-Welt.

UNGLAUBLICH: Anbindung an any-llm v1.0

Thunderbolt setzt im Backend auf any-llm, das gleichnamige Universal-Gateway von Mozilla.ai. Heißt: Du steckst hinten OpenAI, Anthropic, Gemini, Mistral, Groq, Llama.cpp oder Ollama dran — vorne bleibt die Bedienung gleich. Die Endpoint-Logik wird abstrahiert, du kannst Modelle gegeneinander testen, ohne deine Frontend-UX zu zerschießen.

SCHOCK: Mozilla baut den Anti-Microsoft-Stack

Im selben Atemzug hat Mozilla die any-llm v1.0-Release rausgelassen, mit produktions-tauglicher Stabilität, standardisiertem Reasoning-Output und Auto-Provider-Detection. Wer Mozilla sechs Monate lang als „nur Browser“ abgehakt hat — schaut nochmal hin. MZLA + Mozilla.ai bauen einen kompletten Stack, mit dem Unternehmen ohne Big-Tech-Cloud KI-Infrastruktur fahren können.

So startest du einen Thunderbolt-Pilot

Repo klonen: git clone https://github.com/mozilla-ai/thunderbolt (sobald öffentlich, prüfe Tag-Status).
any-llm Gateway aufsetzen: Docker-Compose mit any-llm v1.0, dann deine Provider-Keys hinterlegen.
Backend wählen: Eine kleine VM bei Hetzner Cloud* reicht für Convenience-Tests, lokales Llama.cpp/Ollama auf einem ruhigen Minisforum UM790 Pro Mini-PC* gibt dir maximale Daten-Souveränität — oder Hybrid mit Routing-Regeln.
Reverse-Proxy: Thunderbolt hinter Caddy oder Traefik, TLS automatisch. Hier im IT-Tutorial-Archiv findest du Setup-Schritte für die üblichen Reverse-Proxies.
Authentifizierung: SSO via Keycloak oder Authelia — sonst keinen produktiven Einsatz wagen.

EXTRA-TIPP: Pflicht im EU-Compliance-Kontext

Wer DSGVO-konform Chats braucht, hat mit Thunderbolt einen Server-Side-Default: Keine SaaS-Logs, kein US-Provider als Pflicht-Stop. Plus: Lokale LLMs werden 2026 für viele Anwendungsfälle endlich performant genug — Llama 3.3 oder Mistral Medium 3.5 auf einer Single-GPU schaffen für interne Chatbots problemlos die Latenz-Ziele.

FAZIT: Self-Hosting-AI bekommt Standard-Stack

Bisher war Self-Hosted AI ein Frickel-Wochenende: LibreChat hier, Ollama da, RAG-Pipeline drumherum. Mit Thunderbolt + any-llm legt Mozilla einen kohärenten Stack auf, der enterprise-tauglich ist. Wer im Mittelstand IT-Souveränität sucht, hat ab heute ein Werkzeug, mit dem das ernsthaft funktioniert.

Häufige Fragen

Was ist Thunderbolt überhaupt?

Thunderbolt ist ein Open-Source-AI-Client für Unternehmen, gebaut von MZLA Technologies (die Mozilla-Tochter, die auch Thunderbird betreut). Ziel: ein selbst-gehosteter Chatbot, der ohne Cloud-Anbindung läuft und sich an Lokal-Modelle, Eigenes LLM oder Mozillas any-llm-Gateway anbinden lässt. Quellcode liegt auf GitHub, AGPL-Lizenz.

Wofür brauche ich noch einen weiteren AI-Client?

Für Souveränität. Wer in der EU, im Gesundheitswesen oder in der öffentlichen Verwaltung arbeitet, will keine Chat-Logs in US-Cloud-Speichern sehen. Thunderbolt setzt darauf, dass du selbst entscheidest, wo Modelle laufen und wo Konversationen gespeichert werden. Plus: Du kannst es an interne RAG-Backends oder On-Prem-LLMs binden, ohne die Klick-Stack-Bedienung neu zu erfinden.

Welche Modelle unterstützt Thunderbolt?

Über das angebundene any-llm-Gateway prinzipiell alles, was die OpenAI-API spricht — also OpenAI selbst, Anthropic, Gemini, lokale Llama.cpp/Ollama, Mistral, Groq und so weiter. Das macht Thunderbolt zur idealen Frontend-Wahl, wenn du eine Multi-Provider-Strategie fahren willst und Vendor-Lock-In vermeiden möchtest.

Was kostet das?

Null Lizenzkosten — AGPL. Die Hosting-Kosten landen bei dir: Server, Modell-Inferenz, Storage. Wer einen lokalen LLM-Server (zum Beispiel auf einer RTX 4090 oder einem H100-Edge) betreibt, kann mit Thunderbolt + any-llm ein komplettes Stack zum Bruchteil eines Enterprise-Copilot-Tarifs aufziehen.

MOZILLA-HAMMER! Thunderbolt-AI knallt JETZT als Self-Hosted-Chatbot raus