Bleeding Llama (CVE-2026-7482): Ollama unter v0.17.1 patchen

Q: Welche Versionen sind betroffen?

Alle Ollama-Versionen vor v0.17.1. Der Patch wurde am 25. Februar 2026 veröffentlicht, aber ohne Security-Flag. Wer seitdem nicht aktualisiert hat, ist mit hoher Wahrscheinlichkeit verwundbar.

Q: Was muss ich konkret tun?

Drei Schritte: (1) ollama --version checken, ggf. auf v0.17.1+ updaten. (2) Falls der Port im Internet stand: alle API-Keys und Cloud-Credentials, die in Tool-Calls oder System-Prompts steckten, neu generieren. (3) Den Ollama-Port hinter Authentication setzen — Reverse-Proxy mit Basic-Auth oder Tailscale-Mesh.

Q: Wie kann ich mich künftig besser schützen?

Ollama nie auf 0.0.0.0 binden ohne Authentication davor. Bevorzugt 127.0.0.1 und über SSH-Tunnel oder Mesh-VPN nutzen. Wer eine Web-UI braucht, schaltet einen Reverse-Proxy mit Basic-Auth dazwischen. Plus: regelmäßig den Ollama-Release-Feed abonnieren — gerade weil Security-Fixes hier nicht immer markiert werden.

OLLAMA-NUTZER, AUFGEPASST: Die KI-Software, mit der DU dein lokales ChatGPT auf dem Homelab-Server fährst, hat ein KLAFFENDES Heap-Loch — und der Patch lief seit Februar UNDER THE RADAR. Bleeding Llama heißt der Bug (Cyera-Researcher haben ihn getauft), CVE-Nummer CVE-2026-7482, CVSS-Score 9.1. Drei unauthentifizierte API-Calls reichen, und der Angreifer liest DIR den ganzen Heap-Speicher des Ollama-Prozesses aus. API-Keys, System-Prompts, User-Conversations, Cloud-Credentials — ALLES geht über den Tisch.

SO FUNKTIONIERT die Lecke

Das Loch sitzt im GGUF-Loader — das ist der Code-Teil, der KI-Modelle lädt. Ein bösartig präpariertes GGUF-File schubst Ollama dazu, über die Speichergrenze hinaus zu lesen. Der Angreifer braucht keinen Login, keine Cookie, keinen User-Account. Und im Server-Log steht NICHTS. Wenn du keine dedizierte Endpoint-Überwachung hast, merkst du den Angriff erst, wenn deine Cloud-Credentials in irgendeinem Telegram-Channel auftauchen.

300.000 SERVER offen im Netz

Die Cyera-Researcher haben die Internet-weite Sichtbarkeit gescannt: rund 300.000 öffentlich erreichbare Ollama-Instanzen stehen im Netz, ein Großteil davon ohne Authentication. Ollama bindet per Default auf 0.0.0.0:11434, sobald du OLLAMA_HOST=0.0.0.0 setzt — und genau das macht jeder Homelab-Tutorial-Schreiber, damit das Open-WebUI im LAN drankommt.

DAS WIRKLICH BÖSE: Patch seit Februar — ohne Ansage

Der Fix steckt seit dem 25. Februar 2026 in Ollama v0.17.1. Aber: Die Release-Notes haben den Bug NICHT als Security-Fix markiert. CVE-Nummer? Fehlte. Scanner-Alert? Fehlte. Tagging als Critical? Nope. Wer in den letzten drei Monaten nicht stumpf ollama pull + Service-Restart durchgezogen hat, hängt ALS GROSSE WAHRSCHEINLICHKEIT immer noch auf einer löchrigen Version.

SO PRÜFST DU dein Setup in 30 SEKUNDEN

Auf deinem Ollama-Host einfach ollama --version tippen. Steht da was unter 0.17.1, ist es Zeit für Action:

Linux/Docker: curl -fsSL https://ollama.com/install.sh | sh bzw. neueste Image-Variante pullen.
macOS: Über die GUI „Check for Updates“ oder Homebrew brew upgrade ollama.
Windows: Installer von ollama.com runterladen und drüberbügeln.

UND DANN: ROTIERE ALLES

War deine Instanz vor dem Update aus dem Netz erreichbar, geh davon aus, dass jemand mitgelesen hat. Konkret: API-Keys neu generieren (OpenAI, Anthropic, Groq, alles was in Tool-Calls steckte), System-Prompts ändern (vor allem wenn da Geheimnisse drinstanden) und Cloud-Credentials erneuern. Nervt — aber ist NICHT verhandelbar.

EXTRA-TIPP für die Zukunft

Bind Ollama NIE direkt aufs Internet. Setz einen Reverse-Proxy mit Basic-Auth davor (Caddy, Traefik, Nginx — alle drei haben Ein-Zeiler-Konfigs dafür) oder häng den Port hinter ein Tailscale/Wireguard-Mesh. Wer den Service nur im eigenen LAN braucht, lässt OLLAMA_HOST auf 127.0.0.1. Drei Zeichen weniger Angriffsfläche.

WARNUNG vor Folge-Lecken

Sicherheits-Firma Mondoo hat in der gleichen Woche zwei weitere Ollama-CVEs gemeldet — beide im Windows-Updater. Die Patches stehen noch aus. Das Muster ist klar: Wer Ollama produktiv fährt, sollte JETZT ein Monitoring auf den Service legen. Es bleibt nicht beim einen Loch.

FAZIT: Update, rotiere, sperre

Bleeding Llama ist ein Lehrstück: Ein stillschweigender Patch im Februar, drei Monate später die wilde Disclosure — und die ganze KI-Self-Hosting-Szene zuckt zusammen. Wer Ollama auf 0.17.1+ hebt, alle Secrets rotiert und den Service hinter Authentication packt, ist sauber raus. Wer das ignoriert, läuft beim nächsten Honeypot-Scan vor den Bus.

Häufige Fragen

Welche Versionen sind betroffen?

Alle Ollama-Versionen vor v0.17.1. Der Patch wurde am 25. Februar 2026 veröffentlicht, aber ohne Security-Flag. Wer seitdem nicht aktualisiert hat, ist mit hoher Wahrscheinlichkeit verwundbar.

Wie merke ich, ob mein System angegriffen wurde?

Schwierig — der Angriff lässt KEINE Spuren in den Standard-Logs. Drei API-Calls auf einen Port reichen, und im Web-Server-Log siehst du nur normale POSTs. Ohne dediziertes Endpoint-Monitoring (z.B. Wazuh, Falco) lässt sich der Angriff praktisch nicht nachweisen. Sicherheitshalber: Secrets rotieren und davon ausgehen, dass etwas geleakt sein könnte.

Was muss ich konkret tun?

Drei Schritte: (1) ollama --version checken, ggf. auf v0.17.1+ updaten. (2) Falls der Port im Internet stand: alle API-Keys und Cloud-Credentials, die in Tool-Calls oder System-Prompts steckten, neu generieren. (3) Den Ollama-Port hinter Authentication setzen — Reverse-Proxy mit Basic-Auth oder Tailscale-Mesh.

Wie kann ich mich künftig besser schützen?

Ollama nie auf 0.0.0.0 binden ohne Authentication davor. Bevorzugt 127.0.0.1 und über SSH-Tunnel oder Mesh-VPN nutzen. Wer eine Web-UI braucht, schaltet einen Reverse-Proxy mit Basic-Auth dazwischen. Plus: regelmäßig den Ollama-Release-Feed abonnieren — gerade weil Security-Fixes hier nicht immer markiert werden.

Quellen:

OLLAMA-ALARM! BLEEDING LLAMA reisst JETZT 300.000 KI-Server auf — DEIN lokaler ChatGPT-Klon lässt API-Keys und Prompts ungebremst raus