Bei Ollama gibt es Bewegung wie selten zuvor: Version 0.23 bringt Vision-Support für lokale Modelle, und die Library füllt sich mit den heißesten Open-Source-LLMs des Frühjahrs. Wer im Homelab schon ein paar Container für LLM-Tooling laufen hat, sollte heute Nacht updaten.
SCHOCK: LLM sieht JETZT auch Bilder
Mit 0.23.4 unterstützt Ollama multimodale Modelle mit Bild-Eingabe direkt im Standard-Workflow. Du übergibst dem Modell einen lokalen Bildpfad, es erkennt Objekte, beschreibt Szenen und kann sogar Fragen zum Inhalt beantworten — vollständig auf deiner Hardware, ohne dass Bilddaten an die Cloud gehen.
UNGLAUBLICH: Library wächst auf 4.500+ Modelle
Die Ollama-Library hat im Mai 2026 die Schwelle von über 4.500 Modellen übersprungen. Die Top-Spieler unter den Open-Source-LLMs:
- Llama 4 Scout — bestes Allround-Modell, läuft auf moderner Hardware solide.
- Kimi K2.6 — Top-Coder, MoE-Architektur, derzeit Liebling auf SWE-Bench Verified.
- Qwen 3.6 27B — bestes dichtes Coding-Modell laut den Mai-2026-Benchmarks, 77,2 % SWE-Bench.
- Devstral Small 24B — agentisches Coding für lokale IDE-Setups.
- Mistral 7B — Geschwindigkeit auf bescheidener Hardware, idealer Einstieg.
- Phi-4 Mini — passt in 4–8 GB VRAM, perfekt für ältere Karten.
HOMELAB-EFFEKT: 4-Bit-Quantisierung macht’s möglich
Hinter den Kulissen feiert die Q4_K_M-Quantisierung ihren großen Auftritt. Dank 4-Bit-Modellen laufen LLMs der Größe von Llama 4 Scout selbst auf Consumer-Hardware mit moderater GPU spürbar gut. Wer einen kleinen 24-GB-GPU-Knoten hat, bekommt heute Modelle ins RAM, für die noch vor einem Jahr ein A100 nötig war.
WEB SEARCH FÜR LOKALE LLMs
Eine weitere Neuerung: Web-Suche. Ollama kann ausgewählte Modelle automatisch um Online-Suche ergänzen, wenn die Konfiguration es erlaubt. Damit verschwimmt die Grenze zwischen rein lokalem Tinkern und produktiv brauchbarem Assistenten, ohne dass du das Modell selbst online hosten müsstest.
VISION USE-CASES für SELF-HOSTER
Die Vision-Modelle eröffnen praktische Workflows: Foto-Bibliothek ohne Cloud-AI sortieren, Frigate-Snapshots automatisch beschriften, OCR auf Screenshots lokal laufen lassen, Smart-Home-Skripte mit Bildkontext füttern. Wer Immich oder ein eigenes Photo-Setup nutzt, bekommt einen ersten produktionstauglichen Stack ohne externe API.
So holst du dir Ollama 0.23 in 5 MINUTEN!
Auf einem aktuellen Linux: curl -fsSL https://ollama.com/install.sh | sh. Anschließend ollama pull llama4-scout oder ollama pull qwen3.6:27b, und schon kannst du im Terminal mit dem Modell chatten. Für die Vision-Funktion ein Modell mit Bild-Support pullen, z. B. ollama pull llama4-scout-vision, und im Chat einfach den Pfad zu einem Bild mit /image übergeben.
FAZIT: KI gehört JETZT auch lokal ins Wohnzimmer
Ollama 0.23 ist der Punkt, an dem lokale LLMs Mainstream werden. Vision-Modelle ohne Cloud, ein riesiger Modell-Zoo, Quantisierungen für Consumer-Hardware und integrierte Websuche. Wer KI im Homelab ernsthaft fahren will, hat heute keinen besseren Startpunkt.
Häufige Fragen
Was ist neu in dieser Version?
Lohnt sich das Update sofort oder kann ich warten?
Bricht das Update bestehende Konfigurationen?
Wie führe ich das Update durch?
curl -fsSL https://ollama.com/install.sh | sh. macOS- und Windows-Nutzer ziehen die aktuelle App-Version aus dem Download-Bereich. Nach dem Update den Ollama-Daemon einmal neu starten, dann mit ollama pull die gewünschten Modelle laden.Quellen: Ollama Blog, PromptQuorum Top-Open-Source-Modelle Mai 2026, Ollama Releases auf GitHub.