Nvidia und Partner liefern jetzt aus: DGX Spark, der „weltweit kleinste AI-Supercomputer“, kommt als kompakte Desktop-Box auf die Schreibtische der Entwicklerwelt. Bis zu einem PetaFLOP FP4-Performance, 128 GB unified Memory, der komplette Nvidia-AI-Stack vorinstalliert.
Hinweis: Dieser Beitrag enthaelt Affiliate-Links (mit * gekennzeichnet). Kaufst du ueber einen dieser Links, erhalte ich eine kleine Provision — fuer dich aendert sich der Preis nicht.
SCHOCK: GB10 Grace-Blackwell unter dem Deckel
Im Herzen steckt der GB10 Grace-Blackwell Superchip — eine CPU-GPU-Kombi, die Nvidia speziell fuer kleine, energieeffiziente AI-Workloads gebaut hat. Damit kannst du moderne Reasoning-Modelle fine-tunen, RAG-Pipelines aufbauen oder Multi-Agent-Systeme prototypen — ohne in die Cloud zu muessen.
WAS macht DGX Spark besonders?
- 1 PetaFLOP FP4-Performance — fuer ein Desktop-Geraet eine Hausnummer.
- 128 GB unified Memory — kein Hin-und-Her zwischen CPU- und GPU-RAM. Das macht das Arbeiten an LLMs deutlich smoother.
- NVIDIA-AI-Stack out of the box: CUDA, cuDNN, NeMo, TensorRT, Triton Inference Server.
- Power-Efficient: Passt unter den Tisch, frisst keine Server-Klimaanlage.
WO bekommst du das Geraet?
Lieferpartner sind Acer, Amazon, ASUS, Dell Technologies, GIGABYTE, HP Inc., Lenovo, Micro Center, MSI und PNY. Die Versions-Spannweite reicht von der kompakten Basis-Variante bis zu Workstation-Setups mit zusaetzlichem Storage und 25-GbE-Anbindung.
UNGLAUBLICH: DGX Station folgt im Fruehjahr
Parallel zur Spark hat Nvidia auch die DGX Station angekuendigt — die groessere Schwester mit mehr GPU-Power. Verfuegbar bei ASUS, Boxx, Dell, GIGABYTE, HP, MSI und Supermicro. Wer mehr Power braucht, kann zur Station greifen — die Spark deckt den kompakten Desktop-Use-Case ab.
VS. QNAP QAI / Cloud-Inference
Der direkte Wettbewerber im AI-Hardware-Markt ist nicht etwa ein anderer Desktop-Computer, sondern die Cloud-Inference-Rechnung. Wer dauerhaft mit grossen Modellen experimentiert, kommt mit einem DGX Spark in 12–18 Monaten unter die Kosten eines AWS- oder Azure-GPU-Mietpreises. Privatsphaere und Latenz gibts gratis dazu.
EXTRA-TIPP: Software-Optimierungen im CES-Patch
Nvidia hat Anfang 2026 auf der CES bereits Software-Updates angekuendigt, die DGX-Spark-Performance auf Spitzen-Niveau heben. NeMo Frameworks, NIM-Microservices und das aktualisierte AI-Workbench-Tooling sind im Update enthalten — wer ein neues Geraet bekommt, sollte direkt den aktuellen Software-Stack einspielen.
FAZIT: Der AI-Workstation-Markt wird ernst
Mit der Verfuegbarkeit der DGX Spark bekommen Entwickler erstmals einen dedizierten, gut ausgestatteten AI-Desktop, ohne sich einen Eigenbau zusammenklicken zu muessen. Fuer Power-Homelabs, kleine AI-Startups und Forschungsabteilungen ist das eine ernste Alternative zum Mietkonzept aus der Cloud.
Apropos Eigenbau: Wer den DGX-Spark-Preis nicht stemmen will, baut sich mit einer Zotac Gaming RTX 4060 Ti 16GB* plus solidem DDR5-Setup einen klassischen DIY-KI-Homelab. Kein PetaFLOP, kein NVLink — fuer lokales LLM-Fine-Tuning bis 13–24 B-Parameter reicht das aber locker, und du behaeltst die volle Kontrolle ueber den Stack.
Häufige Fragen
Was kostet die DGX Spark?
Welche Modelle laufen auf der DGX Spark?
Lohnt sich DGX Spark gegen einen Mac Studio mit M-Chips?
Welche Anwendungsfaelle deckt das Geraet ab?
Quellen: Nvidia DGX Spark, Nvidia Newsroom, Nvidia Technical Blog.