Nvidia DGX Spark Auslieferung: 1 PetaFLOP FP4 am Desktop

Nvidia und Partner liefern jetzt aus: DGX Spark, der „weltweit kleinste AI-Supercomputer“, kommt als kompakte Desktop-Box auf die Schreibtische der Entwicklerwelt. Bis zu einem PetaFLOP FP4-Performance, 128 GB unified Memory, der komplette Nvidia-AI-Stack vorinstalliert.

Hinweis: Dieser Beitrag enthaelt Affiliate-Links (mit * gekennzeichnet). Kaufst du ueber einen dieser Links, erhalte ich eine kleine Provision — fuer dich aendert sich der Preis nicht.

SCHOCK: GB10 Grace-Blackwell unter dem Deckel

Im Herzen steckt der GB10 Grace-Blackwell Superchip — eine CPU-GPU-Kombi, die Nvidia speziell fuer kleine, energieeffiziente AI-Workloads gebaut hat. Damit kannst du moderne Reasoning-Modelle fine-tunen, RAG-Pipelines aufbauen oder Multi-Agent-Systeme prototypen — ohne in die Cloud zu muessen.

WAS macht DGX Spark besonders?

1 PetaFLOP FP4-Performance — fuer ein Desktop-Geraet eine Hausnummer.
128 GB unified Memory — kein Hin-und-Her zwischen CPU- und GPU-RAM. Das macht das Arbeiten an LLMs deutlich smoother.
NVIDIA-AI-Stack out of the box: CUDA, cuDNN, NeMo, TensorRT, Triton Inference Server.
Power-Efficient: Passt unter den Tisch, frisst keine Server-Klimaanlage.

WO bekommst du das Geraet?

Lieferpartner sind Acer, Amazon, ASUS, Dell Technologies, GIGABYTE, HP Inc., Lenovo, Micro Center, MSI und PNY. Die Versions-Spannweite reicht von der kompakten Basis-Variante bis zu Workstation-Setups mit zusaetzlichem Storage und 25-GbE-Anbindung.

UNGLAUBLICH: DGX Station folgt im Fruehjahr

Parallel zur Spark hat Nvidia auch die DGX Station angekuendigt — die groessere Schwester mit mehr GPU-Power. Verfuegbar bei ASUS, Boxx, Dell, GIGABYTE, HP, MSI und Supermicro. Wer mehr Power braucht, kann zur Station greifen — die Spark deckt den kompakten Desktop-Use-Case ab.

VS. QNAP QAI / Cloud-Inference

Der direkte Wettbewerber im AI-Hardware-Markt ist nicht etwa ein anderer Desktop-Computer, sondern die Cloud-Inference-Rechnung. Wer dauerhaft mit grossen Modellen experimentiert, kommt mit einem DGX Spark in 12–18 Monaten unter die Kosten eines AWS- oder Azure-GPU-Mietpreises. Privatsphaere und Latenz gibts gratis dazu.

EXTRA-TIPP: Software-Optimierungen im CES-Patch

Nvidia hat Anfang 2026 auf der CES bereits Software-Updates angekuendigt, die DGX-Spark-Performance auf Spitzen-Niveau heben. NeMo Frameworks, NIM-Microservices und das aktualisierte AI-Workbench-Tooling sind im Update enthalten — wer ein neues Geraet bekommt, sollte direkt den aktuellen Software-Stack einspielen.

FAZIT: Der AI-Workstation-Markt wird ernst

Mit der Verfuegbarkeit der DGX Spark bekommen Entwickler erstmals einen dedizierten, gut ausgestatteten AI-Desktop, ohne sich einen Eigenbau zusammenklicken zu muessen. Fuer Power-Homelabs, kleine AI-Startups und Forschungsabteilungen ist das eine ernste Alternative zum Mietkonzept aus der Cloud.

Apropos Eigenbau: Wer den DGX-Spark-Preis nicht stemmen will, baut sich mit einer Zotac Gaming RTX 4060 Ti 16GB* plus solidem DDR5-Setup einen klassischen DIY-KI-Homelab. Kein PetaFLOP, kein NVLink — fuer lokales LLM-Fine-Tuning bis 13–24 B-Parameter reicht das aber locker, und du behaeltst die volle Kontrolle ueber den Stack.

Häufige Fragen

Was kostet die DGX Spark?

Der Einstiegspreis liegt bei rund 4.700 USD. Hardware-Partner verlangen je nach Konfiguration (Storage, RAM-Erweiterung, Netzwerk) bis zu 6.500 USD. Fuer den deutschen Markt rechne mit einem Bruttoaufschlag durch Mehrwertsteuer und Import.

Welche Modelle laufen auf der DGX Spark?

Mit 128 GB unified Memory laufen Modelle bis ca. 70 Milliarden Parameter in 4-Bit-Quantisierung komfortabel. Llama 4 Scout, Qwen 3.5 32B, DeepSeek V4 Flash, Mistral Medium 3.5 — alles drin. Wer Reasoning-Modelle wie Claude-Style-Chains laufen lassen will, kommt mit MoE-Architekturen gut zurecht.

Lohnt sich DGX Spark gegen einen Mac Studio mit M-Chips?

Mac Studio (M4 Max/Ultra) ist guenstiger und energieeffizienter, hat aber weniger nativen Software-Support fuer CUDA-Workflows. Wer mit MLX und PyTorch-Mac-Pfad arbeitet, ist mit dem Mac gut bedient. Wer auf CUDA-Tooling, NeMo, NIM und Server-Grade-Treiber angewiesen ist, bekommt mit der DGX Spark das natuerlichere Setup.

Welche Anwendungsfaelle deckt das Geraet ab?

Drei Hauptszenarien: erstens lokales Fine-Tuning kleiner bis mittlerer LLMs, zweitens RAG-Setups mit privaten Daten, drittens Multi-Agent-Prototyping mit MCP/Claude-Code-Setups. Studierende, Forschende und kleine Engineering-Teams sind die Hauptzielgruppe — Enterprise greift eher zur DGX Station oder zu Rack-Server-Setups.

Quellen: Nvidia DGX Spark, Nvidia Newsroom, Nvidia Technical Blog.

DESKTOP-HAMMER! Nvidia stellt JETZT DGX Spark auf DEINEN Schreibtisch — 1 PETAFLOP in Grace-Blackwell-Box, ab sofort lieferbar