Toto je starší verze dokumentu!
NVIDIA DGX Spark
Vytvořeno: 1.5.2026 | Aktualizováno: 01.05.2026 06:36
NVIDIA DGX Spark je kompaktní desktopový AI systém určený pro lokální běh, testování a fine-tuning AI modelů. Český obchod Alza ho vede jako „NVIDIA DGX Spark 4TB“ a popisuje ho jako mini počítač pro inferenci velkých jazykových modelů, specializaci předtrénovaných sítí a vývoj AI agentů.
Co to je
DGX Spark je osobní AI pracovní stanice postavená na platformě NVIDIA GB10 Grace Blackwell. Cílem zařízení je dostat část práce s většími modely z cloudu nebo datacentra přímo na stůl vývojáře – hlavně lokální inference, prototypování, validaci modelů, agentní workflow a menší fine-tuning.
Nejde o běžný mini PC s desktopovou grafikou. Hlavní rozdíl je ve velké sjednocené paměti pro CPU i GPU, předinstalovaném NVIDIA AI softwarovém stacku a síťové výbavě pro propojení více jednotek.
Hlavní parametry
| Oblast | Parametr |
|---|---|
| Platforma | NVIDIA GB10 Grace Blackwell Superchip |
| CPU | 20jádrový Arm: 10× Cortex-X925 + 10× Cortex-A725 |
| GPU | NVIDIA Blackwell Architecture |
| Tensor Cores | 5. generace |
| RT Cores | 4. generace |
| AI výkon | až 1 PFLOP FP4; NVIDIA uvádí jako teoretický výkon s využitím sparsity |
| Paměť | 128 GB LPDDR5x coherent unified system memory |
| Paměťové rozhraní | 256 bit |
| Paměťová propustnost | 273 GB/s |
| Úložiště | 4 TB NVMe M.2 se self-encryption |
| USB | 4× USB-C |
| Ethernet | 1× RJ-45 10GbE |
| Další síť | ConnectX-7 NIC 200 Gb/s, Wi‑Fi 7, Bluetooth 5.4 |
| Video / audio | HDMI 2.1a, HDMI multichannel audio |
| Napájení | 240W zdroj |
| TDP GB10 | 140 W |
| OS | NVIDIA DGX OS |
| Rozměry | 150 × 150 × 50,5 mm |
| Hmotnost | 1,2 kg |
Lokální AI modely
NVIDIA uvádí, že DGX Spark zvládá práci s modely až do 200 miliard parametrů pro inference a testování. Pro fine-tuning produktová stránka uvádí modely až do 70 miliard parametrů.
V novějším článku NVIDIA Developer Blog – Scaling Autonomous AI Agents and Workloads with NVIDIA DGX Spark NVIDIA popisuje i scénáře pro lokální agentní workloady, velká kontextová okna a škálování více DGX Spark uzlů. Jeden uzel tam označuje jako vhodný pro low-latency inference s velkým kontextem, lokální agentní workloady a fine-tuning až do 120B parametrů. Více propojených jednotek pak slouží pro větší modely nebo vyšší paralelismus.
Tyto limity je potřeba číst jako horní technické scénáře závislé na přesnosti, kvantizaci, runtime a konkrétním modelu. Tvrzení „model má 200B parametrů“ samo o sobě neříká, jak rychle poběží, jak dlouhý kontext půjde prakticky používat ani jak pohodlný bude fine-tuning.
Vhodné použití
DGX Spark dává smysl hlavně pro:
- lokální inference open-weight LLM,
- vývoj a testování AI agentů,
- práci s většími kontextovými okny,
- prototypování před nasazením v cloudu nebo datacentru,
- menší fine-tuning a specializaci předtrénovaných modelů,
- vývoj edge AI aplikací, robotiky a computer vision workflow.
Pro běžné domácí hraní s menšími modely může být zbytečně drahý a specializovaný. Je zajímavý hlavně tam, kde nestačí běžná desktopová GPU s 24–48 GB VRAM, ale zároveň není cílem stavět plnohodnotný datacentrový server.
Opatrně u marketingových čísel
Hodnota 1 PFLOP je uváděná pro FP4 a podle poznámky NVIDIA jde o teoretický výkon při použití sparsity. Pro praktický výkon u LLM inference bude důležitá kombinace runtime, přesnosti modelu, paměťové propustnosti, délky kontextu a batchingu.
Podobně údaj o modelech do 200B parametrů neznamená, že všechny modely této velikosti poběží stejně dobře. Záleží na kvantizaci, architektuře modelu a tom, zda je konkrétní runtime pro DGX Spark dobře optimalizovaný.
Dostupnost v ČR
Alza má produkt vedený jako NVIDIA DGX Spark 4TB. Ve veřejně dostupném popisu uvádí 128 GB RAM, 4TB SSD, NVIDIA GB10 Grace Blackwell, NVIDIA DGX OS a zaměření na lokální zpracování AI modelů. Cena a skladová dostupnost se mohou měnit, proto je potřeba je ověřit přímo na stránce produktu.