ai:hardware:nvidia-dgx-spark

Toto je starší verze dokumentu!


NVIDIA DGX Spark

Vytvořeno: 1.5.2026 | Aktualizováno: 01.05.2026 06:36

NVIDIA DGX Spark je kompaktní desktopový AI systém určený pro lokální běh, testování a fine-tuning AI modelů. Český obchod Alza ho vede jako „NVIDIA DGX Spark 4TB“ a popisuje ho jako mini počítač pro inferenci velkých jazykových modelů, specializaci předtrénovaných sítí a vývoj AI agentů.

DGX Spark je osobní AI pracovní stanice postavená na platformě NVIDIA GB10 Grace Blackwell. Cílem zařízení je dostat část práce s většími modely z cloudu nebo datacentra přímo na stůl vývojáře – hlavně lokální inference, prototypování, validaci modelů, agentní workflow a menší fine-tuning.

Nejde o běžný mini PC s desktopovou grafikou. Hlavní rozdíl je ve velké sjednocené paměti pro CPU i GPU, předinstalovaném NVIDIA AI softwarovém stacku a síťové výbavě pro propojení více jednotek.

Oblast Parametr
Platforma NVIDIA GB10 Grace Blackwell Superchip
CPU 20jádrový Arm: 10× Cortex-X925 + 10× Cortex-A725
GPU NVIDIA Blackwell Architecture
Tensor Cores 5. generace
RT Cores 4. generace
AI výkon až 1 PFLOP FP4; NVIDIA uvádí jako teoretický výkon s využitím sparsity
Paměť 128 GB LPDDR5x coherent unified system memory
Paměťové rozhraní 256 bit
Paměťová propustnost 273 GB/s
Úložiště 4 TB NVMe M.2 se self-encryption
USB 4× USB-C
Ethernet 1× RJ-45 10GbE
Další síť ConnectX-7 NIC 200 Gb/s, Wi‑Fi 7, Bluetooth 5.4
Video / audio HDMI 2.1a, HDMI multichannel audio
Napájení 240W zdroj
TDP GB10 140 W
OS NVIDIA DGX OS
Rozměry 150 × 150 × 50,5 mm
Hmotnost 1,2 kg

NVIDIA uvádí, že DGX Spark zvládá práci s modely až do 200 miliard parametrů pro inference a testování. Pro fine-tuning produktová stránka uvádí modely až do 70 miliard parametrů.

V novějším článku NVIDIA Developer Blog – Scaling Autonomous AI Agents and Workloads with NVIDIA DGX Spark NVIDIA popisuje i scénáře pro lokální agentní workloady, velká kontextová okna a škálování více DGX Spark uzlů. Jeden uzel tam označuje jako vhodný pro low-latency inference s velkým kontextem, lokální agentní workloady a fine-tuning až do 120B parametrů. Více propojených jednotek pak slouží pro větší modely nebo vyšší paralelismus.

Tyto limity je potřeba číst jako horní technické scénáře závislé na přesnosti, kvantizaci, runtime a konkrétním modelu. Tvrzení „model má 200B parametrů“ samo o sobě neříká, jak rychle poběží, jak dlouhý kontext půjde prakticky používat ani jak pohodlný bude fine-tuning.

DGX Spark dává smysl hlavně pro:

  • lokální inference open-weight LLM,
  • vývoj a testování AI agentů,
  • práci s většími kontextovými okny,
  • prototypování před nasazením v cloudu nebo datacentru,
  • menší fine-tuning a specializaci předtrénovaných modelů,
  • vývoj edge AI aplikací, robotiky a computer vision workflow.

Pro běžné domácí hraní s menšími modely může být zbytečně drahý a specializovaný. Je zajímavý hlavně tam, kde nestačí běžná desktopová GPU s 24–48 GB VRAM, ale zároveň není cílem stavět plnohodnotný datacentrový server.

Hodnota 1 PFLOP je uváděná pro FP4 a podle poznámky NVIDIA jde o teoretický výkon při použití sparsity. Pro praktický výkon u LLM inference bude důležitá kombinace runtime, přesnosti modelu, paměťové propustnosti, délky kontextu a batchingu.

Podobně údaj o modelech do 200B parametrů neznamená, že všechny modely této velikosti poběží stejně dobře. Záleží na kvantizaci, architektuře modelu a tom, zda je konkrétní runtime pro DGX Spark dobře optimalizovaný.

Alza má produkt vedený jako NVIDIA DGX Spark 4TB. Ve veřejně dostupném popisu uvádí 128 GB RAM, 4TB SSD, NVIDIA GB10 Grace Blackwell, NVIDIA DGX OS a zaměření na lokální zpracování AI modelů. Cena a skladová dostupnost se mohou měnit, proto je potřeba je ověřit přímo na stránce produktu.

  • ai/hardware/nvidia-dgx-spark.1777610204.txt.gz
  • Poslední úprava: 01.05.2026 06:36
  • autor: Petr Nosek