ComfyUI
Vytvořeno: 26.5.2026 | Aktualizováno: 26.05.2026 21:55
ComfyUI je open-source, uzlové (node-based) grafické uživatelské rozhraní (GUI) a vysoce optimalizovaný backend pro generativní AI modely, primárně pro Stable Diffusion a rodinu modelů Flux. Místo klasických formulářů a záložek se v něm celé workflow (postup) skládá jako orientovaný graf propojením jednotlivých funkčních bloků (uzlů). To dává uživatelům absolutní kontrolu nad každým krokem procesu generování obrazu, videa či zvuku.
Jak funguje ComfyUI ve vztahu k AI?
ComfyUI samo o sobě není AI model – nemá žádný vlastní „mozek“, který by uměl malovat obrázky nebo tvořit video. Funguje jako orchestrátor, runtime a vizuální prostředí.
Zařízení a fungování si lze představit jako dvě názorná přirovnání:
Přirovnání 1: LEGO stavebnice
- AI modely (Stable Diffusion, Flux, ControlNet, Whisper atd.) jsou jako jednotlivé LEGO kostičky. Jsou to soubory s daty (checkpointy, safetensors), které obsahují naučené matematické sítě.
- ComfyUI je spodní podložka a návod. Umožňuje vám tyto různorodé kostičky propojit, posílat mezi nimi data (obrázky, text, matematické vektory) a donutit je pracovat společně.
Přirovnání 2: Ruční dílna (Photoshop) vs. Automatická tovární linka (ComfyUI)
Práce v ComfyUI se principielně podobá Photoshopu (pracujete s maskami, vrstvami, barevnými korekcemi a prolínáním), ale zásadní rozdíl je v tom, jak ta práce probíhá:
- Photoshop je jako ruční dílna. Vezmete nástroj (štětec, gumu), kus dřeva (obrázek) a ručně vyrábíte stůl. Trvá to dlouho, vyžaduje to talent, a pokud chcete na konci změnit spodní vrstvu, musíte celou práci složitě předělávat.
- ComfyUI je jako automatizovaná tovární linka. Vy navrhnete pásy, robotická ramena, detekční senzory (propojíte uzly). Jakmile linku spustíte, sypete na jedné straně suroviny (prompty, fotky) a na druhé straně vám padají hotové výrobky bez lidského doteku. Pokud chcete změnit styl, jen přenastavíte parametr na pásu a linka okamžitě vygeneruje nový produkt.
Hlavní rysy a architektura
Jádro ComfyUI je postavené na robustním a efektivním engine:
- Řízený acyklický graf (DAG): Tok dat je jednosměrný. Engine přesně ví, které uzly na sebe navazují a jaké vstupy vyžadují.
- Chytré kešování a Lazy Evaluation: Pokud změníte pouze jeden parametr (např. opravíte překlep v promptu), ComfyUI nespustí celý proces znovu. Přepočítá pouze uzly, které jsou změnou přímo ovlivněny. Výsledky dřívějších uzlů (jako je načtený model v RAM) zůstávají v paměti, což dramaticky zrychluje iterování.
- Optimalizovaný Memory Management: ComfyUI vyniká v přesouvání (offloadingu) modelů mezi VRAM (grafická karta), systémovou RAM a diskem. Dokáže tak spustit i masivní modely (např. Flux) na hardwaru s omezenou pamětí, kde by jiná rozhraní zkolabovala na chybě Out of Memory (OOM).
Srovnání: ComfyUI vs. AUTOMATIC1111
AUTOMATIC1111 (Stable Diffusion web UI) je tradiční, formulářové rozhraní. Srovnání ukazuje odlišný přístup k práci:
| Vlastnost | AUTOMATIC1111 | ComfyUI |
|---|---|---|
| Styl rozhraní | Webové formuláře, pevně dané záložky a posuvníky | Uzlové grafové rozhraní na nekonečné ploše |
| Učící křivka | Nízká – stačí napsat prompt a kliknout na *Generate* | Strmá – musíte rozumět latentnímu prostoru, VAE a CLIP |
| Využití paměti (VRAM) | Vyšší, náchylnější k OOM chybám | Velmi nízké, skvělá optimalizace offloadu |
| Modularita | Omezená na předpřipravené skripty a doplňky | Téměř neomezená (libovolné větvení a řetězení modelů) |
| Vhodnost pro API | Komplikovanější přes externí JSON endpointy | Nativní podpora, headless režim jako standard |
Ekosystém a rozšiřitelnost
ComfyUI má extrémně aktivní komunitní ekosystém:
- Custom Nodes (Vlastní uzly): Vývojáři mohou psát vlastní uzly v Pythonu a JavaScriptu. Tyto doplňky rozšiřují rozhraní o nové funkce (např. detekce obličeje, zpracování videa, integrace externích služeb).
- ComfyUI Manager: Klíčový doplňkový uzel, který slouží jako instalátor, správce verzí a vyhledávač pro custom nodes a modely. Dokáže také automaticky analyzovat importované workflow a doinstalovat chybějící uzly na jedno kliknutí.
Praktické příklady využití
1. AI Fotoateliér (Konzistentní produktové fotografie)
Chcete vzít fotku reálného produktu a zasadit ji do různých luxusních pozadí, ale produkt musí zůstat 100% nezkreslený a stíny musí sedět.
- Workflow: Nahrajete fotku → AI model (např. Segment Anything) automaticky ořízne produkt → IP-Adapter přenese styl cílového pozadí → KSampler vygeneruje nové pozadí podle stylu a textu, přičemž vynechá maskované místo s produktem → ControlNet zajistí správné osvětlení a dopad stínů.
2. Retušování portrétů (Face Detailer / Hi-Res Upscale)
Generujete postavy v dálce, ale obličeje jsou deformované a rozmazané.
- Workflow: Vygenerujete základní scénu → YOLO detektor obličejů automaticky najde tvář a ořízne ji → Spustí se samostatný detailer (Inpaint s nízkým šumem), který vylepší obličej (opraví oči, texturu kůže) → Výsledek se hladce vloží zpět do původní scény → Celý obraz se prožene přes AI Upscaler (např. SUPIR) na 4K rozlišení.
3. Automatizovaná API pipeline
Chcete integrovat generativní workflow do vlastní webové aplikace (např. nahrání portrétu a jeho převod do kresleného stylu).
- Workflow: Navrhnete a odladíte workflow v GUI → Vyexportujete ho jako API JSON → Spustíte ComfyUI na serveru v headless režimu (`–headless`) → Vaše aplikace posílá fotky uživatelů přes WebSockets přímo do ComfyUI a obratem získává hotové výsledky bez poplatků za cizí API.
Ukládání workflow do PNG metadat
Jednou z nejlepších funkcí ComfyUI je přenositelnost a sdílení:
- Když ComfyUI vygeneruje výsledný obrázek (PNG nebo WebP), vloží do jeho metadat kompletní JSON popis celého grafu.
- Chcete-li toto workflow zopakovat, stačí vygenerovaný obrázek stáhnout a přetáhnout ho myší (drag & drop) do prázdné plochy ComfyUI.
- Rozhraní okamžitě načte schéma grafu, všechny uzly, nastavení i seed.
Výhody a nevýhody
Výhody:
- Maximální možná kontrola nad celým procesem generování.
- Extrémní výkon a paměťová efektivita (šetří VRAM).
- Vynikající reprodukovatelnost a snadné sdílení (přetažením obrázku).
- Připraveno pro integraci, vývojáře a produkční deployment přes API.
Nevýhody:
- Strmá křivka učení (vyžaduje technické pochopení principů difuzních modelů).
- Náchylnost ke vzniku nepřehledných „špagetových“ grafů (node hell).
- Správa kompatibility custom nodes při aktualizacích může být občas náročná.