Czym jest ComfyUI?
ComfyUI to wizualny edytor workflow do generowania grafiki AI. Zamiast wpisywać komendy, łączysz „node'y" (węzły) na płótnie — jak w edytorze dźwięku czy Blenderze. Każdy node robi jedną rzecz: ładuje model, koduje prompt, próbkuje obraz, zapisuje plik. Łączysz je przewodami i klikasz „Queue Prompt" — resztę robi GPU. To alternatywa dla Automatic1111, ale bardziej elastyczna i szybsza.
Wielu początkujących odbija się od ComfyUI przez "spaghetti" połączeń i problemy z menedżerem pakietów. Wbudowany przycisk "Download missing models" często zawodzi przy plikach ważących 30-70 GB — nie obsługuje wznawiania połączeń i autoryzacji HuggingFace. Efekt? Uszkodzone pliki i błędy header too small.
Zrobimy to metodą "Clean install & Manual wget". To jedyna droga, która daje 100% pewności, że Twoje środowisko będzie stabilne. Zakładam, że masz już Linuxa ze sterownikami CUDA.
① Instalacja Core ComfyUI
Zacznijmy od postawienia fundamentów. Sklonujemy repozytorium, utworzymy izolowane środowisko wirtualne (venv), aby nie zaśmiecać systemu, i zainstalujemy PyTorch z obsługą najnowszych kart graficznych.
② Instalacja Modeli (Metoda Templates)
Tutaj stosujemy specyficzny workflow, który eliminuje błędy. Nie zgadujemy, jakich plików brakuje – ComfyUI powie nam to samo.
Zasada działania — krok po kroku
wget w terminalu.
Dlaczego tak? Bo wbudowany downloader psuje duże pliki (30-70 GB). Terminal z wget daje pełną kontrolę — wznawianie, weryfikacja, prędkość.
1️⃣ Qwen Image 2512 (Generowanie)
Wybierz szablon Qwen Image 2512. Zobaczysz braki w sekcjach VAE, Text Encoder i Diffusion Model. Pobierz je do odpowiednich katalogów:
2️⃣ Qwen Image Edit 2511 (Edycja)
W Templates wybierz Qwen Image Edit 2511. Ten model służy do "inpaintingu" — naprawiania lub zmieniania wybranych fragmentów obrazu. Zaznaczasz maskę (obszar do zmiany), wpisujesz prompt opisujący co ma się tam pojawić, i model generuje spójną edycję. Wymaga innego modelu dyfuzji:
3️⃣ Hunyuan 3D 2.1 (Generowanie 3D)
W Templates szukaj Hunyuan 3D 2.1. To narzędzie od Tencent do generowania pełnych siatek 3D (mesh) z pojedynczego zdjęcia lub opisu tekstowego. Wrzucasz zdjęcie obiektu — dostajesz model 3D gotowy do użycia w grach, wizualizacjach czy druku 3D. Plik jest ogromny, więc wget jest tu obowiązkowy.
③ Finalizacja
Po zakończeniu pobierania zrestartuj ComfyUI w terminalu (CTRL+C, potem ponowne uruchomienie). Teraz po wejściu w Templates i wybraniu workflow, wszystkie „czerwone ramki" powinny zniknąć, a system będzie gotowy do generowania.
Troubleshooting — częste problemy
wget. Dodaj flagę -c aby włączyć wznawianie.
fp8 (8-bit) zamiast bf16 (16-bit) — ważą 2× mniej.