- ComfyUI дозволяє створювати гнучкі та відтворювані візуальні потоки для стабільної дифузії.
- Опануйте перетворення тексту на зображення, i2i, SDXL, вбудовування/вилучення малюнків, масштабування та ControlNet з ключовими вузлами.
- Покращуйте за допомогою вбудовування, LoRA та користувацьких вузлів; використовуйте Менеджер для керування ними.
- Оптимізуйте продуктивність і стабільність за допомогою найкращих практик, скорочень і способів усунення несправностей.
¿Найкращий посібник з ComfyUI для початківців? Якщо ви робите перші кроки з ComfyUI і вас перевантажує вся ця кількість вузлів, коробок та кабелів, не хвилюйтеся: тут ви знайдете справжній посібник, який починається з нуля та не пропускає нічого важливого. Мета полягає в тому, щоб ви зрозуміли, для чого призначена кожна частина, як вони поєднуються між собою та як вирішувати поширені помилки. які розчаровують, коли ви намагаєтеся навчитися, просто експериментуючи.
Окрім охоплення класичних робочих процесів перетворення тексту на зображення, перетворення зображення на зображення, вбудовування, перефарбовування, SDXL, масштабування, ControlNet, вбудовування та LoRA, ми також інтегруємо встановлення, налаштування, керування вузлами за допомогою адміністратораЯрлики та практичний розділ із реальними рекомендаціями щодо продуктивності процесора та графічного процесора. І так, ми також розглянемо... Як працювати з відео за допомогою моделей типу Wan 2.1 (текст у відео, зображення у відео та відео у відео) в екосистемі ComfyUI.
Що таке ComfyUI і як він порівнюється з іншими графічними інтерфейсами?
ComfyUI — це візуальний інтерфейс на основі вузлів, побудований на Стабільна дифузія що дозволяє налаштовувати робочі процеси шляхом з'єднання функціональних блоків. Кожен вузол виконує певне завдання (завантаження моделі, кодування тексту, вибірка, декодування) а краї з'єднують його входи та виходи, ніби ви складаєте візуальний рецепт.
Порівняно з AUTOMATIC1111, ComfyUI вирізняється тим, що Легкий, гнучкий, прозорий та дуже простий у використанні (Кожен файл робочого процесу можна відтворити). Недоліком є те, що інтерфейс може відрізнятися залежно від автора робочого процесу, а для звичайних користувачів... Вдавання в такі деталі може здатися надмірним..
Крива навчання згладжується, коли ви розумієте «чому» стоїть за вузлами. Уявіть собі ComfyUI як панель інструментів, де ви бачите повний шлях до зображення: від початкового тексту та шуму в латентній формі, до остаточного декодування в пікселі.
Встановлення з нуля: швидко та без проблем
Найпростіший спосіб — завантажити офіційний пакет для вашої системи, розпакувати його та запустити. Вам не потрібно окремо встановлювати Python, оскільки він вбудований., що значно зменшує початкове тертя.
Основні кроки: Завантажте стиснутий файл, розпакуйте його (наприклад, за допомогою 7-Zip) та запустіть відповідний вам лаунчер. Якщо у вас немає графічного процесора або ваша відеокарта несумісна, скористайтеся виконуваним файлом CPU.Це займе більше часу, але спрацює.
Щоб усе розпочати, помістіть хоча б одну модель у папку контрольних точок. Ви можете отримати їх з репозиторіїв, таких як Hugging Face або Civitai та розмістіть їх у шляху моделі ComfyUI.
Якщо у вас вже є бібліотека моделей в інших папках, відредагуйте файл додаткових шляхів (extra_model_paths.yaml), видаливши «example» з назви та додавши свої розташування. Перезапустіть ComfyUI, щоб він виявив нові каталоги.
Основні елементи керування та інтерфейсу
На полотні масштабування керується коліщатком миші або жестом щипкування, а прокручування здійснюється перетягуванням лівою кнопкою миші. Щоб з’єднати вузли, перетягніть вказівник від вихідного роз’єму до вхідного роз’єму., і відпустіть, щоб створити край.
ComfyUI керує чергою виконання: налаштуйте свій робочий процес і натисніть кнопку черги. Ви можете перевірити стан у черзі, щоб побачити, що виконується. або чого він/вона очікує.
Корисні комбінації клавіш: Ctrl+C/Ctrl+V для копіювання/вставки вузлів, Ctrl+Shift+V для вставки зі збереженням записів, Ctrl+Enter для постановки в чергу, Ctrl+M для вимкнення звуку вузла. Клацніть крапку у верхньому лівому куті, щоб згорнути вузол та очистити полотно.
Від тексту до зображення: основний потік
Мінімальний потік включає завантаження контрольної точки, кодування позитивного та негативного запитів за допомогою CLIP, створення порожнього латентного зображення, семплерування за допомогою KSampler та декодування в пікселі за допомогою VAE. Натисніть кнопку черги, і ви отримаєте своє перше зображення.
Виберіть модель у контрольній точці завантаження
Вузол Load Checkpoint повертає три компоненти: MODEL (прогнозер шуму), CLIP (кодувальник тексту) та VAE (кодувальник/декодер зображень). MODEL передається до KSampler, CLIP до текстових вузлів, а VAE до декодера..
Позитивні та негативні підказки з CLIP Text Encode
Введіть позитивний варіант вище та негативний нижче; обидва варіанти закодовані як вбудовування. Ви можете зважувати слова за допомогою синтаксису (слово:1.2) або (слово:0.8) підсилити або пом'якшити певні терміни.
Приховані порожнечі та оптимальні розміри
Порожнє приховане зображення визначає полотно у прихованому просторі. Для SD 1.5 рекомендується 512×512 або 768×768; для SDXL — 1024×1024.Ширина та висота мають бути кратними 8, щоб уникнути помилок та врахувати архітектуру.
VAE: від латентного до піксельного
VAE стискає зображення до прихованих значень та реконструює їх у пікселі. Під час перетворення тексту на зображення він зазвичай використовується лише в кінці для декодування прихованого значення. Стиснення прискорює процес, але може призвести до невеликих втратНатомість, це пропонує точний контроль у латентному просторі.
KSampler та ключові параметри
KSampler застосовує зворотну дифузію для видалення шуму відповідно до посібника з вбудовування. Насіння, кроки, семплер, планувальник та шумозаглушення Це основні циферблати. Більша кількість кроків зазвичай забезпечує більше деталей, а denoise=1 повністю перезаписує початковий шум.
Зображення за зображенням: повторити з посібником
Потік i2i починається з вхідного зображення та ваших підказок; шумозаглушення контролює, наскільки воно відхиляється від оригіналу. З низьким рівнем шумозаглушення ви отримуєте ледь помітні варіації; з високим – глибокі трансформації..
Типова послідовність: вибір контрольної точки, завантаження зображення як вхідних даних, налаштування підказок, визначення шумозаглушення в KSampler та постановка в чергу. Це ідеально підходить для покращення композицій або міграції стилів, не починаючи з нуля..
SDXL на ComfyUI
ComfyUI пропонує ранню підтримку SDXL завдяки модульній конструкції. Просто скористайтеся SDXL-сумісним потоком, перевірте підказки та запустіть його. Пам’ятайте: більші нативні розміри вимагають більше відеопам’яті та часу обробки.Але якісний стрибок у деталях компенсує це.
Інпайнтинг: редагуйте лише те, що вас цікавить
Якщо ви хочете змінити певні області зображення, вам знадобиться інструмент «інпайнтинг». Завантажте зображення, відкрийте редактор масок, намалюйте те, що ви хочете відновити, і збережіть це у відповідному вузлі. Визначте підказку для керування редагуванням та налаштуйте шумозаглушення (наприклад, 0.6).
Якщо ви використовуєте стандартну модель, вона працює з VAE Encode та Set Noise Latent Mask. Для спеціалізованих моделей інпайнтингу замініть ці вузли на VAE Encode (Inpaint), який оптимізований для цього завдання.
Перефарбування: збільшення країв полотна
Щоб розширити зображення за його межі, додайте вузол padding для outpainting та налаштуйте, наскільки зростає кожна сторона. Параметр розтушовування згладжує перехід між оригінальним зображенням та розширенням.
У процесах перефарбовування налаштуйте VAE Encode (для перефарбовування) та параметр grow_mask_by. Значення вище 10 зазвичай пропонує більш природну інтеграцію. на розширеній території.
Підвищення якості в ComfyUI: піксельний проти латентного
Існує два способи: піксельне масштабування (швидке, без додавання нової інформації) та латентне масштабування, яке також називають Hi-res Latent Fix, що переосмислює деталі під час масштабування. Перший швидкий; другий збагачує текстури, але може відхилятися.
Алгоритмне масштабування (піксель)
За допомогою методу масштабування вузла ви можете вибрати бікубічний, білінійний або найближчий точний метод, а також коефіцієнт масштабування. Це ідеально підходить для попереднього перегляду або коли вам потрібна швидкість. без додавання вартості висновку.
Збільшення масштабу за допомогою моделі (пікселя)
Використайте Load Upscale Model та відповідний вузол підвищення масштабу, виберіть відповідну модель (наприклад, реалістичну або аніме) та виберіть ×2 або ×4. Спеціалізовані моделі відновлюють контури та різкість краще, ніж класичні алгоритми.
Високий рівень у латентному
Масштабуйте латентну область та перевиконайте семплер за допомогою KSampler, щоб додати деталі, що відповідають запиту. Це повільніше, але особливо корисно, коли потрібно отримати роздільну здатність та візуальну складність..
ControlNet: Розширений посібник з проектування конструкцій
ControlNet дозволяє вставляти карти опорних точок (краї, поза, глибина, сегментація) для керування композицією. У поєднанні зі стабільною дифузією це дає вам точний контроль над структурою без шкоди для креативності моделі.
У ComfyUI інтеграція є модульною: ви завантажуєте потрібну карту, підключаєте її до блоку ControlNet та пов'язуєте її з семплером. Спробуйте різні контролери, щоб побачити, який з них відповідає вашому стилю та меті..
Адміністратор ComfyUI: Безтермінальні користувацькі вузли
Менеджер дозволяє встановлювати та оновлювати користувацькі вузли з інтерфейсу. Ви знайдете його в меню черг. Це найпростіший спосіб підтримувати вашу екосистему вузлів в актуальному стані.
Встановлення відсутніх вузлів
Якщо робочий процес сповіщає вас про відсутні вузли, відкрийте Диспетчер, натисніть «Встановити відсутні», перезапустіть ComfyUI та оновіть браузер. Це вирішує більшість залежностей за кілька кліків..
Оновлення користувацьких вузлів
У Менеджері перевірте наявність оновлень, встановіть їх і натисніть кнопку оновлення для кожного доступного пакета. Перезапустіть ComfyUI, щоб застосувати зміни. та уникати невідповідностей.
Завантаження вузлів у потік
Двічі клацніть на порожній області, щоб відкрити пошук вузлів, і введіть назву потрібного вам вузла. Ось як швидко вставляти нові елементи у свої діаграми.
Вбудовування (інверсія тексту)
Вбудовування впроваджують навчені концепції або стилі у ваші підказки за допомогою ключового слова embedding:name. Помістіть файли в папку models/embeddings, щоб ComfyUI міг їх виявити..
Якщо ви встановите пакет користувацьких скриптів, у вас буде автозаповнення: почніть вводити "embedding:", і ви побачите список доступних. Це значно пришвидшує ітерацію під час керування багатьма шаблонами..
Ви також можете додати їм зважування, наприклад (embedding:Name:1.2), щоб підсилити їх на 20%. Відрегулюйте вагу, як і для звичайних термінів запиту збалансувати стиль і зміст.
LoRA: адаптує стиль, не торкаючись VAE
LoRA змінює компоненти MODEL та CLIP контрольної точки, не змінюючи VAE. Вони використовуються для введення певних стилів, символів або об'єктів з легкими та зручними для обміну файлами.
Базовий процес: Виберіть базову контрольну точку, додайте одну або декілька LoRA та згенеруйте їх. Ви можете поєднувати LoRA, щоб поєднати естетику та ефекти.коригуючи їх інтенсивність, якщо робочий процес це дозволяє.
Скорочення, хитрощі та вбудовані робочі процеси
Окрім згаданих скорочень, є дві дуже практичні поради: виправляйте початкове значення під час налаштування віддалених вузлів, щоб уникнути переобчислення всього ланцюжка, та використовуйте групи для переміщення кількох вузлів одночасно. За допомогою Ctrl+перетягування можна вибрати кілька елементів, а за допомогою Shift перемістити групу..
Ще одна ключова особливість: ComfyUI зберігає робочий процес у метаданих згенерованого ним PNG. Перетягування PNG-файлу на полотно видає всю діаграму одним клацанням миші.Це спрощує обмін та відтворення результатів.
ComfyUI онлайн: створюйте без встановлення

Якщо ви не хочете нічого встановлювати, є хмарні сервіси з попередньо налаштованим ComfyUI, сотні вузлів та популярні моделі. Вони ідеально підходять для тестування SDXL, ControlNet або складних робочих процесів без використання ПК., а багато з них містять галереї готових робочих процесів.
З нуля до відео: Wan 2.1 на ComfyUI
Деякі користувацькі вузли дозволяють створювати відео з тексту, перетворювати зображення на послідовність або редагувати існуючий кліп. За допомогою моделей типу Wan 2.1 ви можете налаштувати конвеєри перетворення тексту у відео, зображення у відео та відео у відео. безпосередньо в ComfyUI.
Встановіть необхідні вузли (через адміністратора або вручну), завантажте відповідну модель та дотримуйтесь інструкцій на прикладі: закодуйте параметри запиту та руху, згенеруйте покадрові затримки, а потім декодуйте їх у кадри або відеоконтейнер. Пам'ятайте, що вартість часу та відеопам'яті зростає з роздільною здатністю та тривалістю.
CPU проти GPU: якої продуктивності очікувати
Його можна згенерувати за допомогою центрального процесора, але він не ідеальний з точки зору швидкості. У реальних тестах потужний центральний процесор може займати кілька хвилин на одне зображення, тоді як з відповідним графічним процесором процес скорочується до секунд. Якщо у вас є сумісний графічний процесор, використовуйте його для значного пришвидшення продуктивності..
На процесорі зменште розмір, кількість кроків та складність вузлів; на графічному процесорі налаштуйте пакетну обробки та роздільну здатність відповідно до вашої відеопам'яті. Контролюйте споживання, щоб уникнути вузьких місць та неочікуваних закриттів.
Користувацькі вузли: ручне встановлення та рекомендації
Якщо ви віддаєте перевагу класичному методу, ви можете клонувати репозиторії в папці custom_nodes за допомогою git, а потім перезавантажити. Цей метод надає вам точний контроль над версіями та гілками.корисно, коли вам потрібні певні функції.
Підтримуйте порядок у своїх вузлах, регулярно оновлюючи їх та надаючи примітки щодо сумісності. Уникайте змішування занадто великої кількості експериментальних версій одночасно. щоб уникнути внесення помилок, які важко відстежити.
Типове усунення несправностей
Якщо «встановлення відсутніх вузлів» не врятувало становище, перевірте консоль/журнал на наявність точної помилки: залежностей, шляхів або версій. Перевірте, чи ширина та висота кратні 8, і чи шаблони знаходяться у правильних папках..
Коли робочий процес не реагує на вибір моделі, примусове завантаження дійсної контрольної точки зазвичай відновлює графік. Якщо вузол ламається після оновлення, спробуйте вимкнути цей пакет або повернутися до стабільної версії..
Фіксовані початкові значення, скориговані розміри та розумні підказки спрощують налагодження. Якщо результат погіршується після надмірних втручань, поверніться до базового пресету та вносьте зміни по одній за раз..
Для отримання додаткової допомоги зверніться до таких спільнот, як /r/StableDiffusion, які дуже активні та часто виправляють рідкісні помилки. Спільний доступ до журналу, записів графів та версій вузлів пришвидшує підтримку.
Все вищезазначене дає вам повну карту: ви знаєте, що являє собою кожен вузол, як вони з'єднуються, де розміщувати моделі та до чого торкатися, щоб черга рухалася плавно. Завдяки робочим процесам перетворення тексту на зображення, i2i, SDXL, вбудовуванню/вилученню малюнків, масштабуванню, ControlNet, вбудовуванню та LoRA, а також відео з WAN 2.1, у вас є дуже серйозний виробничий набір. Готові розвиватися разом з вами. Для отримання додаткової інформації див. Офіційний веб-сайт ComfyUI.
Захоплювався технікою з дитинства. Я люблю бути в курсі подій у секторі та, перш за все, повідомляти про це. Ось чому я вже багато років присвячую комунікації на веб-сайтах технологій і відеоігор. Ви можете знайти, як я пишу про Android, Windows, MacOS, iOS, Nintendo або будь-яку іншу пов’язану тему, яка спадає вам на думку.

