Пълното ръководство за ComfyUI за начинаещи

ComfyUI ви позволява да изграждате гъвкави и възпроизводими визуални потоци за стабилна дифузия.
Овладейте преобразуването на текст в изображение, i2i, SDXL, добавяне/извличане на изображение, мащабиране и ControlNet с ключови възли.
Подобрете с вграждания, LoRA и персонализирани възли; използвайте Мениджъра, за да ги управлявате.
Оптимизирайте производителността и стабилността с най-добри практики, преки пътища и отстраняване на неизправности.

¿Най-доброто ръководство за ComfyUI за начинаещи? Ако правите първите си стъпки с ComfyUI и сте объркани от всички възли, кутии и кабели, не се притеснявайте: тук ще намерите истинско ръководство, което започва от нулата и не пропуска нищо важно. Целта е да разберете какво прави всяка част, как се съчетават и как да отстранявате често срещани грешки. които са разочароващи, когато се опитвате да учите само чрез експериментиране.

В допълнение към класическите работни процеси за преобразуване на текст в изображение, преобразуване на изображение в изображение, вграждане, преобразуване, SDXL, мащабиране, ControlNet, вграждане и LoRA, ще интегрираме и инсталиране, конфигуриране, управление на персонализирани възли с администратораПреки пътища и практичен раздел с реални препоръки за производителност на процесора и графичния процесор. И да, ще разгледаме и... Как да работите с видео, използвайки модели от тип Wan 2.1 (текст във видео, изображение във видео и видео във видео) в рамките на екосистемата ComfyUI.

Какво е ComfyUI и как се сравнява с други графични потребителски интерфейси?

ComfyUI е визуален интерфейс, базиран на възли, изграден върху Стабилна дифузия което ви позволява да настройвате работни процеси чрез свързване на функционални блокове. Всеки възел изпълнява специфична задача (зареждане на модел, кодиране на текст, семплиране, декодиране) а ръбовете свързват входовете и изходите му, сякаш сглобявате визуална рецепта.

В сравнение с AUTOMATIC1111, ComfyUI се откроява с това, че е Лек, гъвкав, прозрачен и много лесен за споделяне (Всеки файл на работния процес е възпроизводим). Недостатъкът е, че интерфейсът може да варира в зависимост от автора на работния процес, а за обикновените потребители, Навлизането в толкова много подробности може да ви се стори прекомерно..

Кривата на обучение се изглажда, когато разбирате „защо“-то зад възлите. Мислете за ComfyUI като за табло, където виждате пълния път на изображениетоот първоначалния текст и шума в латентна форма, до окончателното декодиране до пиксели.

Инсталация от нулата: бърза и безпроблемна

Най-прекият начин е да изтеглите официалния пакет за вашата система, да го разархивирате и да го стартирате. Не е необходимо да инсталирате Python отделно, защото той е вграден., което значително намалява първоначалното триене.

Основни стъпки: Изтеглете компресирания файл, разархивирайте го (например със 7-Zip) и стартирайте подходящия за вас стартер. Ако нямате графичен процесор или вашата графична карта не е съвместима, използвайте изпълнимия файл на CPU.Ще отнеме повече време, но работи.

За да започнете всичко, поставете поне един модел в папката с контролни точки. Можете да ги получите от хранилища като Hugging Face или Civitai и ги поставете в пътя на модела ComfyUI.

Ако вече имате библиотека с модели в други папки, редактирайте файла с допълнителни пътища (extra_model_paths.yaml), като премахнете „example“ от името и добавите вашите местоположения. Рестартирайте ComfyUI, така че да открие новите директории.

Основни контроли и елементи на интерфейса

Върху платното мащабирането се управлява с колелцето на мишката или с жеста за щипване и превъртане чрез плъзгане с левия бутон. За да свържете възли, плъзнете от изходния конектор към входния конектор.и го отпуснете, за да създадете ръба.

ComfyUI управлява опашка за изпълнение: конфигурирайте работния си процес и натиснете бутона за опашка. Можете да проверите състоянието от изгледа на опашката, за да видите какво се изпълнява. или какво той/тя очаква.

Изключително съдържание - Щракнете тук Всички начини за изключване на Windows 11 без отваряне на менюто "Старт"

Полезни клавишни комбинации: Ctrl+C/Ctrl+V за копиране/поставяне на възли, Ctrl+Shift+V за поставяне със запазване на записите, Ctrl+Enter за поставяне в опашката, Ctrl+M за заглушаване на възел. Щракнете върху точката в горния ляв ъгъл, за да минимизирате възел и да изчистите платното.

От текст към изображение: основният поток

Минималният поток включва зареждане на контролната точка, кодиране на положителния и отрицателния сигнал с CLIP, създаване на празно латентно изображение, семплиране с KSampler и декодиране в пиксели с VAE. Натиснете бутона за опашка и ще получите първото си изображение.

Изберете модела в контролната точка за зареждане

Възелът Load Checkpoint връща три компонента: MODEL (предсказващ шум), CLIP (енкодер на текст) и VAE (енкодер/декодер на изображения). MODEL отива към KSampler, CLIP към текстовите възли, а VAE към декодера..

Положителни и отрицателни подкани с CLIP Text Encode

Въведете положителния си подкаст по-горе и отрицателния си подкаст по-долу; и двата са кодирани като вграждания. Можете да претеглите думите със синтаксиса (дума:1.2) или (дума:0.8) за подсилване или смекчаване на определени термини.

Скрити кухини и оптимални размери

Празното латентно изображение определя платното в латентното пространство. За SD 1.5 се препоръчва 512×512 или 768×768; за SDXL, 1024×1024.Ширината и височината трябва да са кратни на 8, за да се избегнат грешки и да се спази архитектурата.

VAE: от латентни до пиксели

VAE компресира изображенията до латентни стойности и ги реконструира в пиксели. При преобразуване от текст в изображение, обикновено се използва само в края, за да декодира латентната стойност. Компресията ускорява процеса, но може да доведе до малки загубиВ замяна, той предлага фин контрол в латентното пространство.

KSampler и ключови параметри

KSampler прилага обратна дифузия, за да премахне шума, съгласно ръководството за вграждане. Семе, стъпки, семплер, планировчик и шумопотискане Това са основните циферблати. Повече стъпки обикновено осигуряват повече детайли, а denoise=1 напълно пренаписва първоначалния шум.

Изображение по изображение: преработка с ръководство

Процесът i2i започва с входно изображение плюс вашите подкани; функцията за премахване на шума контролира колко се отклонява изображението от оригинала. С ниско ниво на шумопотискане получавате фини вариации; с високо - дълбоки трансформации..

Типична последователност: изберете контролната точка, заредете изображението си като вход, настройте подканите, дефинирайте премахването на шум в KSampler и поставете на опашка. Идеален е за подобряване на композиции или мигриране на стилове, без да се започва от нулата..

SDXL на ComfyUI

ComfyUI предлага ранна поддръжка за SDXL благодарение на модулния си дизайн. Просто използвайте SDXL-съвместим поток, проверете подканите и го стартирайте. Запомнете: по-големите размери изискват повече VRAM и време за обработка.Но качественият скок в детайлите компенсира това.

Инпайнтинг: редактирайте само това, което ви интересува

Когато искате да промените определени области на изображение, инпайнтингът е инструментът, който трябва да използвате. Заредете изображението, отворете редактора на маски, нарисувайте това, което искате да регенерирате, и го запазете в съответния възел. Дефинирайте подканата, която да насочва редактирането и да коригира шумопотискането (например 0.6).

Ако използвате стандартен модел, той работи с VAE Encode и Set Noise Latent Mask. За специализирани модели за инпайнтинг, заменете тези възли с VAE Encode (Inpaint), който е оптимизиран за тази задача.

Пребоядисване: уголемяване на краищата на платното

За да разширите изображение извън неговите граници, добавете възела за допълване за преоформяне и конфигурирайте с колко се увеличава всяка страна. Параметърът „перо“ изглажда прехода между оригинала и разширението..

В потоците за пребоядисване, коригирайте VAE Encode (за пребоядисване) и параметъра grow_mask_by. Стойност по-висока от 10 обикновено предлага по-естествени интеграции. в разширената зона.

Изключително съдържание - Щракнете тук Spotify се интегрира с ChatGPT: ето как работи и какво можете да направите

Повишаване на мащаба в ComfyUI: пиксели срещу латентни

Има два начина: мащабиране на пиксели (бързо, без добавяне на нова информация) и латентно мащабиране, наричано още Hi-res Latent Fix, което преинтерпретира детайлите при мащабиране. Първият е бърз; вторият обогатява текстурите, но може да се отклонява.

Алгоритъмно базирано мащабиране (пиксел)

С метода на мащабиране на възела можете да изберете бикубичен, билинеен или най-близък до точен метод, както и коефициента на мащабиране. Идеален е за предварителен преглед или когато имате нужда от скорост. без добавяне на разходи за извод.

Мащабиране с модел (пиксел)

Използвайте Load Upscale Model и съответния възел за увеличаване на мащаба, изберете подходящ модел (напр. реалистичен или аниме) и изберете ×2 или ×4. Специализираните модели възстановяват контурите и остротата по-добре от класическите алгоритми.

Повишаване на мащаба в латентно състояние

Мащабирайте латентния сигнал и го преобразувайте с KSampler, за да добавите детайли, съответстващи на подканата. По-бавно е, но е особено полезно, когато искате да постигнете по-добра резолюция и визуална сложност..

ControlNet: Разширено ръководство за структурни решения

ControlNet ви позволява да инжектирате референтни карти (ръбове, поза, дълбочина, сегментация), за да насочвате композицията. В комбинация със Stable Diffusion, това ви дава фин контрол върху структурата. без да се жертва креативността на модела.

В ComfyUI интеграцията е модулна: зареждате желаната карта, свързвате я с блока ControlNet и я свързвате със семплера. Опитайте различни контролери, за да видите кой отговаря на вашия стил и цел..

ComfyUI Administrator: Безтерминални персонализирани възли

Мениджърът ви позволява да инсталирате и актуализирате персонализирани възли от интерфейса. Ще го намерите в менюто за опашки. Това е най-лесният начин да поддържате екосистемата си от възли актуална.

Инсталирайте липсващите възли

Ако даден работен процес ви предупреди за липсващи възли, отворете Мениджъра, щракнете върху „Инсталиране на липсващи“, рестартирайте ComfyUI и актуализирайте браузъра си. Това разрешава повечето зависимости с няколко кликвания..

Актуализиране на персонализирани възли

От Мениджъра проверете за актуализации, инсталирайте ги и щракнете върху бутона за актуализиране на всеки наличен пакет. Рестартирайте ComfyUI, за да приложите промените. и избягвайте несъответствия.

Зареждане на възли в потока

Щракнете двукратно върху празно място, за да отворите търсачката на възли и въведете името на този, от който се нуждаете. Ето как бързо да вмъквате нови елементи в диаграмите си.

Вграждания (инверсия на текста)

Вгражданията инжектират обучени концепции или стилове във вашите подкани, използвайки ключовата дума embedding:name. Поставете файловете в папката models/embeddings, за да може ComfyUI да ги открие..

Ако инсталирате пакета с персонализирани скриптове, ще имате автоматично довършване: започнете да пишете „embedding:“ и ще видите списъка с наличните. Това значително ускорява итерацията при управление на много шаблони..

Можете също така да им придадете тежест, например (embedding:Name:1.2), за да ги подсилите с 20%. Настройте теглото, както бихте направили с нормалните условия за бърз отговор да се балансира стилът и съдържанието.

LoRA: адаптира стила, без да докосва VAE

LoRA модифицира компонентите MODEL и CLIP на контролната точка, без да променя VAE. Те се използват за инжектиране на специфични стилове, символи или обекти с леки и лесни за споделяне файлове.

Основен поток: Изберете вашата базова контролна точка, добавете една или повече LoRA и генерирайте. Можете да комбинирате LoRA, за да комбинирате естетика и ефекти.коригиране на интензитета им, ако работният процес го позволява.

Преки пътища, трикове и вградени работни процеси

В допълнение към споменатите преки пътища, има два много практични съвета: коригирайте началното число (seed) при настройване на отдалечени възли, за да избегнете преизчисляване на цялата верига, и използвайте групи, за да преместите няколко възли едновременно. С Ctrl+плъзгане можете да изберете няколко елемента, а с Shift да преместите групата..

Изключително съдържание - Щракнете тук Какво е audiodg.exe? Рискове и как да се намали латентността и консумацията на енергия

Друга ключова характеристика: ComfyUI запазва работния процес в метаданните на генерирания от него PNG файл. Плъзгането на PNG файла върху платното извлича цялата диаграма с едно щракване.Това улеснява споделянето и възпроизвеждането на резултатите.

ComfyUI онлайн: създавайте без инсталиране

Комфюй

Ако не искате да инсталирате нищо, има облачни услуги с предварително конфигуриран ComfyUI, стотици възли и популярни модели. Те са идеални за тестване на SDXL, ControlNet или сложни работни процеси, без да докосвате компютъра си., а много от тях включват галерии с готови работни потоци.

От нулата до видео: Wan 2.1 на ComfyUI

Някои персонализирани възли ви позволяват да създавате видео от текст, да трансформирате изображение в поредица или да редактирате съществуващ клип. С модели от тип Wan 2.1 можете да настроите конвейери за текст-към-видео, изображение-към-видео и видео-към-видео. директно в ComfyUI.

Инсталирайте необходимите възли (чрез администратор или ръчно), изтеглете съответния модел и следвайте примерния поток: кодирайте параметрите на подканата и движението, генерирайте латентности кадър по кадър и след това декодирайте в кадри или видео контейнер. Не забравяйте, че цената на времето и VRAM се увеличава с резолюцията и продължителността..

CPU срещу GPU: Каква производителност да очаквате

Може да се генерира с помощта на процесор, но не е идеален по отношение на скоростта. В реални тестове, мощен процесор може да отнеме няколко минути на изображение, докато с подходящ графичен процесор процесът намалява до секунди. Ако имате съвместим графичен процесор, използвайте го, за да ускорите драстично производителността..

На процесора намалете размера, стъпките и сложността на възлите; на графичния процесор настройте пакета и резолюцията според вашата видео памет. Следете потреблението, за да избегнете задръствания и неочаквани затваряния.

Персонализирани възли: ръчна инсталация и най-добри практики

Ако предпочитате класическия метод, можете да клонирате хранилища в папката custom_nodes, използвайки git, и след това да рестартирате. Този метод ви дава прецизен контрол върху версиите и клоновете.полезно, когато имате нужда от специфични функции.

Поддържайте възлите си организирани с редовни актуализации и бележки за съвместимост. Избягвайте смесването на твърде много експериментални версии наведнъж. за да се избегне допускането на грешки, които са трудни за проследяване.

Типично отстраняване на неизправности

Ако „инсталиране на липсващи възли“ не е спасило положението, проверете конзолата/лога за точната грешка: зависимости, пътища или версии. Проверете дали ширината и височината са кратни на 8 и дали шаблоните са в правилните папки..

Когато даден работен процес не успее да реагира на избора на модел, принудителното зареждане на валидна контролна точка обикновено възстановява графиката. Ако даден възел се повреди след актуализиране, опитайте да деактивирате този пакет или да се върнете към стабилна версия..

Фиксираните начални стойности, коригираните размери и разумните подкани улесняват отстраняването на грешки. Ако резултатът се влоши след прекалено много промени, върнете се към основна настройка и въвеждайте отново промените една по една..

За допълнителна помощ, общности като /r/StableDiffusion са много активни и често разрешават редки грешки. Споделянето на лог файлове, графични записи и версии на възли ускорява поддръжката.

Всичко горепосочено ви дава пълна карта: знаете какво представлява всеки възел, как се свързват, къде да поставите моделите и какво да докоснете, за да се поддържа плавното движение на опашката. С работни процеси за преобразуване на текст в изображение, i2i, SDXL, добавяне/извличане на изображение, мащабиране, ControlNet, вграждане и LoRA, плюс видео с WAN 2.1, разполагате с много сериозен производствен комплект. Готови сме да растем с вас. За повече информация, моля вижте Официален уебсайт на ComfyUI.

Свързана статия:

Какво означава стабилна дифузия и за какво е предназначена?

Кристиан Гарсия

Страстен към технологиите от малък. Обичам да съм в крак с новостите в сектора и най-вече да го комуникирам. Ето защо вече много години съм посветен на комуникацията в уебсайтове за технологии и видеоигри. Можете да ме намерите да пиша за Android, Windows, MacOS, iOS, Nintendo или всяка друга свързана тема, която ви хрумне.