- ComfyUI ви овозможува да изградите флексибилни и репродуцибилни визуелни текови за стабилна дифузија.
- Совладајте ги технологиите „текст-во-слика“, i2i, SDXL, вдлабнување/надворешно сликање, зголемување на резолуцијата и ControlNet со клучни јазли.
- Подобрете со вградувања, LoRA и прилагодени јазли; користете го Менаџерот за да управувате со нив.
- Оптимизирајте ги перформансите и стабилноста со најдобри практики, кратенки и решавање проблеми.
¿Крајниот ComfyUI водич за почетници? Ако ги правите првите чекори со ComfyUI и сте преоптоварени од сите јазли, кутии и кабли, не грижете се: тука ќе најдете вистински водич, оној што започнува од нула и не прескокнува ништо важно. Целта е да разберете што прави секој дел, како се вклопуваат и како да ги решите вообичаените грешки. кои се фрустрирачки кога се обидувате да учите само преку експериментирање.
Покрај покривањето на класични текст-во-слика, слика-во-слика, вметнување, надворешно боење, SDXL, зголемување на резолуцијата, ControlNet, вградување и LoRA работни процеси, ние исто така ќе интегрираме инсталација, конфигурација, управување со прилагодени јазли со администраторотКратенки и практичен дел со реални препораки за перформанси за процесорот и графичката картичка. И да, ќе опфатиме и... Како да се работи со видео користејќи модели од типот Wan 2.1 (текст во видео, слика во видео и видео во видео) во рамките на екосистемот ComfyUI.
Што е ComfyUI и како се споредува со другите графички кориснички интерфејси?
ComfyUI е визуелен интерфејс базиран на јазли изграден на Стабилна дифузија што ви овозможува да поставите работни процеси со поврзување на функционални блокови. Секој јазол извршува специфична задача (вчитување на модел, кодирање на текст, примерок, декодирање) а рабовите ги поврзуваат неговите влезови и излези, како да составувате визуелен рецепт.
Во споредба со AUTOMATIC1111, ComfyUI се издвојува по тоа што е Лесен, флексибилен, транспарентен и многу лесен за споделување (Секоја датотека на работниот тек може да се репродуцира). Недостаток е што интерфејсот може да варира во зависност од авторот на работниот тек, а за обичните корисници, Навлегувањето во толку многу детали може да изгледа претерано..
Кривата на учење се измазнува кога ќе го разберете „зошто“ зад јазлите. Замислете го ComfyUI како контролна табла каде што ја гледате целосната патека на сликата.: од почетниот текст и шум во латентна форма, до конечното декодирање во пиксели.
Инсталација од нула: брза и без проблеми
Најдиректниот начин е да го преземете официјалниот пакет за вашиот систем, да го отпакувате и да го стартувате. Не треба да го инсталирате Python одделно бидејќи доаѓа вграден., што значително го намалува почетното триење.
Основни чекори: Преземете ја компресираната датотека, распакувајте ја (на пример, со 7-Zip) и стартувајте го стартувачот што ви одговара. Ако немате графичка картичка или вашата графичка картичка не е компатибилна, користете ја извршната датотека на процесорот.Ќе потрае подолго, но функционира.
За да започнете сè, поставете барем еден модел во папката „чекпоини“. Можете да ги добиете од репозиториуми како Hugging Face или Civitai и поставете ги во патеката на моделот ComfyUI.
Ако веќе имате библиотека со модели во други папки, уредете ја датотеката со дополнителни патеки (extra_model_paths.yaml) со отстранување на „example“ од името и додавање на вашите локации. Рестартирајте го ComfyUI за да ги детектира новите директориуми.
Основни контроли и елементи на интерфејсот
На платното, зумирањето се контролира со тркалото на глувчето или со гест на штипнување, а скролувате со влечење со левото копче. За да поврзете јазли, повлечете од излезниот конектор до влезниот конектор.и отпуштете за да го создадете раб.
ComfyUI управува со ред на извршување: конфигурирајте го вашиот работен тек и притиснете го копчето за ред. Можете да го проверите статусот од прегледот на редот за да видите што работи. или што тој/таа очекува.
Корисни кратенки: Ctrl+C/Ctrl+V за копирање/залепување јазли, Ctrl+Shift+V за лепење додека се одржуваат записите, Ctrl+Enter за ставање во ред на чекање, Ctrl+M за исклучување на звук на јазол. Кликнете на точката во горниот лев агол за да минимизирате јазол и да го исчистите платното.
Од текст до слика: основниот тек
Минималниот тек вклучува вчитување на контролната точка, кодирање на позитивниот и негативниот потсетник со CLIP, креирање празна латентна слика, семплирање со KSampler и декодирање на пиксели со VAE. Притиснете го копчето за ред и ќе ја добиете вашата прва слика.
Изберете го моделот во контролната точка за вчитување
Јазолот Load Checkpoint враќа три компоненти: MODEL (предиктор на шум), CLIP (кодер на текст) и VAE (кодер/декодер на слика). MODEL оди до KSampler, CLIP до текстуалните јазли, а VAE до декодерот..
Позитивни и негативни потсетници со CLIP Text Encode
Внесете го вашиот позитивен поттик погоре, а вашиот негативен подолу; и двата се кодирани како вградувања. Можете да им дадете тежина на зборовите со синтаксата (збор:1.2) или (збор:0.8) за да се зајакнат или омекнат специфични термини.
Латентни празнини и оптимални големини
Празна латентна слика го дефинира платното во латентен простор. За SD 1.5, се препорачуваат 512×512 или 768×768; за SDXL, 1024×1024.Ширината и висината мора да бидат множители на 8 за да се избегнат грешки и да се почитува архитектурата.
VAE: од латентно до пиксели
VAE ги компресира сликите во латентни вредности и ги реконструира во пиксели. При конверзија од текст во слика, обично се користи само на крајот за декодирање на латентната вредност. Компресијата го забрзува процесот, но може да предизвика мали загубиЗа возврат, нуди прецизна контрола во латентниот простор.
KSampler и клучни параметри
KSampler применува обратна дифузија за отстранување на шумот според упатството за вградувања. Семе, чекори, семплер, распоредувач и отстранување на шумот Ова се главните бројчаници. Повеќе чекори обично даваат повеќе детали, а denoise=1 целосно го преработува почетниот шум.
Слика по слика: повтори со водич
Протокот i2i започнува со влезна слика плус вашите инструкции; denoise контролира колку отстапува од оригиналот. Со ниска дешумација, добивате суптилни варијации; со висока, длабоки трансформации..
Типична секвенца: изберете ја контролната точка, вчитајте ја вашата слика како влез, прилагодете ги упатствата, дефинирајте намалување на шумот во KSampler и ставете го во ред. Идеален е за подобрување на композиции или мигрирање на стилови без да се почнува од нула..
SDXL на ComfyUI
ComfyUI нуди рана поддршка за SDXL благодарение на неговиот модуларен дизајн. Едноставно користете SDXL-компатибилен проток, проверете ги упатствата и стартувајте го. Запомнете: поголемите природни големини бараат повеќе VRAM и време за обработка.Но, квалитативниот скок во деталите го надоместува тоа.
Inpainting: уредувајте само она што ве интересира
Кога сакате да измените одредени делови од сликата, алатката што треба да ја користите е inpainting. Вчитајте ја сликата, отворете го уредувачот на маски, насликајте го она што сакате да го регенерирате и зачувајте го во соодветниот јазол. Дефинирајте го вашиот потсетник за водење на уредувањето и прилагодување на намалувањето на шумот (на пример, 0.6).
Ако користите стандарден модел, тој работи со VAE Encode и Set Noise Latent Mask. За наменски модели за вметнување во сликарството, заменете ги тие јазли со VAE Encode (Inpaint), кој е оптимизиран за таа задача.
Надворешно сликање: зголемување на рабовите на платното
За да проширите слика надвор од нејзините граници, додадете го јазолот за дополнување за пребојување и конфигурирајте колку ќе расте секоја страна. Параметарот за пердувување го измазнува преминот помеѓу оригиналот и проширувањето.
Во тековите на надворешно боење, прилагодете го VAE Encode (за внатрешно боење) и параметарот grow_mask_by. Вредност поголема од 10 обично нуди поприродни интеграции. во проширената област.
Зголемување на резолуцијата во ComfyUI: пиксел наспроти латентен
Постојат два начина: зголемување на резолуцијата на пикселите (брзо, без додавање нови информации) и латентно зголемување на резолуцијата, исто така наречено Hi-res Latent Fix, кое ги реинтерпретира деталите при скалирање. Првиот е брз; вториот ги збогатува текстурите, но може да отстапува.
Зголемување на резолуцијата базирано на алгоритам (пиксел)
Со методот на повторно скалирање на јазолот по метод можете да изберете бикубичен, билинеарен или најблизок-точен и фактор на скалирање. Идеално е за прегледи или кога ви е потребна брзина. без додавање на трошоци за инференција.
Зголемување на резолуцијата со модел (пиксел)
Користете го Load Upscale Model и соодветниот upscale јазол, изберете соодветен модел (на пр., реалистичен или аниме) и изберете ×2 или ×4. Специјализираните модели ги враќаат контурите и острината подобро од класичните алгоритми.
Зголемување на резолуцијата кај латентите
Скалирајте го латентот и преиспитајте го со KSampler за да додадете детали во согласност со промптот. Побавно е, но особено корисно кога сакате да добиете резолуција и визуелна сложеност..
ControlNet: Напреден структурен водич
ControlNet ви овозможува да инјектирате референтни мапи (рабови, поза, длабочина, сегментација) за насочување на композицијата. Во комбинација со стабилна дифузија, ви дава прецизна контрола врз структурата без да се жртвува креативноста на моделот.
Во ComfyUI, интеграцијата е модуларна: ја вчитувате посакуваната мапа, ја поврзувате со блокот ControlNet и ја поврзувате со семплерот. Пробајте различни контролери за да видите кој одговара на вашиот стил и намена..
ComfyUI Администратор: Прилагодени јазли без терминал
Менаџерот ви овозможува да инсталирате и ажурирате прилагодени јазли од интерфејсот. Ќе го најдете во менито за редење. Тоа е наједноставниот начин да го одржувате вашиот екосистем на јазли ажуриран.
Инсталирај јазли што недостасуваат
Ако работниот тек ве предупреди за недостасувачки јазли, отворете го Менаџерот, кликнете на Инсталирај недостасувачки, рестартирајте го ComfyUI и ажурирајте го вашиот прелистувач. Ова ги решава повеќето зависности со неколку кликања..
Ажурирај прилагодени јазли
Од Менаџерот, проверете за ажурирања, инсталирајте ги и кликнете на копчето за ажурирање на секој достапен пакет. Рестартирајте го ComfyUI за да ги примените промените. и избегнувајте недоследности.
Вчитај ги јазлите во протокот
Кликнете двапати на празен простор за да го отворите пребарувачот на јазли и внесете го името на оној што ви е потребен. Вака брзо вметнувате нови делови во вашите дијаграми.
Вградувања (инверзија на текст)
Вградувањата инјектираат обучени концепти или стилови во вашите инструкции користејќи го клучниот збор embedding:name. Ставете ги датотеките во папката models/embeddings за да може ComfyUI да ги детектира..
Ако го инсталирате пакетот со прилагодени скрипти, ќе имате автоматско дополнување: почнете да пишувате „embedding:“ и ќе ја видите листата со достапни скрипти. Ова значително го забрзува итерацијата при управување со многу шаблони..
Исто така, можете да им доделите тежина, на пример (embedding:Name:1.2) за да ги зајакнете за 20%. Прилагодете ја тежината како што би направиле со нормалните термини за известување да се балансира стилот и содржината.
LoRA: го прилагодува стилот без да го допира VAE
LoRA ги модифицира компонентите MODEL и CLIP на контролната точка, без да го менува VAE. Тие се користат за вметнување на специфични стилови, ликови или објекти. со лесни и лесни за споделување датотеки.
Основен тек: Изберете ја вашата основна контролна точка, додадете една или повеќе LoRA-а и генерирајте. Можете да го комбинирате LoRA за да комбинирате естетика и ефекти.прилагодување на нивните интензитети ако работниот тек го дозволува тоа.
Кратенки, трикови и вградени работни процеси
Покрај споменатите кратенки, постојат два многу практични совети: поправете го почетниот елемент при прилагодување на оддалечените јазли за да избегнете повторно пресметување на целиот синџир и користете групи за да преместите повеќе јазли одеднаш. Со Ctrl+влечење можете да изберете повеќе елементи, а со Shift да ја поместите групата..
Друга клучна карактеристика: ComfyUI го зачувува работниот тек во метаподатоците на PNG-то што го генерира. Влечењето на PNG-то на платното го враќа целиот дијаграм со еден клик.Ова го олеснува споделувањето и репродуцирањето на резултатите.
ComfyUI онлајн: креирајте без инсталирање

Ако не сакате да инсталирате ништо, постојат cloud услуги со претходно конфигуриран ComfyUI, стотици јазли и популарни модели. Тие се идеални за тестирање на SDXL, ControlNet или сложени работни процеси без да го допирате вашиот компјутер., а многу од нив вклучуваат галерии од готови работни процеси.
Од нула до видео: Wan 2.1 на ComfyUI
Некои прилагодени јазли ви овозможуваат да креирате видео од текст, да трансформирате слика во секвенца или да уредувате постоечки клип. Со моделите од типот Wan 2.1 можете да поставите цевководи од текст во видео, слика во видео и видео во видео. директно во ComfyUI.
Инсталирајте ги потребните јазли (преку Администратор или рачно), преземете го соодветниот модел и следете го примерниот тек: кодирајте ги параметрите за известување и движење, генерирајте латенции кадар-по-кадар, а потоа декодирајте во кадри или видео контејнер. Запомнете дека трошоците за време и VRAM се зголемуваат со резолуцијата и времетраењето.
Процесор наспроти графичка картичка: Какви перформанси да очекувате
Може да се генерира со помош на процесор, но не е идеален во однос на брзината. Во тестовите во реалниот свет, моќен процесор може да трае неколку минути по слика, додека со соодветен графички процесор процесот се намалува на секунди. Ако имате компатибилна графичка картичка, користете ја за драстично да ги забрзате перформансите..
На процесорот, намалете ја големината, чекорите и сложеноста на јазлите; на графичката картичка, прилагодете ја серијата и резолуцијата според вашата VRAM меморија. Следете ја потрошувачката за да избегнете тесни грла и неочекувани затворања.
Прилагодени јазли: рачна инсталација и најдобри практики
Ако претпочитате класичен метод, можете да клонирате репозиториуми во папката custom_nodes користејќи git, а потоа да рестартирате. Овој метод ви дава прецизна контрола врз верзиите и гранките.корисно кога ви се потребни специфични функции.
Одржувајте ги вашите јазли организирани, со редовни ажурирања и белешки за компатибилност. Избегнувајте мешање на премногу експериментални верзии одеднаш. за да се избегне внесување грешки кои тешко се откриваат.
Типично решавање на проблеми
Ако „инсталирај ги недостасувачките јазли“ не го спаси денот, провери ја конзолата/дневникот за точната грешка: зависности, патеки или верзии. Проверете дали ширината и висината се множители на 8 и дали шаблоните се во точните папки..
Кога работниот тек не реагира на изборот на модел, принудното вчитување на валидна контролна точка обично го враќа графиконот во првобитна состојба. Ако некој јазол се расипе по ажурирањето, обидете се да го оневозможите тој пакет или да се вратите на стабилна верзија..
Фиксните семиња, прилагодените големини и разумните инструкции го олеснуваат дебагирањето. Ако резултатот се влоши по премногу прилагодување, вратете се на основна претходно поставена вредност и повторно воведувајте ги промените една по една..
За дополнителна помош, заедниците како /r/StableDiffusion се многу активни и често решаваат ретки грешки. Споделувањето на дневникот, снимањето на графиконите и верзиите на јазлите ја забрзува поддршката..
Сето погоре наведено ви дава комплетна мапа: знаете што е секој јазол, како се поврзуваат, каде да ги постават моделите и што да допрете за редот да се движи непречено. Со работни процеси за претворање на текст во слика, i2i, SDXL, вградување/надворешно сликање, зголемување на резолуцијата, ControlNet, вградувања и LoRA, плус видео со WAN 2.1, имате многу сериозен комплет за продукција. Подготвени да растеме заедно со вас. За повеќе информации, видете го Официјална веб-страница на ComfyUI.
Страст за технологијата уште од мал. Сакам да бидам ажуриран во секторот и, пред сè, да го комуницирам. Затоа долги години сум посветен на комуникацијата на веб-страниците за технологија и видео игри. Може да ме најдете како пишувам за Android, Windows, MacOS, iOS, Nintendo или која било друга поврзана тема што ќе ви падне на ум.

