Ultimativni ComfyUI vodič za početnike

Posljednje ažuriranje: 01.02.2024.

  • ComfyUI vam omogućava da kreirate fleksibilne i reproducibilne vizuelne tokove za stabilnu difuziju.
  • Savladajte pretvaranje teksta u sliku, i2i, SDXL, in/outpainting, upscale i ControlNet s ključnim čvorovima.
  • Poboljšajte ugrađivanjem, LoRA-om i prilagođenim čvorovima; koristite Upravitelj za upravljanje njima.
  • Optimizirajte performanse i stabilnost uz pomoć najboljih praksi, prečica i rješavanja problema.

Ultimativni ComfyUI vodič za početnike

¿Ultimativni ComfyUI vodič za početnike? Ako pravite prve korake s ComfyUI-jem i preplavljeni ste svim čvorovima, kutijama i kablovima, ne brinite: ovdje ćete pronaći pravi vodič, onaj koji počinje od nule i ne preskače ništa važno. Cilj je da shvatite čemu svaki dio služi, kako se uklapaju i kako riješiti uobičajene greške. koje su frustrirajuće kada pokušavate učiti samo eksperimentiranjem.

Pored pokrivanja klasičnih procesa pretvaranja teksta u sliku, pretvaranja slike u sliku, dodavanja slikama (inpainting), dodavanja slikama (outpainting), SDXL-a, skaliranja (upscaling), ControlNet-a, ugrađivanja i LoRA, integrirat ćemo i instalaciju, konfiguraciju, prilagođeno upravljanje čvorovima s administratoromPrečice i praktični dio sa stvarnim preporukama za performanse CPU-a i GPU-a. I da, obradit ćemo i... Kako raditi s videom koristeći Wan 2.1 modele (tekst u video, slika u video i video u video) unutar ComfyUI ekosistema.

Šta je ComfyUI i kako se poredi s drugim GUI-jima?

ComfyUI je vizuelni interfejs zasnovan na čvorovima, izgrađen na Stable Diffusion što vam omogućava postavljanje radnih procesa povezivanjem funkcionalnih blokova. Svaki čvor obavlja određeni zadatak (učitavanje modela, kodiranje teksta, uzorak, dekodiranje) a rubovi povezuju njegove ulaze i izlaze, kao da sastavljate vizualni recept.

U poređenju sa AUTOMATIC1111, ComfyUI se ističe po tome što je Lagan, fleksibilan, proziran i vrlo jednostavan za dijeljenje (Svaka datoteka radnog procesa se može reproducirati). Nedostatak je što se interfejs može razlikovati ovisno o autoru radnog procesa, a za povremene korisnike, Ulazak u toliko detalja može se činiti pretjeranim..

Krivulja učenja se izglađuje kada shvatite "zašto" stoji iza čvorova. Zamislite ComfyUI kao kontrolnu ploču na kojoj vidite kompletnu putanju slike.od početnog teksta i šuma u latentnom obliku, do konačnog dekodiranja u piksele.

Instalacija od nule: brza i bez problema

Najdirektniji način je da preuzmete službeni paket za vaš sistem, raspakujete ga i pokrenete. Ne morate zasebno instalirati Python jer je već ugrađen., što znatno smanjuje početno trenje.

Osnovni koraci: Preuzmite komprimiranu datoteku, raspakujte je (na primjer, pomoću 7-Zip-a) i pokrenite launcher koji vam odgovara. Ako nemate GPU ili vaša grafička kartica nije kompatibilna, koristite izvršnu datoteku CPU-a.Trebat će duže, ali funkcionira.

Da biste sve započeli, postavite barem jedan model u mapu kontrolnih točaka. Možete ih nabaviti iz repozitorija poput Hugging Face ili Civitai i postavite ih u putanju modela ComfyUI.

Ako već imate biblioteku modela u drugim folderima, uredite datoteku dodatnih putanja (extra_model_paths.yaml) uklanjanjem "example" iz naziva i dodavanjem vaših lokacija. Ponovo pokrenite ComfyUI kako bi detektovao nove direktorije.

Osnovne kontrole i elementi interfejsa

Na platnu se zumiranje kontroliše kotačićem miša ili gestom štipanja, a skrolovanje se vrši povlačenjem lijevom tipkom miša. Da biste povezali čvorove, prevucite od izlaznog konektora do ulaznog konektora., i otpustite da biste kreirali ivicu.

ComfyUI upravlja redom čekanja za izvršenje: konfigurirajte svoj radni tok i pritisnite dugme za red čekanja. Status možete provjeriti iz prikaza reda čekanja da vidite šta se izvršava. ili šta on/ona očekuje.

Ekskluzivni sadržaj - kliknite ovdje  Kako poboljšati performanse igara onemogućavanjem Game DVR-a

Korisne prečice: Ctrl+C/Ctrl+V za kopiranje/lijepljenje čvorova, Ctrl+Shift+V za lijepljenje uz zadržavanje unosa, Ctrl+Enter za stavljanje u red čekanja, Ctrl+M za isključivanje zvuka čvora. Kliknite na tačku u gornjem lijevom uglu da biste minimizirali čvor i očistili platno.

Od teksta do slike: suštinski tok

Minimalni tok uključuje učitavanje kontrolne tačke, kodiranje pozitivnog i negativnog prompta pomoću CLIP-a, kreiranje prazne latentne slike, uzorkovanje pomoću KSamplera i dekodiranje u piksele pomoću VAE-a. Pritisnite dugme za čekanje i dobićete svoju prvu sliku.

Odaberite model u Kontrolnoj tački učitavanja

Čvor Load Checkpoint vraća tri komponente: MODEL (prediktor šuma), CLIP (enkoder teksta) i VAE (enkoder/dekoder slike). MODEL ide u KSampler, CLIP u tekstualne čvorove, a VAE u dekoder..

Pozitivni i negativni upiti s CLIP tekstualnim kodiranjem

Unesite svoj pozitivni prompt iznad, a negativni ispod; oba su kodirana kao ugrađivanja. Riječima možete dodijeliti težinu sintaksom (riječ:1.2) ili (riječ:0.8) da pojačaju ili ublaže određene termine.

Latentne praznine i optimalne veličine

Prazna latentna slika definira platno u latentnom prostoru. Za SD 1.5, preporučuje se 512×512 ili 768×768; za SDXL, 1024×1024.Širina i visina moraju biti višekratnici broja 8 kako bi se izbjegle greške i poštovala arhitektura.

VAE: od latentnog do piksela

VAE komprimira slike u latentne vrijednosti i rekonstruira ih u piksele. Kod konverzije teksta u sliku, obično se koristi samo na kraju za dekodiranje latentne vrijednosti. Kompresija ubrzava proces, ali može uzrokovati male gubitkeZauzvrat, nudi finu kontrolu u latentnom prostoru.

KSampler i ključni parametri

KSampler primjenjuje obrnutu difuziju za uklanjanje šuma prema vodiču za ugrađivanje. Sjeme, koraci, uzorkovanje, raspoređivač i uklanjanje šuma Ovo su glavni brojčanici. Više koraka obično pruža više detalja, a denoise=1 potpuno prepisuje početni šum.

Slika po slika: ponovi s vodičem

i2i tok počinje s ulaznom slikom i vašim uputama; uklanjanje šuma kontrolira koliko odstupa od originala. Sa niskim smanjenjem šuma dobijate suptilne varijacije; sa visokim, duboke transformacije..

Tipičan redoslijed: odabir kontrolne tačke, učitavanje slike kao ulaza, podešavanje promptova, definiranje uklanjanja šuma u KSampleru i stavljanje u red. Idealan je za poboljšanje kompozicija ili migraciju stilova bez počinjanja od nule..

SDXL na ComfyUI-ju

ComfyUI nudi ranu podršku za SDXL zahvaljujući modularnom dizajnu. Jednostavno koristite SDXL-kompatibilan tok, provjerite upute i pokrenite ga. Zapamtite: veće nativne veličine zahtijevaju više VRAM-a i vremena obrade.Ali kvalitativni skok u detaljima to nadoknađuje.

Inpainting: uređujte samo ono što vas zanima

Kada želite modificirati određena područja slike, inpainting je alat koji trebate koristiti. Učitajte sliku, otvorite uređivač maski, obojite ono što želite regenerirati i sačuvajte to u odgovarajući čvor. Definirajte svoj upit koji će voditi uređivanje i prilagoditi uklanjanje šuma (na primjer, 0.6).

Ako koristite standardni model, radi s VAE kodiranjem i postavljanjem latentne maske šuma. Za namjenske modele inpaintinga, zamijenite te čvorove sa VAE Encode (Inpaint), koji je optimizovan za taj zadatak.

Outpainting: uvećavanje rubova platna

Da biste proširili sliku izvan njenih granica, dodajte čvor za padding za outpainting i konfigurirajte koliko svaka strana raste. Parametar perja ublažava prelaz između originala i ekstenzije.

U tokovima preslikavanja, prilagodite VAE Encode (za preslikavanje) i parametar grow_mask_by. Vrijednost veća od 10 obično nudi prirodnije integracije. u proširenom području.

Ekskluzivni sadržaj - kliknite ovdje  Windows periodično kreira mape "Windows.old": kako ih kontrolisati ili sigurno izbrisati

Poboljšanje slike u ComfyUI-ju: piksel naspram latentnog

Postoje dva načina: povećanje skale piksela (brzo, bez dodavanja novih informacija) i latentno povećanje skale, također nazvano Hi-res Latent Fix, koje reinterpretira detalje prilikom skaliranja. Prvi je brz; drugi obogaćuje teksture, ali može odstupati.

Povećanje skale zasnovano na algoritmu (piksel)

Pomoću metode promjene skaliranja čvora možete odabrati bikubičnu, bilinearnu ili najbližu tačnu metodu, kao i faktor skaliranja. Idealan je za preglede ili kada vam je potrebna brzina. bez dodavanja troškova zaključivanja.

Povećaj veličinu s modelom (piksel)

Koristite Load Upscale Model i odgovarajući čvor za povećanje skale, odaberite odgovarajući model (npr. realističan ili anime) i odaberite ×2 ili ×4. Specijalizovani modeli bolje oporavljaju konture i oštrinu od klasičnih algoritama.

Upscale u latentnom

Skalirajte latentni prikaz i ponovo uzorkujte pomoću KSamplera kako biste dodali detalje u skladu s upitom. Sporiji je, ali posebno koristan kada želite postići veću rezoluciju i vizualnu složenost..

ControlNet: Napredni strukturni vodič

ControlNet vam omogućava ubrizgavanje referentnih mapa (ivice, poza, dubina, segmentacija) za vođenje kompozicije. U kombinaciji sa stabilnom difuzijom, pruža vam finu kontrolu nad strukturom. bez žrtvovanja kreativnosti modela.

U ComfyUI-ju, integracija je modularna: učitava se željena mapa, povezuje se s ControlNet blokom i povezuje se s uzorkivačem. Isprobajte različite kontrolere kako biste vidjeli koji odgovara vašem stilu i namjeni..

ComfyUI Administrator: Prilagođeni čvorovi bez terminala

Upravitelj vam omogućava instaliranje i ažuriranje prilagođenih čvorova iz interfejsa. Naći ćete ga u meniju za čekanje. To je najjednostavniji način da vaš ekosistem čvorova bude ažuran.

Instalirajte nedostajuće čvorove

Ako vas radni tok upozori na nedostajuće čvorove, otvorite Upravitelj, kliknite Instaliraj nedostajuće, ponovo pokrenite ComfyUI i ažurirajte preglednik. Ovo rješava većinu zavisnosti u nekoliko klikova..

Ažuriranje prilagođenih čvorova

Iz Upravitelja provjerite ima li ažuriranja, instalirajte ih i kliknite gumb za ažuriranje na svakom dostupnom paketu. Ponovo pokrenite ComfyUI da biste primijenili promjene. i izbjegavajte nedosljednosti.

Učitaj čvorove u tok

Dvaput kliknite na prazno područje da biste otvorili tražilicu čvorova i upišite naziv onog koji vam je potreban. Ovako brzo ubacujete nove dijelove u svoje dijagrame.

Ugrađivanja (inverzija teksta)

Ugrađivanja ubrizgavaju obučene koncepte ili stilove u vaše prompte koristeći ključnu riječ embedding:name. Smjestite datoteke u mapu models/embeddings kako bi ih ComfyUI mogao detektirati..

Ako instalirate paket prilagođenih skripti, imat ćete automatsko dovršavanje: počnite tipkati "embedding:" i vidjet ćete dostupnu listu. Ovo znatno ubrzava iteraciju pri upravljanju mnogim predlošcima..

Također ih možete ponderirati, na primjer (embedding:Name:1.2) da biste ojačali za 20%. Prilagodite težinu kao što biste to učinili s uobičajenim promptnim terminima uravnotežiti stil i sadržaj.

LoRA: prilagođava stil bez dodirivanja VAE

LoRA modificira MODEL i CLIP komponente kontrolne tačke, bez mijenjanja VAE. Koriste se za ubrizgavanje određenih stilova, znakova ili objekata s laganim i jednostavnim datotekama za dijeljenje.

Osnovni tok: Odaberite svoju osnovnu kontrolnu tačku, dodajte jednu ili više LoRA i generirajte ih. Možete slagati LoRA kako biste kombinovali estetiku i efekte.prilagođavajući njihov intenzitet ako radni proces to dozvoljava.

Prečice, trikovi i ugrađeni tokovi rada

Pored spomenutih prečica, postoje dva vrlo praktična savjeta: ispravite početnu vrijednost (seed) prilikom podešavanja udaljenih čvorova kako biste izbjegli ponovno izračunavanje cijelog lanca i koristite grupe za istovremeno pomicanje više čvorova. Sa Ctrl+drag možete odabrati više stavki, a sa Shift pomjeriti grupu..

Ekskluzivni sadržaj - kliknite ovdje  Kako migrirati podatke iz jednog oblaka u drugi bez preuzimanja

Još jedna ključna karakteristika: ComfyUI sprema tijek rada u metapodatke PNG-a koji generira. Prevlačenjem PNG-a na platno, cijeli dijagram se dohvaća jednim klikom.Ovo olakšava dijeljenje i reprodukciju rezultata.

ComfyUI online: kreirajte bez instaliranja

Comfyui

Ako ne želite ništa instalirati, postoje cloud servisi sa unaprijed konfiguriranim ComfyUI-jem, stotinama čvorova i popularnim modelima. Idealni su za testiranje SDXL-a, ControlNet-a ili složenih radnih procesa bez dodirivanja računara., a mnogi uključuju galerije gotovih radnih procesa.

Od nule do videa: Wan 2.1 na ComfyUI-ju

Neki prilagođeni čvorovi vam omogućavaju kreiranje videa iz teksta, transformiranje slike u sekvencu ili uređivanje postojećeg isječka. Sa modelima tipa Wan 2.1 možete postaviti cjevovode za pretvaranje teksta u video, slike u video i videa u video. direktno u ComfyUI-ju.

Instalirajte potrebne čvorove (putem administratora ili ručno), preuzmite odgovarajući model i slijedite primjer toka: kodirajte parametre prompta i kretanja, generirajte latencije kadar po kadar, a zatim dekodirajte u kadrove ili video kontejner. Imajte na umu da se trošak vremena i VRAM-a povećava s rezolucijom i trajanjem.

CPU vs GPU: Koje performanse očekivati

Može se generirati pomoću CPU-a, ali nije idealan u smislu brzine. U stvarnim testovima, moćnom CPU-u može trebati nekoliko minuta po slici, dok se s odgovarajućim GPU-om proces smanjuje na sekunde. Ako imate kompatibilnu grafičku karticu, koristite je za drastično ubrzanje performansi..

Na CPU-u smanjite veličinu, korake i složenost čvorova; na GPU-u prilagodite batch i rezoluciju prema vašoj VRAM memoriji. Pratite potrošnju kako biste izbjegli uska grla i neočekivana zatvaranja.

Prilagođeni čvorovi: ručna instalacija i najbolje prakse

Ako više volite klasičnu metodu, možete klonirati repozitorije u mapi custom_nodes pomoću gita, a zatim ponovo pokrenuti sistem. Ova metoda vam daje finu kontrolu nad verzijama i granama.korisno kada su vam potrebne specifične funkcije.

Održavajte svoje čvorove organiziranima, uz redovna ažuriranja i napomene o kompatibilnosti. Izbjegavajte miješanje previše eksperimentalnih verzija odjednom. kako bi se izbjeglo uvođenje grešaka koje je teško pratiti.

Tipično rješavanje problema

Ako "instaliranje nedostajućih čvorova" nije spasilo stvar, provjerite konzolu/log za tačnu grešku: zavisnosti, putanje ili verzije. Provjerite jesu li širina i visina višekratnici broja 8 i jesu li predlošci u ispravnim mapama..

Kada radni tok ne reaguje na odabir modela, prisilno učitavanje važeće kontrolne tačke obično vraća graf u prvobitno stanje. Ako čvor prestane raditi nakon ažuriranja, pokušajte onemogućiti taj paket ili se vratiti na stabilnu verziju..

Fiksne početne vrijednosti, prilagođene veličine i razumni upiti olakšavaju otklanjanje grešaka. Ako se rezultat pogorša nakon previše petljanja, vratite se na osnovni predefinisani podesavanje i ponovo uvodite promjene jednu po jednu..

Za dodatnu pomoć, zajednice poput /r/StableDiffusion su vrlo aktivne i često rješavaju rijetke greške. Dijeljenje zapisnika, snimaka grafova i verzija čvorova ubrzava podršku.

Sve navedeno vam daje kompletnu mapu: znate šta je svaki čvor, kako se povezuju, gdje postaviti modele i šta dodirnuti kako bi se red kretao glatko. Sa radnim procesima pretvaranja teksta u sliku, i2i, SDXL, in/outpaintingom, povećanjem skale, ControlNet-om, ugrađivanjem i LoRA-om, plus videom sa WAN 2.1, imate vrlo ozbiljan produkcijski komplet. Spremni da rastemo s vama. Za više informacija, pogledajte Zvanična web stranica ComfyUI-ja.

stabilna difuzija
Povezani članak:
Šta znači stabilna difuzija i čemu služi?