A ComfyUI útmutató kezdőknek

Utolsó frissítés: 26/11/2025

  • A ComfyUI lehetővé teszi rugalmas és reprodukálható vizuális folyamatok létrehozását a stabil diffúzió érdekében.
  • Sajátítsd el a szövegből képpé alakítás, az i2i, az SDXL, az in/outpainting, a felskálázás és a ControlNet használatát kulcsfontosságú csomópontokkal.
  • Bővíthető beágyazásokkal, LoRA-val és egyéni csomópontokkal; a Kezelő segítségével kezelhetők.
  • Optimalizálja a teljesítményt és a stabilitást a bevált gyakorlatok, a gyorsbillentyűk és a hibaelhárítás segítségével.

A ComfyUI útmutató kezdőknek

¿A tökéletes ComfyUI útmutató kezdőknek? Ha még csak most ismerkedsz a ComfyUI-val, és már kezded untatni magad a sok csomóponttal, dobozzal és kábellel, ne aggódj: itt egy igazi útmutatót találsz, olyat, ami a nulláról indul, és nem hagy ki semmi fontosat. A cél az, hogy megértsd az egyes darabok funkcióját, hogyan illeszkednek egymáshoz, és hogyan lehet megoldani a gyakori hibákat. amelyek frusztrálóak, amikor pusztán kísérletezéssel próbálsz tanulni.

A klasszikus szöveg-kép, kép-kép, befestés, kifestés, SDXL, felskálázás, ControlNet, beágyazások és LoRA munkafolyamatok lefedése mellett integráljuk a telepítést, konfigurációt, egyéni csomópont-kezelés az adminisztrátorralGyorsbillentyűk és egy gyakorlati rész valós teljesítményjavaslatokkal CPU és GPU esetén. És igen, azt is tárgyaljuk... Hogyan dolgozzunk videóval WAN 2.1 típusú modellek használatával? (szövegből videó, képből videó és videóból videó) a ComfyUI ökoszisztémán belül.

Mi a ComfyUI, és hogyan viszonyul más grafikus felhasználói felületekhez?

A ComfyUI egy csomópont-alapú vizuális felület, amely a következőre épül: Stabil diffúzió amely lehetővé teszi munkafolyamatok beállítását funkcionális blokkok összekapcsolásával. Minden csomópont egy adott feladatot hajt végre (modell betöltése, szöveg kódolása, mintavételezés, dekódolás) és az élek összekötik a bejáratait és kijáratait, mintha egy vizuális receptet állítanál össze.

Az AUTOMATIC1111-hez képest a ComfyUI kiemelkedik azzal, hogy Könnyű, rugalmas, átlátszó és nagyon könnyen megosztható (Minden munkafolyamat-fájl reprodukálható). A hátránya, hogy a felület a munkafolyamat szerzőjétől függően változhat, és az alkalmi felhasználók számára... Ennyire részletgazdagnak tűnhet a dolog..

A tanulási görbe kisimul, amikor megérted a csomópontok mögötti „miérteket”. Gondolj a ComfyUI-ra úgy, mint egy irányítópultra, ahol láthatod a teljes képfájl-útvonalat.A kezdeti látens szövegtől és zajtól a pixelekre történő végső dekódolásig.

Telepítés a semmiből: gyors és problémamentes

A legközvetlenebb mód a rendszer hivatalos csomagjának letöltése, kicsomagolása és futtatása. Nem kell külön telepíteni a Pythont, mert beágyazva érkezik., ami jelentősen csökkenti a kezdeti súrlódást.

Alapvető lépések: Töltsd le a tömörített fájlt, csomagold ki (például 7-Zip segítségével), és futtasd a számodra megfelelő indítóprogramot. Ha nincs GPU-d, vagy a grafikus kártyád nem kompatibilis, használd a CPU futtatható fájlt.Több időbe fog telni, de működni fog.

A kezdéshez helyezz legalább egy modellt az ellenőrzőpontok mappába. Olyan tárhelyekről szerezheted be őket, mint a Hugging Face vagy a Civitai. és helyezze el őket a ComfyUI modell elérési útján.

Ha már van egy modellkönyvtára más mappákban, szerkessze az extra paths fájlt (extra_model_paths.yaml) a névből az „example” eltávolításával és a helyek hozzáadásával. Indítsa újra a ComfyUI-t, hogy az észlelje az új könyvtárakat.

Alapvető vezérlők és kezelőfelületi elemek

A vásznon a zoomolást az egér görgővel vagy csippentő mozdulattal lehet vezérelni, a görgetés pedig a bal gombbal történő húzással történik. Csomópontok csatlakoztatásához húzd az egeret a kimeneti csatlakozóról a bemeneti csatlakozóra., és engedd el a gombot az él létrehozásához.

A ComfyUI kezeli a végrehajtási sort: konfigurálja a munkafolyamatot, és nyomja meg a sor gombot. A várólista nézetben ellenőrizheted az állapotot, hogy lásd, mi fut. vagy amit elvár tőle.

Exkluzív tartalom – Kattintson ide  Melyik MI működik a legjobban képek generálásához: DALL-E 3 vs Midjourney vs Leonardo

Hasznos billentyűparancsok: Ctrl+C/Ctrl+V csomópontok másolásához/beillesztéséhez, Ctrl+Shift+V beillesztéshez a bejegyzések megtartásával, Ctrl+Enter a sorba helyezéshez, Ctrl+M a csomópont némításához. Kattintson a bal felső sarokban lévő pontra egy csomópont minimalizálásához és a vászon törléséhez.

A szövegtől a képig: a lényegi áramlás

A minimális folyamat magában foglalja az ellenőrzőpont betöltését, a pozitív és negatív prompt kódolását CLIP-pel, egy üres látens kép létrehozását, mintavételezést KSamplerrel és pixelekre dekódolást VAE-vel. Nyomd meg a sorba állítás gombot, és máris megkapod az első képedet..

Válassza ki a modellt a Load Checkpointban

A Load Checkpoint csomópont három komponenst ad vissza: MODEL (zajelőlő), CLIP (szövegkódoló) és VAE (képkódoló/dekódoló). A MODEL a KSamplerbe, a CLIP a szövegcsomópontokba, a VAE pedig a dekódolóba kerül..

Pozitív és negatív promptok CLIP szövegkódolással

Írd be a pozitív promptot fent, a negatívat pedig lent; mindkettő beágyazásként van kódolva. A szavakat a (word:1.2) vagy a (word:0.8) szintaxissal súlyozhatod. hogy megerősítsen vagy enyhítsen bizonyos kifejezéseket.

Látens üregek és optimális méretek

Az Üres Látens Kép a látens térben határozza meg a vásznat. SD 1.5 esetén 512×512 vagy 768×768 felbontás ajánlott; SDXL esetén pedig 1024×1024.A szélességnek és a magasságnak 8-cal kell osztódnia a hibák elkerülése és az architektúra tiszteletben tartása érdekében.

VAE: látenstől pixelekig

A VAE a képeket látens értékekre tömöríti, majd pixelekké rekonstruálja. A szövegből képpé konvertálás során jellemzően csak a végén használják a látens érték dekódolására. A tömörítés felgyorsítja a folyamatot, de kis veszteségeket okozhatCserébe finom szabályozást kínál a látens térben.

KSampler és kulcsparaméterek

A KSampler fordított diffúziót alkalmaz a zaj eltávolítására a beágyazási útmutató szerint. Seed, lépések, mintavevő, ütemező és zajszűrés Ezek a fő tárcsák. Több lépés általában több részletet ad, és a denoise=1 teljesen átírja a kezdeti zajt.

Kép képről képre: újra útmutatóval

Az i2i folyamat egy bemeneti képpel és a promptokkal kezdődik; a zajszűrés szabályozza, hogy mennyire tér el az eredetitől. Alacsony zajszinttel finom variációkat, magas zajszinttel mélyreható átalakulásokat kapunk..

Tipikus sorrend: ellenőrzőpont kiválasztása, a kép betöltése bemenetként, promptok beállítása, zajszűrés definiálása a KSamplerben és sorba helyezés. Ideális kompozíciók javítására vagy stílusok átdolgozására anélkül, hogy a nulláról kellene kezdeni..

SDXL a ComfyUI-n

A ComfyUI moduláris felépítésének köszönhetően korai SDXL-támogatást kínál. Egyszerűen használjon egy SDXL-kompatibilis folyamatot, ellenőrizze a promptokat, és futtassa. Ne feledd: a nagyobb natív méretek több VRAM-ot és feldolgozási időt igényelnek.De a részletekben mutatkozó minőségi ugrás kárpótol ezért.

Átfestés: csak azt szerkeszd, ami érdekel

Ha egy kép meghatározott területeit szeretnéd módosítani, az inpainting a megfelelő eszköz. Töltsd be a képet, nyisd meg a maszkszerkesztőt, fesd ki, amit regenerálni szeretnél, és mentsd el a megfelelő csomópontba. Adja meg a szerkesztést irányító és a zajszűrést módosító promptot (például 0.6).

Ha standard modellt használsz, akkor működik a VAE kódolással és a Set Noise Latent Mask beállítással. Dedikált inpaint modellek esetén ezeket a csomópontokat VAE Encode (Inpaint) segítségével kell lecserélni., amely erre a feladatra van optimalizálva.

Outpainting: a vászon széleinek kinagyítása

Egy kép határain túli kiterjesztéséhez add hozzá a padding node-ot az outpaintinghez, és állítsd be, hogy az egyes oldalak mennyit növekedjenek. A lágyító paraméter kisimítja az átmenetet az eredeti és a kiterjesztett kép között.

Az outpainting folyamatokban állítsa be a VAE Encode-ot (az Inpaintinghez) és a grow_mask_by paramétert. A 10-nél nagyobb érték általában természetesebb integrációt kínál. a kibővített területen.

Exkluzív tartalom – Kattintson ide  Mi az a pagefile.sys fájl, és le kell tiltani a Windows 11 rendszerben?

Előnyös a ComfyUI-ban: pixel vs. látens

Kétféleképpen lehet felskálázni: pixelfelskálázással (gyorsan, új információk hozzáadása nélkül) és látens felskálázással, más néven nagy felbontású látens javítással, amely a méretezés során újraértelmezi a részleteket. Az első gyors; a második gazdagítja a textúrákat, de eltérhet.

Algoritmus alapú felskálázás (pixel)

Az átskálázási csomópont módszerrel választhatunk bikubikus, bilineáris vagy legközelebbi pontos átskálázást, valamint a méretezési tényezőt. Ideális előzetesekhez, vagy ha sebességre van szükséged. következtetési költség hozzáadása nélkül.

Felskálázás modellel (pixel)

Használd a Load Upscale Model (Felskálázandó modell betöltése) funkciót és a hozzá tartozó upscale csomópontot, válassz egy megfelelő modellt (pl. realisztikus vagy anime), és válaszd a ×2 vagy ×4 értéket. A specializált modellek jobban visszaadják a kontúrokat és az élességet, mint a klasszikus algoritmusok.

Előnyös a látens

Méretezze a látens részt, és mintavételezze újra a KSamplerrel, hogy a prompttal összhangban lévő részleteket adjon hozzá. Lassabb, de különösen hasznos, ha felbontást és vizuális komplexitást szeretnél elérni..

ControlNet: Speciális szerkezeti útmutató

A ControlNet lehetővé teszi referenciatérképek (élek, pozíció, mélység, szegmentáció) befecskendezését a kompozíció irányításához. A stabil diffúzióval kombinálva finom kontrollt biztosít a szerkezet felett. anélkül, hogy feláldoznánk a modell kreativitását.

A ComfyUI-ban az integráció moduláris: betöltöd a kívánt térképet, csatlakoztatod a ControlNet blokkhoz, majd összekapcsolod a mintavevővel. Próbálj ki különböző kontrollereket, hogy melyik illik a stílusodhoz és a célodhoz..

ComfyUI adminisztrátor: Terminál nélküli egyéni csomópontok

A Kezelő lehetővé teszi egyéni csomópontok telepítését és frissítését a felületről. A várólista menüben találod. Ez a legegyszerűbb módja annak, hogy naprakészen tartsd a csomópont-ökoszisztémádat..

Hiányzó csomópontok telepítése

Ha egy munkafolyamat hiányzó csomópontokra figyelmeztet, nyissa meg a Kezelőt, kattintson a Hiányzó csomópontok telepítése lehetőségre, indítsa újra a ComfyUI-t, és frissítse a böngészőjét. Ez a legtöbb függőséget néhány kattintással megoldja..

Egyéni csomópontok frissítése

A Kezelőben keressen frissítéseket, telepítse őket, majd kattintson a frissítés gombra minden elérhető csomagon. Indítsa újra a ComfyUI-t a módosítások alkalmazásához. és kerüljük az ellentmondásokat.

Csomópontok betöltése a folyamatba

Kattintson duplán egy üres területre a csomópontkereső megnyitásához, és írja be a szükséges csomópont nevét. Így illeszthetsz be gyorsan új darabokat a diagramjaidba.

Beágyazások (szöveg inverzió)

A beágyazások betanított koncepciókat vagy stílusokat illesztenek be a promptokba a embedding:name kulcsszó használatával. Helyezd a fájlokat a models/embeddings mappába, hogy a ComfyUI felismerhesse őket..

Ha telepíted az egyéni szkriptcsomagot, akkor automatikusan kiegészíted a parancsot: kezdd el beírni az „embedding:” parancsot, és máris látni fogod az elérhető parancsok listáját. Ez nagymértékben felgyorsítja az iterációt sok sablon kezelésekor..

Súlyozhatod is őket, például (embedding:Name:1.2) 20%-os megerősítéshez. Állítsa be a súlyt a szokásos utasításokhoz hasonlóan egyensúlyt teremteni a stílus és a tartalom között.

LoRA: stílust adaptál a VAE érintése nélkül

A LoRA módosítja az ellenőrzőpont MODEL és CLIP komponenseit a VAE megváltoztatása nélkül. Speciális stílusok, karakterek vagy objektumok beillesztésére szolgálnak. könnyű és könnyen megosztható fájlokkal.

Alapvető folyamat: Válassza ki az alap ellenőrzőpontot, adjon hozzá egy vagy több LoRA-t, és generálja. A LoRA-t egymásra rakhatod az esztétikum és az effektek kombinálásához.intenzitásuk módosításával, ha a munkafolyamat ezt lehetővé teszi.

Gyorsbillentyűk, trükkök és beágyazott munkafolyamatok

Az említett gyorsbillentyűkön kívül két nagyon praktikus tipp is van: a távoli csomópontok módosításakor rögzítsük a kezdőértéket, hogy elkerüljük a teljes lánc újraszámítását, és használjunk csoportokat több csomópont egyidejű mozgatásához. A Ctrl+húzás billentyűkombinációval több elemet is kijelölhet, a Shift billentyűkombinációval pedig áthelyezheti a csoportot..

Exkluzív tartalom – Kattintson ide  Hogyan fordíts képregényeket és mangákat a saját nyelvedre mesterséges intelligencia segítségével, miközben megőrzöd a paneleket és a szövegbuborékokat (AI Manga Translator)

Egy másik fontos funkció: a ComfyUI elmenti a munkafolyamatot a létrehozott PNG metaadataiba. A PNG vászonra húzásával egyetlen kattintással lekérhető a teljes diagramEz megkönnyíti az eredmények megosztását és reprodukálását.

ComfyUI online: létrehozás telepítés nélkül

Comfyui

Ha nem szeretnél semmit telepíteni, akkor vannak előre konfigurált ComfyUI-val rendelkező felhőszolgáltatások, több száz csomópont és népszerű modellek. Ideálisak SDXL, ControlNet vagy összetett munkafolyamatok teszteléséhez a számítógép érintése nélkül., és sokuk tartalmaz kész munkafolyamatok galériáit.

A nulláról a videóig: WAN 2.1 a ComfyUI-n

Néhány egyéni csomópont lehetővé teszi videók létrehozását szövegből, képek sorozattá alakítását vagy meglévő klipek szerkesztését. A WAN 2.1 típusú modellekkel szöveg-videó, kép-videó és videó-videó folyamatok hozhatók létre. közvetlenül a ComfyUI-ban.

Telepítsd a szükséges csomópontokat (Adminisztrátoron keresztül vagy manuálisan), töltsd le a megfelelő modellt, és kövesd a példafolyamatot: kódold a prompt és a mozgás paramétereket, generálj képkockánkénti késleltetéseket, majd dekódold képkockákra vagy videokonténerre. Ne feledd, hogy az idő és a VRAM költsége a felbontással és az időtartammal növekszik..

CPU vs GPU: Milyen teljesítményre számíthatunk?

CPU-val is előállítható, de a sebesség szempontjából nem ideális. Valós tesztekben egy erős CPU-val képfájlonként több perc is eltarthat, míg egy megfelelő GPU-val a folyamat másodpercekre csökken. Ha van kompatibilis GPU-d, használd azt a teljesítmény drasztikus felgyorsítására..

CPU-n csökkentsd a méretet, a lépések számát és a csomópontok bonyolultságát; GPU-n pedig a VRAM-odnak megfelelően állítsd be a kötegelt feldolgozást és a felbontást. Figyelje a fogyasztást a szűk keresztmetszetek és a váratlan leállások elkerülése érdekében.

Egyéni csomópontok: manuális telepítés és ajánlott eljárások

Ha a klasszikus módszert részesíted előnyben, akkor a custom_nodes mappában található adattárakat a git használatával klónozhatod, majd újraindíthatod a gépet. Ez a módszer finom kontrollt biztosít a verziók és az elágazások felett.hasznos, ha speciális funkciókra van szüksége.

Tartsa rendszerezetten a csomópontjait rendszeres frissítésekkel és kompatibilitási megjegyzésekkel. Kerüld a túl sok kísérleti verzió egyidejű keverését. hogy elkerüljük a nehezen nyomon követhető hibákat.

Tipikus hibaelhárítás

Ha a „hiányzó csomópontok telepítése” nem mentette meg a helyzetet, akkor a konzolban/naplóban keresd a pontos hibát: függőségek, elérési utak vagy verziók. Ellenőrizd, hogy a szélesség és a magasság 8-cal van-e osztva, és hogy a sablonok a megfelelő mappákban vannak-e..

Amikor egy munkafolyamat nem reagál a modellkiválasztásra, egy érvényes ellenőrzőpont betöltésének kikényszerítése általában visszaállítja a gráfot. Ha egy csomópont frissítés után meghibásodik, próbálja meg letiltani a csomagot, vagy visszaállítani egy stabil verzióra..

A fix magok, a módosított méretek és az ésszerű promptok megkönnyítik a hibakeresést. Ha az eredmény túl sok bütykölés után is romlik, térjen vissza egy alapbeállításhoz, és egyesével vezesse be újra a változtatásokat..

További segítségért olyan közösségek, mint az /r/StableDiffusion, nagyon aktívak, és gyakran megoldanak ritka hibákat. A napló, a grafikonrögzítések és a csomópont-verziók megosztása felgyorsítja a támogatást..

A fentiek mindegyike egy teljes térképet ad: tudod, hogy mik az egyes csomópontok, hogyan kapcsolódnak egymáshoz, hová kell helyezni a modelleket, és mit kell megérinteni, hogy a sor zökkenőmentesen haladjon. A szövegből képpé alakító munkafolyamatokkal, az i2i-vel, az SDXL-lel, az in/outpaintinggel, a felskálázással, a ControlNet-tel, a beágyazásokkal és a LoRA-val, valamint a WAN 2.1-es videóval egy nagyon komoly produkciós készletet kapsz. Készen állunk arra, hogy Önnel együtt növekedjünk. További információkért kérjük, tekintse meg a ComfyUI hivatalos weboldal.

stabil diffúzió
Kapcsolódó cikk:
Mit jelent a stabil diffúzió, és mire jó?