Den ultimate ComfyUI-guiden for nybegynnere

Siste oppdatering: 26/11/2025

  • ComfyUI lar deg bygge fleksible og reproduserbare visuelle flyter for stabil diffusjon.
  • Mestre tekst-til-bilde, i2i, SDXL, inn/utpainting, oppskalering og ControlNet med nøkkelnoder.
  • Forbedre med innebygginger, LoRA og tilpassede noder; bruk Manager til å administrere dem.
  • Optimaliser ytelse og stabilitet med beste praksis, snarveier og feilsøking.

Den ultimate ComfyUI-guiden for nybegynnere

¿Den ultimate ComfyUI-guiden for nybegynnere? Hvis du tar dine første skritt med ComfyUI og er overveldet av alle nodene, boksene og kablene, ikke bekymre deg: her finner du en skikkelig guide, en som starter fra bunnen av og ikke hopper over noe viktig. Målet er at du skal forstå hva hver del gjør, hvordan de passer sammen og hvordan du løser vanlige feil. som er frustrerende når man prøver å lære bare ved å eksperimentere.

I tillegg til å dekke klassisk tekst-til-bilde, bilde-til-bilde, innmaling, utmaling, SDXL, oppskalering, ControlNet, innebygginger og LoRA-arbeidsflyter, vil vi også integrere installasjon, konfigurasjon, tilpasset nodeadministrasjon med administratorenSnarveier og en praktisk seksjon med reelle ytelsesanbefalinger for CPU og GPU. Og ja, vi skal også dekke... Slik jobber du med video ved hjelp av WAN 2.1-modeller (tekst til video, bilde til video og video til video) innenfor ComfyUI-økosystemet.

Hva er ComfyUI, og hvordan er det sammenlignet med andre grafiske brukergrensesnitt?

ComfyUI er et nodebasert visuelt grensesnitt bygget på Stabil diffusjon som lar deg sette opp arbeidsflyter ved å koble sammen funksjonelle blokker. Hver node utfører en spesifikk oppgave (laste inn modell, kode tekst, prøve, dekode) og kantene forbinder innganger og utganger, som om du setter sammen en visuell oppskrift.

Sammenlignet med AUTOMATIC1111, skiller ComfyUI seg ut ved å være Lett, fleksibel, gjennomsiktig og veldig enkel å dele (Hver arbeidsflytfil kan reproduseres). Ulempen er at grensesnittet kan variere avhengig av arbeidsflytforfatteren, og for vanlige brukere, Å gå inn på så mange detaljer kan virke overdrevent..

Læringskurven jevner seg ut når du forstår «hvorfor» bak nodene. Tenk på ComfyUI som et dashbord der du ser hele bildebanen: fra den første teksten og støyen i latent form, til den endelige dekodingen til piksler.

Installasjon fra bunnen av: raskt og problemfritt

Den mest direkte måten er å laste ned den offisielle pakken for systemet ditt, pakke den ut og kjøre den. Du trenger ikke å installere Python separat, siden det er innebygd., noe som reduserer den innledende friksjonen betraktelig.

Grunnleggende trinn: Last ned den komprimerte filen, pakk den ut (for eksempel med 7-Zip) og kjør oppstartsprogrammet som passer deg. Hvis du ikke har et GPU eller grafikkortet ditt ikke er kompatibelt, bruk den kjørbare CPU-filen.Det vil ta lengre tid, men det fungerer.

For å komme i gang, plasser minst én modell i kontrollpunktsmappen. Du kan få dem fra arkiver som Hugging Face eller Civitai og plasser dem i ComfyUI-modellbanen.

Hvis du allerede har et modellbibliotek i andre mapper, redigerer du filen med ekstra stier (extra_model_paths.yaml) ved å fjerne «example» fra navnet og legge til plasseringene dine. Start ComfyUI på nytt slik at den oppdager de nye mappene.

Grunnleggende kontroller og grensesnittelementer

På lerretet styres zoomen med musehjulet eller klypebevegelsen, og du blar ved å dra med venstre knapp. For å koble til noder, dra fra utgangskontakten til inngangskontakten., og slipp for å lage kanten.

ComfyUI administrerer en utførelseskø: konfigurer arbeidsflyten din og trykk på køknappen. Du kan sjekke statusen fra køvisningen for å se hva som kjører. eller hva han/hun forventer.

Eksklusivt innhold - Klikk her  FanControl starter ikke på Windows: den ultimate veiledningen for å fikse det

Nyttige snarveier: Ctrl+C/Ctrl+V for å kopiere/lime inn noder, Ctrl+Shift+V for å lime inn mens oppføringer vedlikeholdes, Ctrl+Enter for å sette i kø, Ctrl+M for å dempe en node. Klikk på prikken i øvre venstre hjørne for å minimere en node og tømme lerretet.

Fra tekst til bilde: den essensielle flyten

Minimumsflyten inkluderer lasting av kontrollpunktet, koding av den positive og negative prompten med CLIP, oppretting av et tomt latent bilde, sampling med KSampler og dekoding til piksler med VAE. Trykk på køknappen, så får du ditt første bilde.

Velg modellen i Lastekontrollpunkt

Noden Load Checkpoint returnerer tre komponenter: MODEL (støyprediktor), CLIP (tekstkoder) og VAE (bildekoder/dekoder). MODEL går til KSampler, CLIP til tekstnodene og VAE til dekoderen..

Positive og negative prompter med CLIP Text Encode

Skriv inn den positive ledeteksten ovenfor og den negative nedenfor; begge er kodet som innebygde elementer. Du kan vekte ord med syntaksen (ord:1.2) eller (ord:0.8) å forsterke eller myke opp spesifikke begreper.

Latente hulrom og optimale størrelser

Tomt latent bilde definerer lerretet i det latente rommet. For SD 1.5 anbefales 512×512 eller 768×768; for SDXL anbefales 1024×1024.Bredden og høyden må være multipler av 8 for å unngå feil og respektere arkitekturen.

VAE: fra latent til piksler

VAE komprimerer bilder til latente verdier og rekonstruerer dem til piksler. Ved tekst-til-bilde-konvertering brukes den vanligvis bare på slutten for å dekode den latente verdien. Kompresjon fremskynder prosessen, men kan føre til små tapTil gjengjeld tilbyr den fin kontroll i latent rom.

KSampler og nøkkelparametere

KSampler bruker omvendt diffusjon for å fjerne støy i henhold til veiledningen for innebygginger. Frø, trinn, prøvetaker, planlegger og støyfjerning Dette er hovedhjulene. Flere trinn gir vanligvis mer detaljer, og denoise=1 omskriver den opprinnelige støyen fullstendig.

Bilde for bilde: Gjør om med veiledning

I2i-flyten starter med et inndatabilde pluss dine instruksjoner; støyreduksjonen kontrollerer hvor mye den avviker fra originalen. Med lav støydemping får du subtile variasjoner; med høy støydemping får du dyptgående transformasjoner..

Typisk sekvens: velg kontrollpunktet, last inn bildet som input, juster ledetekster, definer støyfjerning i KSampler og sett i kø. Den er ideell for å forbedre komposisjoner eller migrere stiler uten å starte fra bunnen av..

SDXL på ComfyUI

ComfyUI tilbyr tidlig støtte for SDXL takket være den modulære designen. Bare bruk en SDXL-kompatibel flyt, sjekk ledetekstene og kjør den. Husk: større native størrelser krever mer VRAM og behandlingstid.Men det kvalitative spranget i detalj veier opp for det.

Innmaling: rediger bare det som interesserer deg

Når du vil endre bestemte områder av et bilde, er inpainting verktøyet du bør bruke. Last inn bildet, åpne maskeredigereren, mal det du vil regenerere, og lagre det på den tilhørende noden. Definer ledeteksten din for å veilede redigeringen og juster støydempingen (for eksempel 0.6).

Hvis du bruker en standardmodell, fungerer den med VAE Encode og Set Noise Latent Mask. For dedikerte inpainting-modeller, erstatt disse nodene med VAE Encode (Inpaint), som er optimalisert for den oppgaven.

Overmaling: forstørre kantene på lerretet

For å utvide et bilde utover grensene, legg til padding-noden for utmaling og konfigurer hvor mye hver side vokser. Feathering-parameteren jevner ut overgangen mellom original og utvidelse.

I outpainting-flyter justerer du VAE Encode (for Inpainting) og grow_mask_by-parameteren. En verdi høyere enn 10 gir vanligvis mer naturlige integrasjoner i det utvidede området.

Eksklusivt innhold - Klikk her  Microsoft Discovery AI driver vitenskapelige og pedagogiske gjennombrudd med personlig kunstig intelligens

Oppskaler i ComfyUI: piksel vs. latent

Det finnes to måter: pikseloppskalering (rask, uten å legge til ny informasjon) og latent oppskalering, også kalt Hi-res Latent Fix, som tolker detaljer på nytt ved skalering. Den første er rask; den andre beriker teksturer, men kan avvike.

Algoritmebasert oppskalering (piksel)

Med reskaleringsnoden etter metode kan du velge bikubisk, bilineær eller nærmeste eksakte og skalafaktoren. Den er ideell for forhåndsvisninger eller når du trenger fart. uten å legge til inferenskostnader.

Oppskaler med modell (piksel)

Bruk Load Upscale Model og den tilhørende oppskalernoden, velg en passende modell (f.eks. realistisk eller anime) og velg ×2 eller ×4. Spesialiserte modeller gjenskaper konturer og skarphet bedre enn klassiske algoritmer.

Oppskaler i latent

Skaler det latente og resampler med KSampler for å legge til detaljer som er i samsvar med ledeteksten. Det er tregere, men spesielt nyttig når du vil oppnå oppløsning og visuell kompleksitet..

ControlNet: Avansert strukturell guide

ControlNet lar deg injisere referansekart (kanter, positur, dybde, segmentering) for å veilede komposisjonen. Kombinert med stabil diffusjon gir det deg fin kontroll over strukturen. uten å ofre modellens kreativitet.

I ComfyUI er integrasjonen modulær: du laster inn ønsket kart, kobler det til ControlNet-blokken og lenker det til sampleren. Prøv forskjellige kontrollere for å se hvilken som passer din stil og formål..

ComfyUI-administrator: Terminalløse tilpassede noder

Med administratoren kan du installere og oppdatere egendefinerte noder fra grensesnittet. Du finner den i kømenyen. Det er den enkleste måten å holde nodeøkosystemet ditt oppdatert.

Installer manglende noder

Hvis en arbeidsflyt varsler deg om manglende noder, åpner du Behandler, klikker på Installer manglende noder, starter ComfyUI på nytt og oppdaterer nettleseren din. Dette løser de fleste avhengigheter med et par klikk..

Oppdater tilpassede noder

Fra administratoren, se etter oppdateringer, installer dem og klikk på oppdateringsknappen på hver tilgjengelige pakke. Start ComfyUI på nytt for å bruke endringene. og unngå uoverensstemmelser.

Last inn noder i flyten

Dobbeltklikk på et tomt område for å åpne nodesøkeren og skriv inn navnet på den du trenger. Slik setter du raskt inn nye deler i diagrammene dine.

Innebygginger (tekstinversjon)

Innebygginger injiserer trente konsepter eller stiler i ledetekstene dine ved hjelp av nøkkelordet embedding:name. Plasser filene i mappen models/embeddings slik at ComfyUI kan oppdage dem..

Hvis du installerer pakken med tilpassede skript, vil du ha autofullføring: begynn å skrive «embedding:», så ser du listen over tilgjengelige elementer. Dette øker iterasjonen betraktelig når man administrerer mange maler..

Du kan også vekte dem, for eksempel (embedding:Name:1.2) for å forsterke med 20 %. Juster vekten slik du ville gjort med vanlige promptvilkår å balansere stil og innhold.

LoRA: tilpasser stilen uten å berøre VAE

LoRA endrer MODEL- og CLIP-komponentene til kontrollpunktet, uten å endre VAE. De brukes til å injisere bestemte stiler, tegn eller objekter med lette og enkle filer å dele.

Grunnleggende flyt: Velg ditt basissjekkpunkt, legg til én eller flere LoRA-er, og generer. Du kan stable LoRA for å kombinere estetikk og effekter.justere intensiteten hvis arbeidsflyten tillater det.

Snarveier, triks og innebygde arbeidsflyter

I tillegg til snarveiene som er nevnt, finnes det to svært praktiske tips: fiks frøet når du justerer fjerne noder for å unngå å beregne hele kjeden på nytt, og bruk grupper for å flytte flere noder samtidig. Med Ctrl+dra kan du velge flere elementer og med Shift flytte gruppen..

Eksklusivt innhold - Klikk her  Alle måtene å slå av Windows 11 uten å åpne Start-menyen

En annen viktig funksjon: ComfyUI lagrer arbeidsflyten i metadataene til PNG-filen den genererer. Hvis du drar PNG-filen over på lerretet, hentes hele diagrammet med ett klikk.Dette gjør det enklere å dele og gjengi resultater.

ComfyUI online: lag uten å installere

Komfortabel

Hvis du ikke vil installere noe, finnes det skytjenester med forhåndskonfigurert ComfyUI, hundrevis av noder og populære modeller. De er ideelle for testing av SDXL, ControlNet eller komplekse arbeidsflyter uten å berøre PC-en., og mange inkluderer gallerier med ferdige arbeidsflyter.

Fra bunnen av til video: Wan 2.1 i ComfyUI

Noen tilpassede noder lar deg lage video fra tekst, konvertere et bilde til en sekvens eller redigere et eksisterende klipp. Med Wan 2.1-modeller kan du sette opp tekst-til-video-, bilde-til-video- og video-til-video-pipelines. direkte i ComfyUI.

Installer de nødvendige nodene (via administrator eller manuelt), last ned den tilhørende modellen og følg eksempelflyten: koder prompt- og bevegelsesparameterne, generer ramme-for-ramme-forsinkelser og dekoder deretter til rammer eller en videocontainer. Husk at kostnaden for tid og VRAM øker med oppløsning og varighet.

CPU vs. GPU: Hvilken ytelse kan man forvente

Den kan genereres ved hjelp av en CPU, men den er ikke ideell med tanke på hastighet. I tester i den virkelige verden kan en kraftig CPU ta flere minutter per bilde, mens med en passende GPU går prosessen ned til sekunder. Hvis du har en kompatibel GPU, bruk den for å øke ytelsen drastisk..

På CPU, reduser størrelse, trinn og nodekompleksitet; på GPU, juster batch og oppløsning i henhold til VRAM-en din. Overvåk forbruket for å unngå flaskehalser og uventede nedleggelser.

Tilpassede noder: manuell installasjon og beste praksis

Hvis du foretrekker den klassiske metoden, kan du klone repositorier i custom_nodes-mappen ved hjelp av git og deretter starte på nytt. Denne metoden gir deg fin kontroll over versjoner og grener.nyttig når du trenger spesifikke funksjoner.

Hold nodene dine organisert med regelmessige oppdateringer og kompatibilitetsnotater. Unngå å blande for mange eksperimentelle versjoner samtidig. for å unngå å introdusere feil som er vanskelige å spore.

Typisk feilsøking

Hvis «installer manglende noder» ikke reddet dagen, sjekk konsollen/loggen for den nøyaktige feilen: avhengigheter, stier eller versjoner. Sjekk at bredden og høyden er multipler av 8, og at malene er i de riktige mappene..

Når en arbeidsflyt ikke reagerer på modellvalg, gjenopprettes grafen vanligvis ved å tvinge frem lasting av et gyldig kontrollpunkt. Hvis en node slutter å virke etter oppdatering, kan du prøve å deaktivere pakken eller gå tilbake til en stabil versjon..

Faste frø, justerte størrelser og rimelige spørsmål gjør feilsøking enklere. Hvis resultatet forringes etter for mye tukling, gå tilbake til en grunnleggende forhåndsinnstilling og introduser endringene på nytt én om gangen..

For ytterligere hjelp er fellesskap som /r/StableDiffusion svært aktive og løser ofte sjeldne feil. Deling av logg, grafregistreringer og nodeversjoner øker støtten.

Alt det ovennevnte gir deg et komplett kart: du vet hva hver node er, hvordan de kobles sammen, hvor du skal plassere modellene og hva du skal berøre for å holde køen i gang. Med tekst-til-bilde-arbeidsflyter, i2i, SDXL, inn-/utmaling, oppskalering, ControlNet, innebygginger og LoRA, pluss video med WAN 2.1, har du et veldig seriøst produksjonssett. Klar til å vokse med deg. For mer informasjon, se ComfyUIs offisielle nettside.

stabil diffusjon
Relatert artikkel:
Hva betyr stabil diffusjon, og hva brukes det til?