Stabiilse difusiooni juhend 2024: piltide genereerimine tehisintellekti abil samm-sammult

Stable Diffusion on avatud lähtekoodiga mudel, mis võimaldab tehisintellekti abil tekstist realistlikke ja kunstilisi pilte genereerida.
Stable Diffusioni kasutamiseks on mitu võimalust: võrgus, lokaalselt installitud ja täiustatud valikud kohandatud laienduste ja mallidega.
Piltide kvaliteet sõltub suuresti sellest, kuidas ülesanded on kirjutatud ja kuidas nende sisemisi parameetreid on kohandatud.
Loomingulisi võimalusi laiendavad veelgi sellised täiustatud tööriistad nagu ControlNet, LoRA-d ja platvormi endasse sisseehitatud redigeerimistehnikad.

universum tehisintellekt on viimastel aastatel teinud tohutu hüppe edasi, võimaldades kõigil, olenemata nende tehnilistest teadmistest või kunstilisest kogemusest loo lihtsatest fraasidest silmapaistvaid pilte. Stabiilne difusioon, üks revolutsioonilisemaid ja tunnustatumaid arendusi generatiivse tehisintellekti valdkonnas, annab teie käsutusse võimsad tööriistad nii katsetada soovijatele kui ka disaini- ja illustratsiooniprofessionaalidele.

Selles juhendis räägime teile absoluutselt kõik stabiilse difusiooni kohta. Alates algajate esimestest sammudest kuni edasijõudnute käsurea ja redigeerimistehnikateni, sh soovitused tööriistade, mallide ja laienduste kohta, mis viivad teie loomingu järgmisele tasemele.

Mis on stabiilne difusioon ja miks see on pildistamist revolutsiooniliselt muutnud?

Stabiilne difusioon See on avatud lähtekoodiga tehisintellekti mudel, mis on süvaõppe tehnikate abil demokratiseerinud piltide loomist. Tänu oma uuenduslikule disainile, võimaldab teil lihtsa tekstikirjelduse (ülesande) teisendada uskumatuteks piltideks, detailne ja kvaliteetne. Kus iganes sa ka ei viibiks, saad selle mootorit tasuta ära kasutada, paigaldada selle kuhu iganes soovid ja isegi vastavalt oma vajadustele uuendada, mis eristab seda teistest ärilistest ja suletud lahendustest.

Stabiilse difusiooni toimimine põhineb a-l difusioonimudelSee algab juhusliku müraga nagu surnud televiisor ja eemaldab selle müra mitme sammu ja teie teksti juhitud täiustuste abil, kuni see loob sidusa ja visuaalselt atraktiivse pildi.

See funktsioon muudab selle ideaalne valik kunstnikele, sisuloojatele, arendajatele ja kodukasutajatele kes tahavad minna kaugemale traditsioonilistest piltidest. See, et see on avatud lähtekoodiga, avab ukse lõpututele kohandamisvõimalustele, integreerimisele oma tööriistadega ja kohalikule genereerimisele, ilma et peaksite soovi korral tuginema kolmandate osapoolte serveritele või kuutasudele.

Mida saab stabiilse difusiooniga teha?

Stabiilse difusiooni rakendused ulatuvad enamasse kui lihtsalt tekstist pildi loomine. Tehisintellekt ei genereeri pilte ainult nullist, aga on võimeline ka:

Olemasolevate piltide muutmine: Saate üles laadida foto ja paluda sellel objekte lisada, detaile eemaldada või stiili muuta.
Ülevärvimine: laiendab teie kompositsiooni piire vihjetest, mille te ülesandes annate.
Spetsiifiliste alade täitmine (sissevärvimine): Muutke ainult osa valitud pildist, näiteks parandage kätt, muutke tausta või täiustage näoilmet.
Piltide teisendamine (img2img): Saate võrdluspildina kasutada päris pilti, et Stable Diffusion saaks seda teises stiilis ümber tõlgendada, valgustust või värve muuta...
Kunstistiilide ühendamine: See segab ühes ülesandes erinevaid tehnikaid ja viiteid (näiteks klassikaline kunst, anime, fotorealism jne).

Eksklusiivne sisu – klõpsake siin Kuidas SNP-faili avada

see mitmekülgsus mistõttu on see ideaalne kaaslane digitaalse loovuse, illustratsioonide, graafilise disaini ja isegi videomängude, turunduskampaaniate ressursside loomiseks või lihtsalt tehisintellekti piiride uurimiseks.

Kuidas stabiilne difusioon seespool toimib?

Stabiilne difusioon tekib miljonite subtiitritega piltide treenimine tänu suurtele andmekogumitele (näiteks LAION-5B), kus tehisintellekt õpib seostama tekstilisi mõisteid visuaalsete mustritega. Mudel kasutab nn. difusioonimudel: esmalt hävitab pildi, muutes selle müraks, ja seejärel õpib seda kasutaja sisestatud teksti põhjal nullist rekonstrueerima.

Igal sammul täpsustab mudel pilti, müra vähendamine ja detailide taseme suurendamine, kuni tulemus läheneb meie kirjeldatud stseenile. Lisaks võimaldab stabiilne hajumine teil teatud sõnade "kaalu" moduleerida, et seada esikohale (või nõrgendada) stseeni teatud elemente, manipuleerida stiilidega ja vältida soovimatuid tulemusi.

La projekti pidev areng ja selle avatus koodile on võimaldanud kogukonnal luua lugematul hulgal variante ja täiustusi, näiteks uusi mudeleid, stiile ja tehnikaid, et saavutada palju realistlikumaid või spetsiifilisemaid tulemusi.

Milliseid eeliseid pakub Stable Diffusion teiste tööriistade ees?

Stabiilse difusiooni peamine erinevus on selle tasuta ja avatud lähtekoodiga olemus. Erinevalt teistest mudelitest nagu MidJourney või DALL-E, saate seda oma arvutis käivitada, serveritesse installida, uusi asju proovida ja oma maitse järgi muuta. Muud märkimisväärsed eelised on järgmised:

Tasuta (välja arvatud premium-platvormidel)Enamikku veebiteenuseid ja kohalikku installi saate kasutada tasuta, välja arvatud juhul, kui valite premium-serverid või soovite juurdepääsu väga spetsiifilistele täiustatud funktsioonidele.
Privaatsus: Saate luua pilte süsteemist lahkumata, vältides probleeme pilveandmete või aeglase ühendusega.
Modulaarsus ja kohandamine: toetab lõputult kohandatud mudeleid, stiile, laiendusi ja kogukonna loodud ressursse.
Kvaliteet ja detailsus: Uusima põlvkonna mudelid (SDXL, Juggernaut, Realistic Vision jne) konkureerivad tasulise pilditöötlusega ja edestavad seda sageli.

Seda silmas pidades tuleb välja tuua ka mõned nõrkused või lahendamata probleemid. Eelkõige tuleb märkida, et stabiilne difusioon esitleb järsem õppimiskõver kui teistel lahendustel kaubanduslik.

Alustamine: kuidas stabiilset difusiooni lokaalselt installida ja seadistada

Stable Diffusioni arvutisse installimine on lihtsam, kui esmapilgul tundub, eriti populaarse liidesega. Automaatne 1111, mis on Windowsi jaoks protsessi võimalikult palju lihtsustanud.

Mine ametlikku repositooriumisse Automaatne 1111 GitHubis, otsi üles jaotis „varad” ja laadi alla installifail (.exe).
Käivitage allalaaditud fail. Installiprotsess võib teie arvuti kiirusest olenevalt võtta veidi aega.
Kui olete lõpetanud, on teie töölaual või sihtkaustas otsetee nimega „A1111 WebUI”. Topeltklõps avab brauseris graafilise liidese, mis on valmis loomise alustamiseks.
Soovitame lubada liidese ja laienduste automaatsed värskendused ning ka valiku „vähene videomälu maht”, kui teie arvuti pole eriti võimas.

Eksklusiivne sisu – klõpsake siin Perfokaardid Arvuti ajalugu

Kui kasutate Maci või Linuxit, on nende avatud lähtekoodiga repositooriumidest Stable Diffusioni installimiseks olemas spetsiaalsed juhendid.

Kuidas kirjutada Stable Diffusionis tõhusaid ülesandeid: struktuur, süntaks ja näpunäited

Teie piltide edu sõltub peaaegu täielikult ülesande sisust. Hea struktuur võimaldab teil saavutada professionaalseid tulemusi ja väga erinevad ebamääraste kirjeldustega genereeritutest.

Soovitatav viip peaks näitama:

Kujutise tüüp: fotograafia, joonistamine, illustratsioon, 3D-renderdamine jne.
Teema: Kes pildil esineb (inimene, loom, objekt...) koos kõigi soovitud üksikasjadega (vanus, etniline kuuluvus, ilme jne)
Toiming: mida see tüüp teeb.
Kontekst/stsenaarium: tegevuskoht, valgustus, aastaaeg, domineerivad värvid jne.
Modifikaatorid: maalimisstiil, objektiiv ja kaamera, kellaaeg, värvipalett, viidatud kunstnikud, resolutsioon, kvaliteet, eriefektid nagu bokeh, hägusus, tekstuur...

et negatiivsed vihjed, lisa lihtsalt kõik omadused, mida sa pildile EI soovi: „udune, koledus, deformeerunud käed, liiga palju sõrmi, tekst, vesimärgid, madal eraldusvõime, valed proportsioonid, sünge, duplikaat…“ ja kõik muu, mis sind tulemuses häirib.

Kuidas parandada stabiilse difusiooni juhiseid?

Parima tulemuse saavutamiseks järgige neid nõuandeid. Soovitav on raskusi ja programmeerimist õigesti reguleerida. Stabiilne hajumine võimaldab teil teatud sõnadele rohkem või vähem tähtsust omistada süntaksi kasutamine „sõna:tegur”. Mida kõrgem on sõna:tegur, seda asjakohasem on see termin; Sõna või mõiste kaalu suurendamiseks võite kasutada täiendavaid sulgusid.

Lisaks võimaldab süntaksipõhine viipaprogrammeerimine teil ideid või stiile ühes pildis kombineerida, pannes ülemineku ühelt kontseptsioonilt teisele teie määratletud samme järgima.

Kui oled hätta jäänud või otsid kiiret inspiratsiooni, siis platvormid nagu Lexica, Civitai või Stable Diffusioni enda PNG Info vahekaart võimaldavad sul lohistada tehisintellekti loodud pilte ja näha nende loomiseks kasutatud täpset viipa.

Parimad stabiilse difusiooni mudelid hüperrealistlike ja kunstiliste piltide jaoks

Stabiilse difusiooni universum on palju laiem kui selle põhimudelid. Praegu on saadaval hulgaliselt kohandatud mudeleid (kontrollpunkte), mis on kohandatud konkreetsetele stiilidele, näiteks fotorealism, anime, tehniline illustratsioon jne. Mõned kõige soovitatavamad ja populaarsemad on:

SD 1.5 mudelid:

Juggernaut Rborn: Spetsialist realistliku naha, eristatavate taustade ja loomulike värvide alal. Soojad, RAW-stiilis tulemused.
Realistlik visioon v5.1: Suurepärane portreede, emotsioonide ja näodetailide jäädvustamise oskus. Taustade ja teemade poolest väga tasakaalustatud.
Ma ei suuda uskuda, et see pole fotograafia: Mitmekülgne, suurepärane valgustuse ja nurkade poolest. Ideaalne portreede ja erinevate teemade pildistamiseks.
Foton V1: Tasakaal kvaliteedi ja mitmekülgsuse vahel, eriti inimteemade puhul.
Realistlik fotopank: Väga viimistletud, kataloogistiilis pildid ilma nahavigadeta.
aZovya fotoreal: Mitte nii tuntud, aga annab silmapaistvaid tulemusi ja seda saab kasutada tehnikate ühendamiseks teiste mudelitega.

Eksklusiivne sisu – klõpsake siin HDAT2: testige ja parandage kõvaketast

SDXL-i mudelid (uusim põlvkond):

Juggernaut XL (x): Filmiline kompositsioon, suurepärane portreede jäädvustamisel ja pikkade tekstide mõistmisel.
RealVisXL: Ületamatu realistlike ebatäiuste, tekstuuride ja toonimuutuste loomisel nahal.
TereMaailm XL v6.0: See toob kaasa analoogse lähenemise, head kereproportsioonid ja vintage-esteetika. Keerukamate viipade jaoks kasutage GPT4v sildistamist.
Erimainimised: PhotoPedia XL, Realism Engine SDXL, Fully Real XL (vähem ajakohane, aga siiski kehtiv).

Kõiki neid mudeleid saab tasuta alla laadida sellistest repositooriumidest nagu Civitaija asetage need lihtsalt sobivasse kausta, et need ilmuksid stabiilse levitamise liideses.

Kuidas paigaldada ja hallata kohandatud mudeleid Stable Diffusionis

Uue malli allalaadimine on sama lihtne kui:

Ligipääs repositooriumidele nagu Civitai ja filtreerimine „Kontrollpunktide” järgi.
Vali soovitud mudel (veendu, et sellel oleks turvalisuse suurendamiseks laiend .safetensor).
Laadige fail alla ja kopeerige see teele /stable-diffusion-webui/models/Stable-diffusion.
Taaskäivitage liides ja valige mudel paneelilt „Kontrollpunkt”.

Professionaalsed näpunäited tõeliselt vapustavate piltide saavutamiseks stabiilse hajutamisega

Stabiilse difusiooni valdamine hõlmab katsetamist, tulemustest õppimist ning oma tehnika ja kujutlusvõime lihvimist:

Mängi manustustega: Piltide esteetika täiustamiseks proovige mudeli loojate soovitatud manuseid (nt BadDream, UnrealisticDream, FastNegativeV2, JuggernautNegative-neg). Manustamine võimaldab teil kohandada selliseid omadusi nagu käed, silmad jne.
Kasutage näo detailide pikendusi: A1111 laiendus Adetailer või ComfyUI sõlm Face Detailer Pipe aitab teil saavutada nägude ja käte puhul veatuid tulemusi, mis on eriti kasulik realistlike portreede puhul.
ControlNets perfektsionistidele: Kui oled käte, pooside või kehadega nõudlik, uuri erinevaid ControlNeti tüüpe, et oma kompositsioone lihvida.
Katse-eksituse meetod: Ära oota, et esimene pilt oleks täiuslik; Peamine on itereerida, muuta juhiseid ja kohendada negatiive, kuni saavutatakse soovitud kvaliteet.
Pöörake tähelepanu korralduse struktuurile: Väldi vastuolusid (näiteks „pikad juuksed” ja „lühikesed juuksed” samas lauses) ja sea algusesse prioriteedid kontseptsioonidele, millel on lõpppildil suurem kaal.

Pärast seda stabiilse difusiooni võimaluste tutvustust on selge, et tehisintellekt muudab meie loomingulisust revolutsiooniliselt, katsetage ja muutke pilte üha üllatavamate, professionaalsemate ja loomulikumate tulemustega. Kui oled huvitatud digitaalsest loovusest, siis pole paremat aega tehisintellekti visuaalse genereerimise maailma avastamiseks: hea ülesande, õige tööriista ja vähese harjutamisega saab igaüks oma kujutluspildid ellu äratada, alates lihtsatest visanditest kuni hüperrealistlike kompositsioonideni, mis on professionaalsest fotograafiast eristamatud.

Daniel Terrasa

Toimetaja on spetsialiseerunud tehnoloogiale ja internetiprobleemidele, omades rohkem kui kümneaastast kogemust erinevates digitaalsetes meediates. Olen töötanud toimetajana ja sisuloojana e-kaubanduse, kommunikatsiooni, veebiturunduse ja reklaamiettevõtetes. Olen kirjutanud ka majanduse, rahanduse ja teiste sektorite veebisaitidele. Minu töö on ka minu kirg. Nüüd minu artiklite kaudu Tecnobits, püüan uurida kõiki uudiseid ja uusi võimalusi, mida tehnoloogiamaailm meile iga päev oma elu parandamiseks pakub.