- Stable Diffusion kode irekiko eredu bat da, testutik irudi errealistak eta artistikoak sortzeko aukera ematen duena IA erabiliz.
- Stable Diffusion erabiltzeko hainbat modu daude: linean, lokalean instalatuta eta aukera aurreratuak luzapen eta txantiloi pertsonalizatuekin.
- Irudien kalitatea, neurri handi batean, galderak nola idazten diren eta haien barne parametroak nola doitzen diren araberakoa da.
- Sormen aukerak are gehiago zabaltzen dira ControlNet, LoRAk eta plataforman bertan integratutako edizio teknikak bezalako tresna aurreratuekin.

-ren unibertsoa Inteligencia artifiziala aurrerapauso erraldoia eman du azken urteotan, edonori, bere ezagutza teknikoa edo esperientzia artistikoa edozein dela ere, aukera emanez Irudi deigarriak sortu esaldi sinpleetatik abiatuta. Difusio egonkorra, IA generatiboaren arloko garapen iraultzaile eta txalotuenetako batek, tresna indartsuak jartzen ditu eskura, bai esperimentatu nahi dutenentzat, bai diseinu eta ilustrazio profesionalentzat.
Gida honetan Difusio Egonkorrari buruzko guztia kontatzen dizugu. Hasiberrien lehen urratsetatik hasi eta edizio-teknika aurreratuetaraino, zure sorkuntzak hurrengo mailara eramango dituzten tresnen, txantiloien eta luzapenen gomendioak barne.
Zer da Difusio Egonkorra eta zergatik irauli du irudigintza?
Difusio egonkorra Ikaskuntza sakoneko teknikak erabiliz irudien sorkuntza demokratizatu duen kode irekiko adimen artifizialeko eredu bat da. Bere diseinu berritzaileari esker, testu-deskribapen sinple bat (gonbita) irudi sinestezinak bihurtzeko aukera ematen dizu, zehatza eta kalitate handikoa. Edonon zaudela ere, bere motorra aprobetxatu dezakezu ezer ordaindu gabe, nahi duzun lekuan instalatu eta zure beharretara egokitu ere egin dezakezu, eta horrek bereizten du beste irtenbide komertzial eta itxietatik.
Difusio Egonkorraren funtzionamendua honetan oinarritzen da: difusio ereduaTelebista itzali baten antzeko zarata ausazko batekin hasten da, eta, zure testuak gidatutako hainbat urrats eta fintze bidez, zarata hori ezabatzen du irudi koherente eta bisualki erakargarria sortu arte.
Ezaugarri honek bihurtzen du aukera aproposa artista, eduki sortzaile, garatzaile eta etxeko erabiltzaileentzat irudi tradizionaletatik haratago joan nahi dutenak. Kode irekikoa izateak pertsonalizazio amaigabeetarako, tresna jabedunekin integraziorako eta tokiko sorkuntzarako ateak irekitzen ditu, nahi izanez gero hirugarrenen zerbitzarien edo hileko kuoten menpe egon gabe.
Zer egin dezakezu Difusio Egonkorrarekin?
Difusio Egonkorreko aplikazioek testutik irudi bat sortzea baino haratago doaz. IA-k ez ditu irudiak hutsetik sortzen soilik, baina gai da, halaber:
- Editatu dauden irudiak: Argazki bat igo eta objektuak gehitzeko, xehetasunak kentzeko edo estiloa aldatzeko eska diezaiokezu.
- Gain-pintura: zure konposizioaren ertzak luzatzen ditu galderan ematen dituzun pistak erabiliz.
- Eremu espezifikoak betetzea (pintura berritzea): Hautatutako irudiaren zati bat bakarrik aldatu, hala nola, esku bat konpondu, atzeko planoa aldatu edo aurpegiaren adierazpena hobetu.
- Irudiak eraldatu (img2img): Benetako irudi bat erabil dezakezu erreferentzia gisa, Stable Diffusion-ek beste estilo batean berrinterpretatu dezan, argiztapena edo koloreak aldatu ahal izateko...
- Estilo artistikoak konbinatzea: Teknika eta erreferentzia desberdinak (adibidez, arte klasikoa, animea, fotorrealismoa, etab.) nahasten ditu proposamen bakarrean.
Hau aldakortasunari sormen digitalerako, ilustraziorako, diseinu grafikorako eta baita bideo-jokoetarako, marketin kanpainetarako edo, besterik gabe, IAren mugak esploratzen ondo pasatzeko baliabideak sortzeko ere lagun aproposa bihurtuz.
Nola funtzionatzen du Difusio Egonkorrak barnealdean?
Difusio egonkorra sortzen da milioika azpitituludun irudien entrenamendua datu-multzo handiei esker (LAION-5B bezalakoak), non IAk testu-kontzeptuak eredu bisualekin lotzen ikasten duen. Modeloak honela ezagutzen dena erabiltzen du difusio eredua: lehenik irudi bat suntsitzen du zarata bihurtuz, eta gero erabiltzaileak sartzen duen testuan oinarrituta hutsetik berreraikitzen ikasten du.
Urrats bakoitzean, modeloak irudia fintzen du, zarata murriztea eta xehetasun maila handitzea, emaitza deskribatu dugun eszenaren antzekoa izan arte. Gainera, Stable Diffusion-ek hitz batzuen "pisua" modulatzeko aukera ematen dizu eszenaren elementu espezifikoak lehenesteko (edo ahultzeko), estiloak manipulatzeko eta nahi ez diren emaitzak saihesteko.
La proiektuaren etengabeko bilakaera eta kodearekiko irekitasuna komunitateak aldaera eta hobekuntza ugari agertzea ahalbidetu dute, hala nola modelo, estilo eta teknika berriak, emaitza askoz errealistagoak edo zehatzagoak lortzeko.
Zer abantaila eskaintzen ditu Stable Diffusion-ek beste tresnekin alderatuta?
Difusio egonkorraren desberdintasun nagusia hau da: bere izaera libre eta irekia. MidJourney edo DALL-E bezalako beste modelo batzuek ez bezala, zure ordenagailuan exekutatu, zerbitzarietan instalatu, gauza berriak probatu eta gustura alda dezakezu. Beste abantaila aipagarri batzuk hauek dira:
- Doakoa (premium plataformetan izan ezik)Web zerbitzu gehienak eta tokiko instalazioa doan erabil ditzakezu, premium zerbitzariak aukeratzen ez badituzu edo funtzio aurreratu oso espezifikoetarako sarbidea nahi ez baduzu behintzat.
- Pribatutasuna: Irudiak sor ditzakezu sistema utzi gabe, hodeiko datuekin edo konexio motelekin arazoak saihestuz.
- Modularitatea eta pertsonalizazioa: eredu pertsonalizatu, estilo, luzapen eta komunitateak garatutako baliabide infinituak onartzen ditu.
- Kalitatea eta xehetasuna: Azken belaunaldiko modeloek (SDXL, Juggernaut, Realistic Vision, etab.) ordainpeko irudien ekoizpenaren aurka egiten dute, eta askotan gainditzen dute.
Hori kontuan hartuta, ahulgune edo konpondu gabeko arazo batzuk ere aipatu behar dira. Batez ere, kontuan izan behar da Difusio Egonkorrak aurkezten duela beste irtenbide batzuek baino ikaskuntza-kurba aldapatsuagoa komertziala.
Hasteko: Nola instalatu eta konfiguratu Stable Diffusion lokalki
Stable Diffusion zure ordenagailuan instalatzea uste baino errazagoa da, batez ere interfaze ezagunarekin 1111 automatikoa, eta horrek prozesua ahalik eta gehien sinplifikatu du Windows-entzat.
- Joan zaitez biltegi ofizialera 1111 automatikoa GitHub-en, bilatu “aktiboak” atala eta deskargatu instalatzailea (.exe).
- Exekutatu deskargatutako fitxategia. Instalazio prozesuak denbora pixka bat iraun dezake zure ordenagailuaren abiaduraren arabera.
- Amaitutakoan, “A1111 WebUI” izeneko lasterbide bat izango duzu mahaigainean edo helburuko karpeta batean. Klik bikoitza egitean interfaze grafikoa irekiko da zure arakatzailean, sortzen hasteko prest.
- Interfazearen eta luzapenen eguneratze automatikoak gaitzea gomendatzen dugu, baita "VRAM baxua" aukera ere zure ordenagailua oso indartsua ez bada.
Mac edo Linux erabiltzen ari bazara, Stable Diffusion instalatzeko gida espezifikoak daude haien kode irekiko biltegietatik.
Nola idatzi gonbidapen eraginkorrak Stable Diffusion-en: egitura, sintaxia eta aholkuak
Zure irudien arrakasta ia erabat eskaeraren araberakoa da. Egitura on batek emaitza profesionalak lortzeko aukera emango dizu eta deskribapen lausoekin sortutakoetatik oso desberdinak.
Gomendatutako gonbidapen batek honako hau adierazi beharko luke:
- Irudi mota: argazkilaritza, marrazkia, ilustrazioa, 3D errenderizazioa, etab.
- Gaia: Irudian agertzen dena (pertsona, animalia, objektua…), nahi dituzun xehetasun guztiekin (adina, etnia, espresioa, etab.)
- Ekintza: Zer egiten ari da tipo hori?
- Testuingurua/eszenatokia: eszena non gertatzen den, argiztapena, urteko garaia, kolore nagusiak, etab.
- Aldatzaileak: margotzeko estiloa, lentea eta kamera, eguneko ordua, kolore paleta, erreferentziazko artistak, bereizmena, kalitatea, bokeh bezalako efektu bereziak, lausotzea, testuratzea...
For iragarki negatiboak, gehitu irudian NAHI EZ dituzun ezaugarri guztiak: "esku lausoak, itsusiak, deformatuak, hatz gehiegi, testua, ur-markak, bereizmen baxua, proportzio okerrak, morbosoa, bikoiztua..." eta emaitzan gogaitzen zaituen beste edozer.
Nola hobetu galderak Stable Diffusion-en?
Emaitza onenak lortzeko, jarraitu aholku hauek. Pisuak eta programazioa behar bezala doitzea komeni da. Difusio Egonkorrak hitz batzuei garrantzi handiagoa edo txikiagoa emateko aukera ematen dizu sintaxia erabiliz. "hitza:faktorea". Zenbat eta handiagoa izan hitza:factor, orduan eta garrantzitsuagoa izango da terminoa; Parentesi gehigarriak erabil ditzakezu hitz edo kontzeptu baten pisua areagotzeko.
Gainera, sintaxian oinarritutako gonbiteen programazioak ideiak edo estiloak irudi bakar batean konbinatzeko aukera ematen dizu, kontzeptu batetik bestera igarotzea zuk definitutako urratsak jarraituz.
Trabatuta bazaude edo inspirazio azkar baten bila bazabiltza, Lexica, Civitai edo Stable Diffusion-en PNG Info fitxa propioak bezalako plataformek AI bidez sortutako irudiak arrastatu eta sortzeko erabilitako gonbidapen zehatza ikusteko aukera ematen dizute.
Irudi hiperrealista eta artistikoetarako Difusio Egonkorren eredu onenak
Difusio Egonkorraren unibertsoa bere oinarrizko ereduak baino askoz zabalagoa da. Gaur egun, estilo espezifikoetara egokitutako modelo pertsonalizatu (kontrol-puntu) ugari daude, hala nola fotorrealismoa, animea, ilustrazio teknikoa, etab. Gomendagarrienetako eta ezagunenetako batzuk hauek dira:
SD 1.5erako modeloak:
- Juggernaut Rborn: Azal errealistan, atzeko plano bereizietan eta kolore naturalean espezialista. Emaitza beroak, RAW estilokoak.
- Ikuspegi Errealista v5.1: Erretratuen, emozioen eta aurpegiko xehetasunen menderatze bikaina. Oso orekatua atzeko planoetan eta gaietan.
- Ezin dut sinetsi argazkilaritza ez dela: Polifazetikoa, bikaina argiztapenean eta angeluetan. Erretratuetarako eta hainbat gaitarako aproposa.
- Fotoi V1: Kalitatearen eta moldakortasunaren arteko oreka, batez ere gai humanoetarako.
- Argazki errealista: Oso irudi leunduak, katalogo estiloko irudiak, azaleko akatsik gabe.
- aZovya Fotoerreala: Ez da hain ezaguna, baina emaitza bikainak ematen ditu eta teknikak beste modelo batzuekin bat egiteko erabil daiteke.
SDXL modeloak (azken belaunaldia):
- Juggernaut XL (x): Konposizio zinematografikoa, erretratuetan bikaina eta agindu luzeak ulertzeko gai.
- RealVisXL: Azalean inperfekzio, ehundura eta tonu aldaketa errealistak sortzeko paregabea.
- KaixoMundua XL 6.0 bertsioa: Ikuspegi analogikoa, gorputz-proportzio ona eta estetika vintage bat dakartza. Erabili GPT4v etiketatzea eskaera sofistikatuagoetarako.
- Aipamen bereziak: PhotoPedia XL, Realism Engine SDXL, Fully Real XL (ez hain gaurkotua baina oraindik baliozkoa).
Modelo horiek guztiak doan deskargatu daitezke biltegietatik, hala nola Civitai, eta jarri itzazu dagokion karpetan Stable Diffusion interfazean agertzeko.
Nola instalatu eta kudeatu modelo pertsonalizatuak Stable Diffusion-en
Txantiloi berri bat deskargatzea bezain erraza da:
- Sartu Civitai bezalako biltegietara eta iragazi "Kontrol-puntuak" arabera.
- Aukeratu nahi duzun modeloa (ziurtatu .safetensor luzapena duela segurtasun gehigarrirako).
- Deskargatu fitxategia eta kopiatu /stable-diffusion-webui/models/Stable-diffusion bidera.
- Berrabiarazi interfazea eta hautatu modeloa "Kontrol-puntua" paneletik.
Irudi harrigarriak lortzeko aholku profesionalak Stable Diffusion-ekin
Difusio Egonkorra menderatzeak esperimentatzea, emaitzetatik ikastea eta teknika eta irudimena hobetzea dakar:
- Jolastu txertaketekin: Irudien estetika doitzeko, probatu modeloen sortzaileek gomendatutako txertatzeak (adibidez, BadDream, UnrealisticDream, FastNegativeV2, JuggernautNegative-neg). Txertatzeek eskuak, begiak eta abar bezalako ezaugarriak doitzeko aukera ematen dizute.
- Erabili aurpegiko xehetasunen luzapenak: A1111rako Adetailer luzapenak edo ComfyUI-ko Face Detailer Hodi nodoak aurpegietan eta eskuetan emaitza bikainak lortzen lagunduko dizute, batez ere erretratu errealistetarako erabilgarriak.
- Kontrol-sareak perfekzionistentzat: Eskuekin, jarrerekin edo gorputzekin zorrotza bazara, arakatu ControlNet mota desberdinak zure konposizioak doitzeko.
- Saiakera eta errorea: Ez espero lehenengo irudia perfektua izatea; Gakoa iteratzea, galderak aldatzea eta negatiboak doitzea da, nahi den kalitatea lortu arte.
- Jarri arreta gonbidapenaren egiturari: Saihestu kontraesanak (adibidez, “ile luzea” eta “ile motza” esaldi berean) eta lehenetsi kontzeptuak hasieran, azken irudian pisu handiagoa izango baitute.
Difusio Egonkorraren aukeren bira honen ondoren, argi dago IAk iraultza eragiten ari dela sortzeko dugun modua, esperimentatu eta irudiak eraldatu emaitza gero eta harrigarriagoak, profesionalagoak eta naturalagoak lortuz. Sormen digitalean interesa baduzu, ez dago une hoberik IA bidezko ikus-entzunezko sorkuntzaren mundua esploratzeko: gonbidapen on batekin, tresna egokiarekin eta praktika pixka batekin, edonork eman diezaieke bizia imajinatzen dituen irudiei, zirriborro soiletatik hasi eta argazkilaritza profesionaletik bereiztezinak diren konposizio hipererrealistetaraino.
Teknologia eta Interneteko gaietan espezializatutako editorea, hamar urte baino gehiagoko esperientziarekin euskarri digital ezberdinetan. Merkataritza elektroniko, komunikazio, online marketin eta publizitate enpresetarako editore eta eduki sortzaile gisa lan egin dut. Ekonomia, finantza eta beste sektore batzuetako webguneetan ere idatzi dut. Nire lana ere nire pasioa da. Orain, nire artikuluen bidez Tecnobits, teknologiaren munduak egunero gure bizitza hobetzeko eskaintzen dizkigun albiste eta aukera berri guztiak arakatzen saiatzen naiz.



