- Stable Diffusion-ը բաց կոդով մոդել է, որը թույլ է տալիս արհեստական բանականության միջոցով տեքստից ստեղծել իրատեսական և գեղարվեստական պատկերներ։
- Կայուն դիֆուզիան օգտագործելու մի քանի եղանակ կա՝ առցանց, տեղական տեղադրման և առաջադեմ տարբերակներով՝ հատուկ ընդլայնումներով և ձևանմուշներով։
- Պատկերների որակը մեծապես կախված է նրանից, թե ինչպես են գրվում հուշումները և ինչպես են կարգավորվում դրանց ներքին պարամետրերը։
- Ստեղծագործական հնարավորությունները հետագայում ընդլայնվում են առաջադեմ գործիքներով, ինչպիսիք են ControlNet-ը, LoRA-ները և հարթակում ներկառուցված խմբագրման տեխնիկաները։

-ի տիեզերքը արհեստական հետախուզություն վերջին տարիներին հսկայական առաջընթաց է գրանցել՝ թույլ տալով յուրաքանչյուրին, անկախ իր տեխնիկական գիտելիքներից կամ գեղարվեստական փորձից, Ստեղծեք տպավորիչ պատկերներ պարզ արտահայտություններից. Կայուն դիֆուզիոն, որը գեներատիվ արհեստական բանականության ոլորտի ամենահեղափոխական և ճանաչված զարգացումներից մեկն է, ձեր մատների տակ է դնում հզոր գործիքներ՝ թե՛ փորձարկումներ ցանկացողների, թե՛ դիզայնի և նկարազարդման մասնագետների համար։
Այս ուղեցույցում մենք ձեզ կպատմենք ամեն ինչ կայուն դիֆուզիայի մասին։ Սկսնակի առաջին քայլերից մինչև առաջադեմ հուշումներ և խմբագրման տեխնիկա, ներառյալ գործիքների, ձևանմուշների և ընդլայնումների առաջարկություններ, որոնք ձեր ստեղծագործությունները կբարձրացնեն հաջորդ մակարդակի։
Ի՞նչ է կայուն դիֆուզիան և ինչո՞ւ է այն հեղափոխություն մտցրել պատկերագրության մեջ։
Կայուն դիֆուզիոն Այն բաց կոդով արհեստական բանականության մոդել է, որը ժողովրդավարացրել է պատկերի ստեղծումը՝ օգտագործելով խորը ուսուցման տեխնիկաներ։ Իր նորարարական դիզայնի շնորհիվ, թույլ է տալիս պարզ տեքստային նկարագրությունը (հուշումը) վերածել անհավանական պատկերների, մանրամասն և բարձր որակով։ Որտեղ էլ որ լինեք, կարող եք օգտվել դրա շարժիչից՝ առանց որևէ բան վճարելու, տեղադրել այն ձեր նախընտրած տեղում և նույնիսկ արդիականացնել այն՝ ձեր կարիքներին համապատասխան, ինչը այն տարբերակում է այլ առևտրային և փակ լուծումներից։
Կայուն դիֆուզիայի գործողությունը հիմնված է դիֆուզիոն մոդելԱյն սկսվում է պատահական աղմուկից, ինչպես մեռած հեռուստացույցը, և ձեր տեքստով ուղղորդվող բազմաթիվ քայլերի և կատարելագործումների միջոցով վերացնում է այդ աղմուկը մինչև այն ստեղծի ամբողջական և տեսողականորեն գրավիչ պատկեր։
Այս առանձնահատկությունը այն դարձնում է իդեալական ընտրություն արվեստագետների, բովանդակության ստեղծողների, մշակողների և տնային օգտագործողների համար ովքեր ցանկանում են անցնել ավանդական պատկերների սահմաններից այն կողմ։ Այն փաստը, որ այն բաց կոդով է, բացում է դուռը անվերջ հարմարեցումների, ձեր սեփական գործիքների հետ ինտեգրման և տեղական ստեղծման համար՝ առանց հույսը դնելու երրորդ կողմի սերվերների կամ ամսական վճարների վրա, եթե դուք այդպես եք ցանկանում։
Ի՞նչ կարող եք անել կայուն դիֆուզիայի հետ։
Stable Diffusion հավելվածները գերազանցում են պարզապես տեքստից պատկեր ստեղծելը։ Արհեստական բանականությունը պարզապես պատկերներ չի ստեղծում զրոյից, բայց նաև ունակ է.
- Խմբագրել առկա պատկերները՝ Կարող եք վերբեռնել լուսանկար և խնդրել, որ այն ավելացնի առարկաներ, հեռացնի մանրամասներ կամ փոխի ոճը։
- Արտաքին ներկում: ընդլայնում է ձեր կոմպոզիցիայի եզրերը՝ հիմնվելով հուշումում տրված հուշումների վրա։
- Հատուկ տարածքների լրացում (ներկում): Փոփոխեք ընտրված պատկերի միայն մի մասը, օրինակ՝ շտկեք ձեռքը, փոխեք ֆոնը կամ բարելավեք դեմքի արտահայտությունը։
- Պատկերների փոխակերպում (img2img): Դուք կարող եք օգտագործել իրական պատկերը որպես հղում, որպեսզի Stable Diffusion-ը կարողանա վերամեկնաբանել այն այլ ոճով, փոխել լուսավորությունը կամ գույները...
- Արվեստի ոճերի համադրություն. Այն մեկ հուշման մեջ համատեղում է տարբեր տեխնիկաներ և հղումներ (օրինակ՝ դասական արվեստ, անիմե, ֆոտոռեալիզմ և այլն):
Այս բազմակողմանիություն ինչը այն դարձնում է թվային ստեղծագործականության, նկարազարդման, գրաֆիկական դիզայնի և նույնիսկ տեսախաղերի, մարքեթինգային արշավների համար ռեսուրսներ ստեղծելու կամ պարզապես արհեստական բանականության սահմանները ուսումնասիրելով զվարճանալու իդեալական ուղեկից։
Ինչպե՞ս է կայուն դիֆուզիան աշխատում ներսից։
Կայուն դիֆուզիան առաջանում է միլիոնավոր ենթագրերով պատկերների ուսուցում շնորհիվ մեծ տվյալների հավաքածուների (օրինակ՝ LAION-5B), որտեղ արհեստական բանականությունը սովորում է կապել տեքստային հասկացությունները տեսողական նախշերի հետ։ Մոդելը օգտագործում է այսպես կոչված դիֆուզիոն մոդելնախ ոչնչացնում է պատկերը՝ այն վերածելով աղմուկի, ապա սովորում է այն վերականգնել զրոյից՝ հիմնվելով օգտատիրոջ մուտքագրած տեքստի վրա։
Յուրաքանչյուր քայլում մոդելը կատարելագործում է պատկերը, աղմուկի նվազեցում և մանրամասնության մակարդակի բարձրացում, մինչև արդյունքը մոտենա մեր նկարագրած տեսարանին։ Բացի այդ, Stable Diffusion-ը թույլ է տալիս մոդուլացնել որոշակի բառերի «կշիռը»՝ տեսարանի որոշակի տարրերին առաջնահերթություն տալու (կամ թուլացնելու), ոճերը մանիպուլացնելու և անցանկալի արդյունքներից խուսափելու համար։
La նախագծի անընդհատ զարգացումը և դրա բացությունը կոդի նկատմամբ թույլ են տվել համայնքի կողմից անթիվ տարբերակների և բարելավումների ի հայտ գալ, ինչպիսիք են նոր մոդելները, ոճերը և տեխնիկաները՝ շատ ավելի իրատեսական կամ կոնկրետ արդյունքների հասնելու համար։
Ի՞նչ առավելություններ է առաջարկում Stable Diffusion-ը մյուս գործիքների համեմատ։
Կայուն դիֆուզիայի հիմնական տարբերությունն այն է, որ դրա անվճար և բաց կոդով բնույթը. Ի տարբերություն այլ մոդելների, ինչպիսիք են MidJourney-ն կամ DALL-E-ն, դուք կարող եք այն գործարկել ձեր սեփական համակարգչում, տեղադրել այն սերվերների վրա, փորձել նոր բաներ և փոփոխել այն ձեր ճաշակով։ Այլ նշանակալի առավելություններից են՝
- Անվճար (բացառությամբ պրեմիում հարթակների)Դուք կարող եք անվճար օգտագործել վեբ ծառայությունների մեծ մասը և տեղական տեղադրումը, եթե չեք ընտրում պրեմիում սերվերներ կամ չեք ցանկանում օգտվել շատ կոնկրետ առաջադեմ գործառույթներից։
- Գաղտնիություն Դուք կարող եք պատկերներ ստեղծել առանց ձեր համակարգը լքելու՝ խուսափելով ամպային տվյալների կամ դանդաղ կապի հետ կապված խնդիրներից։
- Մոդուլայինություն և հարմարեցում. աջակցում է անսահմանափակ թվով անհատական մոդելներ, ոճեր, ընդլայնումներ և համայնքի կողմից մշակված ռեսուրսներ։
- Որակ և մանրամասնություն. Վերջին սերնդի մոդելները (SDXL, Juggernaut, Realistic Vision և այլն) մրցակցում են և հաճախ գերազանցում վճարովի պատկերի արտադրությանը։
Հաշվի առնելով սա՝ պետք է նշել նաև որոշ թույլ կողմեր կամ առկախված խնդիրներ։ Ամենից առաջ պետք է նշել, որ կայուն դիֆուզիան ներկայացնում է ավելի կտրուկ ուսուցման կոր, քան մյուս լուծումները գովազդային հոլովակներ։
Սկսնակների համար. Ինչպես տեղադրել և կարգավորել կայուն դիֆուզիան տեղական մակարդակով
Stable Diffusion-ը համակարգչում տեղադրելն ավելի հեշտ է, քան թվում է, հատկապես հանրաճանաչ ինտերֆեյսի դեպքում։ Ավտոմատ 1111, որը Windows-ի համար գործընթացը հնարավորինս պարզեցրել է։
- Անցեք պաշտոնական պահոց՝ Ավտոմատ 1111 GitHub-ում, փնտրեք «ակտիվներ» բաժինը և ներբեռնեք տեղադրիչը (.exe):
- Գործարկեք ներբեռնված ֆայլը։ Տեղադրման գործընթացը կարող է որոշ ժամանակ տևել՝ կախված ձեր համակարգչի արագությունից։
- Ավարտելուց հետո ձեր աշխատասեղանին կամ նպատակակետային թղթապանակում կունենաք «A1111 WebUI» անունով կարճուղի։ Կրկնակի սեղմումը կբացի ձեր զննարկչի գրաֆիկական ինտերֆեյսը, որը պատրաստ է սկսել ստեղծելը։
- Խորհուրդ ենք տալիս միացնել ինտերֆեյսի և ընդլայնումների ավտոմատ թարմացումները, ինչպես նաև «ցածր VRAM» տարբերակը, եթե ձեր համակարգիչը շատ հզոր չէ։
Եթե օգտագործում եք Mac կամ Linux, կան հատուկ ուղեցույցներ Stable Diffusion-ը նրանց բաց կոդով պահոցներից տեղադրելու համար։
Ինչպես գրել արդյունավետ հուշումներ Stable Diffusion-ում. կառուցվածք, շարահյուսություն և խորհուրդներ
Ձեր պատկերների հաջողությունը գրեթե ամբողջությամբ կախված է հուշումից։ Լավ կառուցվածքը թույլ կտա ձեզ հասնել պրոֆեսիոնալ արդյունքների և շատ տարբեր են անորոշ նկարագրություններով ստեղծվածներից։
Առաջարկվող հարցաթերթիկը պետք է նշի.
- Պատկերի տեսակը՝ լուսանկարչություն, նկարչություն, նկարազարդում, եռաչափ ռենդերինգ և այլն։
- Թեմա՝ Ո՞վ է պատկերված պատկերում (մարդ, կենդանի, առարկա…), բոլոր անհրաժեշտ մանրամասներով (տարիք, ազգություն, դեմքի արտահայտություն և այլն):
- Գործողություն. ինչ է անում այդ տղան։
- Համատեքստ/սցենար՝ որտեղ է տեղի ունենում տեսարանը, լուսավորությունը, տարվա եղանակը, գերիշխող գույները և այլն։
- Փոփոխիչներ՝ նկարչության ոճ, օբյեկտիվ և տեսախցիկ, օրվա ժամ, գունային պալիտրա, հղումներ կատարող նկարիչներ, լուծաչափ, որակ, հատուկ էֆեկտներ, ինչպիսիք են բոքեն, մշուշոտումը, տեքստուրավորումը...
դեպի բացասական հուշումներ, պարզապես ավելացրեք բոլոր այն հատկանիշները, որոնք ՉԵՔ ուզում, որ պատկերում լինեն. «մշուշոտ, տգեղ, դեֆորմացված ձեռքեր, չափազանց շատ մատներ, տեքստ, ջրանիշեր, ցածր լուծաչափ, սխալ համամասնություններ, հիվանդագին, կրկնօրինակ…» և արդյունքի մեջ ձեզ անհանգստացնող ցանկացած այլ բան։
Ինչպե՞ս բարելավել հուշումները կայուն դիֆուզիայում։
Լավագույն արդյունքի հասնելու համար հետևեք այս խորհուրդներին։ Խորհուրդ է տրվում ճիշտ կարգավորել կշիռները և ծրագրավորումը։ Կայուն դիֆուզիան թույլ է տալիս որոշակի բառերին ավելի կամ պակաս կարևորություն տալ օգտագործելով շարահյուսություն «բառ՝ գործոն». Որքան բարձր է word:factor-ը, այնքան ավելի տեղին կլինի այդ տերմինը։ Դուք կարող եք օգտագործել լրացուցիչ փակագծեր՝ բառի կամ հասկացության կշիռն էլ ավելի մեծացնելու համար։
Բացի այդ, շարահյուսական հուշումների ծրագրավորումը թույլ է տալիս համատեղել գաղափարները կամ ոճերը մեկ պատկերի մեջ, կատարելով անցում մեկ հայեցակարգից մյուսին՝ հետևելով ձեր սահմանած քայլերին։
Եթե դժվարանում եք գտնել կամ արագ ոգեշնչում եք փնտրում, Lexica-ի, Civitai-ի կամ Stable Diffusion-ի սեփական PNG Info ներդիրի նման հարթակները թույլ են տալիս քաշել արհեստական բանականության կողմից ստեղծված պատկերները և տեսնել դրանք ստեղծելու համար օգտագործված ճշգրիտ հուշումը։
Հիպերռեալիստական և գեղարվեստական պատկերների համար լավագույն կայուն դիֆուզիոն մոդելները
Կայուն դիֆուզիոն տիեզերքը շատ ավելի լայն է, քան իր հիմնական մոդելները։ Ներկայումս կան բազմաթիվ անհատական մոդելներ (ստուգիչ կետեր), որոնք հարմարեցված են որոշակի ոճերի, ինչպիսիք են ֆոտոռեալիզմը, անիմեն, տեխնիկական նկարազարդումը և այլն։ Առավել առաջարկվող և տարածվածներից մի քանիսն են՝
SD 1.5-ի մոդելները՝
- Ջագգերնոտ Ռբորն. Իրատեսական մաշկի, տարբերակված ֆոնի և բնական գույների մասնագետ։ Ջերմ, RAW ոճի արդյունքներ։
- Իրատեսական տեսողություն v5.1: Դիմանկարների, հույզերի և դեմքի մանրամասների հիանալի տիրապետում։ Շատ հավասարակշռված ֆոնային պատկերներ և թեմաներ։
- Հավատս չի գալիս, որ սա լուսանկարչություն չէ. Բազմակողմանի, գերազանց լուսավորության և անկյունների առումով։ Հարմար է դիմանկարների և տարբեր թեմաների համար։
- Ֆոտոն V1: Որակի և բազմակողմանիության միջև հավասարակշռություն, հատկապես մարդկային թեմաների համար։
- Իրատեսական արխիվային լուսանկար։ Շատ հղկված, կատալոգային ոճի պատկերներ՝ առանց մաշկի թերությունների։
- aZovya Photoreal: Այնքան էլ հայտնի չէ, բայց ապահովում է ակնառու արդյունքներ և կարող է օգտագործվել տեխնիկաները այլ մոդելների հետ համատեղելու համար։
SDXL-ի մոդելներ (վերջին սերունդ).
- Ջագգերնոտ XL (x): Կինեմատիկական կոմպոզիցիա, գերազանց դիմանկարներում և երկար հուշումները հասկանալու ունակություն։
- RealVisXL: Անգերազանցելի է մաշկի իրատեսական թերություններ, հյուսվածքներ և երանգի փոփոխություններ ստեղծելու հարցում։
- HelloWorld XL v6.0: Այն բերում է անալոգային մոտեցում, մարմնի լավ համամասնություններ և վինտաժային գեղագիտություն։ Ավելի բարդ հուշումների համար օգտագործեք GPT4v պիտակավորումը։
- Պատվարժան հիշատակումներ՝ PhotoPedia XL, Realism Engine SDXL, Fully Real XL (ավելի քիչ արդիական, բայց դեռևս վավեր):
Այս բոլոր մոդելները կարելի է անվճար ներբեռնել այնպիսի պահոցներից, ինչպիսիք են՝ Սիվիտայ, և պարզապես տեղադրեք դրանք համապատասխան թղթապանակում՝ Stable Diffusion ինտերֆեյսում հայտնվելու համար։
Ինչպես տեղադրել և կառավարել հատուկ մոդելները Stable Diffusion-ում
Նոր ձևանմուշ ներբեռնելը շատ պարզ է.
- Մուտք գործեք Civitai-ի նման պահոցներ և զտեք դրանք «Checkpoints»-ի միջոցով։
- Ընտրեք ձեզ անհրաժեշտ մոդելը (համոզվեք, որ այն ունի .safetensor ընդլայնում՝ լրացուցիչ անվտանգության համար):
- Ներբեռնեք ֆայլը և պատճենեք այն /stable-diffusion-webui/models/Stable-diffusion ուղու վրա։
- Վերագործարկեք ինտերֆեյսը և ընտրեք մոդելը «Checkpoint» վահանակից։
Մասնագիտական խորհուրդներ՝ կայուն դիֆուզիայի միջոցով իսկապես ապշեցուցիչ պատկերներ ստանալու համար
Կայուն դիֆուզիային տիրապետելը ներառում է փորձարկումներ, արդյունքներից դասեր քաղել և կատարելագործել ձեր տեխնիկան ու երևակայությունը։
- Խաղացեք ներդրված տարրերով. Ձեր պատկերների գեղագիտությունը կատարելագործելու համար փորձեք մոդելի ստեղծողների կողմից խորհուրդ տրված ներդրման տարբերակները (օրինակ՝ BadDream, UnrealisticDream, FastNegativeV2, JuggernautNegative-neg): Ներկառուցված տարրերը թույլ են տալիս կարգավորել այնպիսի գործառույթներ, ինչպիսիք են ձեռքերը, աչքերը և այլն:
- Օգտագործեք դեմքի մանրամասների ընդարձակումներ. A1111-ի Adetailer ընդլայնումը կամ ComfyUI-ի Face Detailer Pipe հանգույցը կօգնեն ձեզ հասնել անթերի արդյունքների դեմքերի և ձեռքերի վրա, հատկապես օգտակար է իրատեսական դիմանկարների համար։
- ControlNets պերֆեկցիոնիստների համար. Եթե պահանջկոտ եք ձեռքերի, դիրքերի կամ մարմինների հետ, ուսումնասիրեք ControlNet-ի տարբեր տեսակները՝ ձեր կոմպոզիցիաները կատարելագործելու համար:
- Փորձարկում և սխալ. Մի՛ սպասեք, որ առաջին պատկերը կատարյալ կլինի։ Հիմնականը կրկնելն է, հուշումները փոփոխելը և բացասականները կարգավորելը մինչև ցանկալի որակի հասնելը։
- Ուշադրություն դարձրեք հարցի կառուցվածքին. Խուսափեք հակասություններից (օրինակ՝ «երկար մազեր» և «կարճ մազեր» նույն նախադասության մեջ) և սկզբում առաջնահերթություն տվեք հասկացություններին, որոնք ավելի մեծ կշիռ կունենան վերջնական պատկերում։
Կայուն դիֆուզիայի հնարավորությունների այս շրջագայությունից հետո պարզ է դառնում, որ արհեստական բանականությունը հեղափոխություն է մտցնում մեր ստեղծագործելու ձևի մեջ, փորձարկեք և վերափոխեք պատկերները՝ ապահովելով ավելի ու ավելի զարմանալի, պրոֆեսիոնալ և բնական արդյունքներ. Եթե հետաքրքրված եք թվային ստեղծագործականությամբ, ապա արհեստական բանականության միջոցով տեսողական ստեղծման աշխարհն ուսումնասիրելու ավելի լավ ժամանակ չկա. լավ հուշումով, ճիշտ գործիքով և մի փոքր պրակտիկայով յուրաքանչյուրը կարող է կենդանություն հաղորդել իր պատկերացրած պատկերներին՝ պարզ ուրվագծերից մինչև հիպերռեալիստական կոմպոզիցիաներ, որոնք անբաժանելի են պրոֆեսիոնալ լուսանկարչությունից։
Խմբագիր, որը մասնագիտացած է տեխնոլոգիաների և ինտերնետի խնդիրների մեջ՝ տարբեր թվային լրատվամիջոցների ավելի քան տասը տարվա փորձով: Ես աշխատել եմ որպես խմբագիր և բովանդակության ստեղծող էլեկտրոնային առևտրի, հաղորդակցության, առցանց մարքեթինգի և գովազդային ընկերություններում: Ես գրել եմ նաև տնտեսագիտության, ֆինանսների և այլ ոլորտների կայքերում: Աշխատանքս նաև իմ կիրքն է։ Այժմ, իմ հոդվածների միջոցով Tecnobits, ես փորձում եմ ուսումնասիրել բոլոր նորությունները և նոր հնարավորությունները, որոնք մեզ ամեն օր առաջարկում է տեխնոլոգիաների աշխարհը՝ բարելավելու մեր կյանքը:



