- Stable Diffusion — гэта мадэль з адкрытым зыходным кодам, якая дазваляе ствараць рэалістычныя і мастацкія выявы з тэксту з дапамогай штучнага інтэлекту.
- Існуе некалькі спосабаў выкарыстання Stable Diffusion: анлайн, лакальная ўстаноўка і пашыраныя варыянты з карыстальніцкімі пашырэннямі і шаблонамі.
- Якасць малюнкаў у значнай ступені залежыць ад таго, як напісаны падказкі і як настроены іх унутраныя параметры.
- Творчыя магчымасці яшчэ больш пашыраюцца дзякуючы перадавым інструментам, такім як ControlNet, LoRA і метадам рэдагавання, убудаваным у саму платформу.

Сусвет ст штучны інтэлект за апошнія гады зрабіў гіганцкі крок наперад, дазволіўшы кожнаму, незалежна ад тэхнічных ведаў ці мастацкага досведу стварайце яркія выявы з простых фраз. Стабільная дыфузія, адна з самых рэвалюцыйных і прызнаных распрацовак у галіне генератыўнага штучнага інтэлекту, дае вам магутныя інструменты пад рукой як для тых, хто хоча эксперыментаваць, так і для спецыялістаў па дызайне і ілюстрацыі.
У гэтым кіраўніцтве мы раскажам вам абсалютна ўсё пра стабільную дыфузію. Ад першых крокаў пачаткоўца да прасунутых метадаў рэдагавання і падказак, у тым ліку рэкамендацыі па інструментах, шаблонах і пашырэннях, якія дапамогуць вам вывесці свае творы на новы ўзровень.
Што такое стабільная дыфузія і чаму яна зрабіла рэвалюцыю ў візуалізацыі?
Стабільная дыфузія Гэта мадэль штучнага інтэлекту з адкрытым зыходным кодам, якая дэмакратызавала стварэнне малюнкаў з дапамогай метадаў глыбокага навучання. Дзякуючы свайму інавацыйнаму дызайну, дазваляе пераўтварыць простае тэкставае апісанне (падказку) у неверагодныя выявы, падрабязныя і высокай якасці. Дзе б вы ні знаходзіліся, вы можаце карыстацца яго рухавіком бясплатна, усталёўваць яго там, дзе вам зручней, і нават мадэрнізаваць у адпаведнасці са сваімі патрэбамі, што адрознівае яго ад іншых камерцыйных і закрытых рашэнняў.
Дзеянне стабільнай дыфузіі заснавана на мадэль дыфузііПачынаецца з выпадковага шуму, напрыклад, непрацуючага тэлевізара, і праз некалькі крокаў і ўдасканаленняў, кіруемых вашым тэкстам, гэты шум ліквідуецца, пакуль не ствараецца цэласны і візуальна прывабны вобраз.
Гэтая асаблівасць робіць яго ідэальны выбар для мастакоў, стваральнікаў кантэнту, распрацоўшчыкаў і хатніх карыстальнікаў якія жадаюць выйсці за рамкі традыцыйных вобразаў. Той факт, што гэта праграмнае забеспячэнне з адкрытым зыходным кодам, адкрывае дзверы для бясконцых налад, інтэграцыі з запатэнтаванымі інструментамі і лакальнай генерацыі, без залежнасці ад старонніх сервераў або штомесячнай платы, калі вы таго жадаеце.
Што можна зрабіць са стабільнай дыфузіяй?
Прыкладанні Stable Diffusion выходзяць за рамкі простага стварэння выявы з тэксту. Штучны інтэлект не проста генеруе выявы з нуля, але таксама здольны:
- Рэдагаваць існуючыя выявы: Вы можаце загрузіць фота і папрасіць яго дадаць аб'екты, выдаліць дэталі або змяніць стыль.
- Перафарбоўка: пашырае краю вашай кампазіцыі з падказак, якія вы даяце ў заданні.
- Запаўненне пэўных участкаў (інтрафарбоўка): Змяняйце толькі частку абранага малюнка, напрыклад, карэктуйце руку, змяняйце фон або падкрэслівайце выраз твару.
- Пераўтварэнне малюнкаў (img2img): Вы можаце выкарыстоўваць рэальны малюнак у якасці эталона, каб Stable Diffusion мог пераасэнсаваць яго ў іншым стылі, змяніць асвятленне або колеры...
- Спалучэнне мастацкіх стыляў: У адной задачы спалучаюцца розныя тэхнікі і спасылкі (напрыклад, класічнае мастацтва, анімэ, фотарэалізм і г.д.).
гэта універсальнасць што робіць яго ідэальным спадарожнікам для лічбавай творчасці, ілюстрацыі, графічнага дызайну і нават стварэння рэсурсаў для відэагульняў, маркетынгавых кампаній ці проста для задавальнення ад вывучэння межаў штучнага інтэлекту.
Як працуе стабільная дыфузія ўнутры?
Стабільная дыфузія ўзнікае з-за навучанне мільёнаў малюнкаў з подпісамі дзякуючы вялікім наборам дадзеных (напрыклад, LAION-5B), дзе штучны інтэлект вучыцца асацыяваць тэкставыя паняцці з візуальнымі шаблонамі. Мадэль выкарыстоўвае тое, што вядома як мадэль дыфузіі: спачатку знішчае выяву, ператвараючы яе ў шум, а затым вучыцца аднаўляць яе з нуля на аснове тэксту, які ўводзіць карыстальнік.
На кожным кроку мадэль удасканальвае выяву, зніжэнне шуму і павышэнне ўзроўню дэталізацыі, пакуль вынік не наблізіцца да апісанай намі сцэны. Акрамя таго, Stable Diffusion дазваляе мадуляваць «вагу» пэўных слоў, каб прыярытэтызаваць (ці аслабіць) пэўныя элементы сцэны, маніпуляваць стылямі і пазбегнуць непажаданых вынікаў.
La пастаянная эвалюцыя праекта і яго адкрытасць для кода дазволілі супольнасці з'явіцца незлічоным варыянтам і паляпшэнням, такім як новыя мадэлі, стылі і тэхнікі для дасягнення значна больш рэалістычных або канкрэтных вынікаў.
Якія перавагі прапануе Stable Diffusion перад іншымі інструментамі?
Асноўнае адрозненне стабільнай дыфузіі заключаецца ў яго бясплатны і адкрыты зыходны код. У адрозненне ад іншых мадэляў, такіх як MidJourney або DALL-E, вы можаце запускаць яго на ўласным кампутары, усталёўваць на серверах, спрабаваць новыя рэчы і змяняць яго па сваім гусце. Іншыя прыкметныя перавагі ўключаюць:
- Бясплатна (акрамя прэміум-платформаў)Вы можаце карыстацца большасцю вэб-сэрвісаў і лакальнай устаноўкай бясплатна, калі толькі вы не вылучыце прэміум-серверы або не хочаце атрымаць доступ да вельмі спецыфічных пашыраных функцый.
- Канфідэнцыяльнасць: Вы можаце ствараць выявы, не выходзячы з сістэмы, пазбягаючы праблем з воблачнымі дадзенымі або павольным падключэннем.
- Модульнасць і налада: падтрымлівае бясконцую колькасць карыстальніцкіх мадэляў, стыляў, пашырэнняў і рэсурсаў, распрацаваных супольнасцю.
- Якасць і дэталізацыя: Апошняе пакаленне мадэляў (SDXL, Juggernaut, Realistic Vision і г.д.) канкуруе з платнай вытворчасцю малюнкаў і часта пераўзыходзіць яе.
У святле гэтага неабходна таксама адзначыць некаторыя недахопы або нявырашаныя праблемы. Перш за ўсё, варта адзначыць, што стабільная дыфузія прадстаўляе больш крутая крывая навучання, чым у іншых рашэнняў рэкламныя ролікі.
Пачатак працы: як усталяваць і наладзіць Stable Diffusion лакальна
Усталяваць Stable Diffusion на кампутар прасцей, чым здаецца, асабліва з папулярным інтэрфейсам Аўтаматычная 1111, што максімальна спрасціла працэс для Windows.
- Перайдзіце ў афіцыйнае сховішча Аўтаматычны код 1111 на GitHub, знайдзіце раздзел «актывы» і запампуйце ўсталявальны файл (.exe).
- Запусціце спампаваны файл. Працэс усталёўкі можа заняць некаторы час у залежнасці ад хуткасці вашага кампутара.
- Пасля завяршэння на працоўным стале або ў тэчцы прызначэння з'явіцца ярлык пад назвай «A1111 WebUI». Падвойны клік адкрые графічны інтэрфейс у вашым браўзеры, гатовы да пачатку стварэння.
- Мы рэкамендуем уключыць аўтаматычныя абнаўленні інтэрфейсу і пашырэнняў, а таксама опцыю «нізкі аб'ём відэапамяці», калі ваш камп'ютар не вельмі магутны.
Калі вы карыстаецеся Mac або Linux, існуюць спецыяльныя інструкцыі па ўсталёўцы Stable Diffusion з іх рэпазіторыяў з адкрытым зыходным кодам.
Як пісаць эфектыўныя падказкі ў Stable Diffusion: структура, сінтаксіс і парады
Поспех вашых малюнкаў амаль цалкам залежыць ад падказкі. Добрая структура дазволіць вам дасягнуць прафесійных вынікаў і вельмі адрозніваюцца ад тых, што ствараюцца з расплывістымі апісаннямі.
Рэкамендаваная падказка павінна ўказваць:
- Тып выявы: фатаграфія, малюнак, ілюстрацыя, 3D-рэндэрынг і г.д.
- Тэма: Хто намаляваны на выяве (чалавек, жывёла, прадмет...), з усімі неабходнымі падрабязнасцямі (узрост, этнічная прыналежнасць, выраз твару і г.д.)
- Дзеянне: што робіць гэты хлопец.
- Кантэкст/сцэнар: месца дзеяння сцэны, асвятленне, пара года, пераважныя колеры і г.д.
- Мадыфікатары: стыль жывапісу, аб'ектыў і камера, час сутак, каляровая палітра, мастакі-рэферэнсы, дазвол, якасць, спецыяльныя эфекты, такія як боке, размыццё, тэкстураванне...
да адмоўныя падказкі, проста дадайце ўсе элементы, якія вы НЕ хочаце бачыць на выяве: «размытыя, непрыгожыя, дэфармаваныя рукі, занадта шмат пальцаў, тэкст, вадзяныя знакі, нізкае разрозненне, няправільныя прапорцыі, хваравітасць, дублікаты...» і ўсё астатняе, што вас турбуе ў выніку.
Як палепшыць падказкі ў Stable Diffusion?
Каб дасягнуць найлепшых вынікаў, прытрымлівайцеся гэтых парад. Пажадана правільна адрэгуляваць вагі і праграмаванне. Стабільная дыфузія дазваляе надаваць большую ці меншую важнасць пэўным словам з выкарыстаннем сінтаксісу «слова:фактар». Чым вышэйшы паказчык word:factor, тым больш рэлевантным будзе гэты тэрмін; Вы можаце выкарыстоўваць дадатковыя дужкі, каб яшчэ больш павялічыць вагу слова або паняцця.
Акрамя таго, праграмаванне з выкарыстаннем сінтаксісу дазваляе аб'ядноўваць ідэі або стылі ў адным малюнку, што дазваляе пераход ад адной канцэпцыі да іншай выконваць вызначаныя вамі крокі.
Калі вы затрымаліся або шукаеце хуткага натхнення, такія платформы, як Lexica, Civitai або ўласная ўкладка PNG Info ад Stable Diffusion, дазваляюць перацягваць выявы, створаныя штучным інтэлектам, і бачыць дакладную падказку, якая выкарыстоўвалася для іх стварэння.
Найлепшыя мадэлі стабільнай дыфузіі для гіперрэалістычных і мастацкіх малюнкаў
Сусвет стабільнай дыфузіі значна шырэйшы за свае асноўныя мадэлі. У цяперашні час існуе мноства карыстальніцкіх мадэляў (кантрольных пунктаў), адаптаваных да пэўных стыляў, такіх як фотарэалізм, анімэ, тэхнічная ілюстрацыя і г.д. Некаторыя з найбольш рэкамендаваных і папулярных:
Мадэлі для SD 1.5:
- Джагернаўт Рборн: Спецыяліст па рэалістычнай скуры, дыферэнцыяваным фону і натуральным колеры. Цёплыя вынікі ў стылі RAW.
- Рэалістычнае бачанне v5.1: Выдатнае валоданне партрэтамі, эмоцыямі і дэталямі твару. Вельмі збалансаваны па фонах і тэмах.
- Не магу паверыць, што гэта не фатаграфія: Універсальны, выдатна падыходзіць для асвятлення і ракурсаў. Ідэальна падыходзіць для партрэтаў і розных тэм.
- Фатон V1: Баланс паміж якасцю і ўніверсальнасцю, асабліва для чалавечых тэм.
- Рэалістычнае фота: Вельмі адшліфаваныя выявы ў стылі каталога без дэфектаў скуры.
- aZovya Фотарэалістыка: Не так вядомы, але дае выдатныя вынікі і можа быць выкарыстаны для аб'яднання метадаў з іншымі мадэлямі.
Мадэлі для SDXL (апошняга пакалення):
- Джагернаўт XL (x): Кінематаграфічная кампазіцыя, выдатная праца з партрэтамі і разуменне доўгіх падказак.
- RealVisXL: Непераўзыдзены ў стварэнні рэалістычных недахопаў, тэкстур і змен тону скуры.
- Прывітанне, свет XL, версія 6.0: Ён спалучае ў сабе аналагавы падыход, добрыя прапорцыі цела і вінтажную эстэтыку. Выкарыстоўвайце тэг GPT4v для больш складаных падказак.
- Ганаровыя згадкі: PhotoPedia XL, Realism Engine SDXL, Fully Real XL (менш актуальныя, але ўсё яшчэ актуальныя).
Усе гэтыя мадэлі можна бясплатна спампаваць з такіх рэпазітарыяў, як Чывітайі проста змясціце іх у адпаведную тэчку, каб яны з'явіліся ў інтэрфейсе Stable Diffusion.
Як усталёўваць і кіраваць карыстальніцкімі мадэлямі ў Stable Diffusion
Спампаваць новы шаблон гэтак жа проста, як:
- Атрымайце доступ да такіх рэпазіторыяў, як Civitai, і адфільтруйце па тэме «Кантрольныя пункты».
- Выберыце патрэбную мадэль (для дадатковай бяспекі пераканайцеся, што ў яе ёсць пашырэнне .safetensor).
- Спампуйце файл і скапіюйце яго па шляху /stable-diffusion-webui/models/Stable-diffusion.
- Перазапусціце інтэрфейс і абярыце мадэль на панэлі «Кантрольныя кропкі».
Парады прафесіяналаў для атрымання сапраўды ўзрушаючых здымкаў з дапамогай Stable Diffusion
Авалоданне стабільнай дыфузіяй прадугледжвае эксперыментаванне, вывучэнне вынікаў і адточванне тэхнікі і ўяўлення:
- Пагуляйце з убудовамі: Каб палепшыць эстэтыку вашых малюнкаў, паспрабуйце ўбудаванні, рэкамендаваныя стваральнікамі мадэляў (напрыклад, BadDream, UnrealisticDream, FastNegativeV2, JuggernautNegative-neg). Убудаванні дазваляюць карэктаваць такія функцыі, як рукі, вочы і г.д.
- Выкарыстоўвайце нарошчванне дэталяў для твару: Пашырэнне Adetailer для A1111 або вузел Face Detailer Pipe у ComfyUI дапамогуць вам дасягнуць бездакорных вынікаў на тварах і руках, асабліва карысных для рэалістычных партрэтаў.
- ControlNets для перфекцыяністаў: Калі вы патрабавальныя да рук, поз або цела, вывучыце розныя тыпы ControlNet для тонкай налады сваіх кампазіцый.
- Спроба і памылка: Не чакайце, што першы малюнак будзе ідэальным; Галоўнае — паўтараць, змяняць падказкі і карэктаваць негатывы, пакуль не будзе дасягнута патрэбная якасць.
- Звярніце ўвагу на структуру запыту: Пазбягайце супярэчнасцей (напрыклад, «доўгія валасы» і «кароткія валасы» ў адным сказе) і расстаўце прыярытэты паняццям з самага пачатку, якія будуць мець большую вагу ў канчатковым вобразе.
Пасля гэтага азнаямлення з магчымасцямі стабільнай дыфузіі становіцца зразумела, што штучны інтэлект рэвалюцыянізуе спосаб стварэння, эксперыментуйце і трансфармуйце выявы, каб атрымаць усё больш нечаканыя, прафесійныя і натуральныя вынікі. Калі вы зацікаўлены ў лічбавай творчасці, то самы час даследаваць свет візуальнай генерацыі з дапамогай штучнага інтэлекту: з добрай падказкай, патрэбным інструментам і невялікай практыкай кожны можа ўвасобіць у жыццё свае ўяўленні — ад простых эскізаў да гіперрэалістычных кампазіцый, якія немагчыма адрозніць ад прафесійнай фатаграфіі.
Рэдактар, які спецыялізуецца на тэхналогіях і пытаннях Інтэрнэту з больш чым дзесяцігадовым вопытам работы ў розных лічбавых медыя. Я працаваў рэдактарам і стваральнікам кантэнту для кампаній па электроннай камерцыі, камунікацыі, інтэрнэт-маркетынгу і рэкламе. Я таксама пісаў на вэб-сайтах па эканоміцы, фінансах і іншых галінах. Мая праца таксама маё захапленне. Цяпер праз мае артыкулы ў Tecnobits, я стараюся даследаваць усе навіны і новыя магчымасці, якія кожны дзень прапануе нам свет тэхналогій, каб палепшыць наша жыццё.



