- Stable Diffusion არის ღია კოდის მოდელი, რომელიც საშუალებას გაძლევთ ხელოვნური ინტელექტის გამოყენებით ტექსტიდან რეალისტური და მხატვრული გამოსახულებები გენერიროთ.
- სტაბილური დიფუზიის გამოყენების რამდენიმე გზა არსებობს: ონლაინ, ლოკალურად დაინსტალირებული და გაფართოებული ვარიანტები მორგებული გაფართოებებითა და შაბლონებით.
- სურათების ხარისხი დიდწილად დამოკიდებულია იმაზე, თუ როგორ არის დაწერილი მოთხოვნები და როგორ არის მორგებული მათი შიდა პარამეტრები.
- კრეატიული შესაძლებლობები კიდევ უფრო ფართოვდება ისეთი მოწინავე ინსტრუმენტებით, როგორიცაა ControlNet, LoRAs და თავად პლატფორმაში ჩაშენებული რედაქტირების ტექნიკები.

სამყარო ხელოვნური ინტელექტი ბოლო წლებში უზარმაზარი ნახტომი გააკეთა წინ, რაც ნებისმიერს საშუალებას აძლევს, მიუხედავად მათი ტექნიკური ცოდნისა თუ მხატვრული გამოცდილებისა, შექმენით შთამბეჭდავი სურათები მარტივი ფრაზებიდან. სტაბილური დიფუზია, გენერაციული ხელოვნური ინტელექტის სფეროში ერთ-ერთი ყველაზე რევოლუციური და აღიარებული მიღწევა, თქვენს ხელთაა მძლავრი ინსტრუმენტები, როგორც ექსპერიმენტების მსურველებისთვის, ასევე დიზაინისა და ილუსტრაციის პროფესიონალებისთვის.
ამ სახელმძღვანელოში ჩვენ აბსოლუტურად ყველაფერს გეტყვით სტაბილური დიფუზიის შესახებ. დამწყებთათვის პირველი ნაბიჯებიდან დაწყებული, მოწინავე ინსტრუქციებითა და რედაქტირების ტექნიკებით დამთავრებული, მათ შორის, რეკომენდაციებით ხელსაწყოების, შაბლონებისა და გაფართოებებისთვის, რომლებიც თქვენს შემოქმედებას ახალ დონეზე აიყვანს.
რა არის სტაბილური დიფუზია და რატომ მოახდინა მან რევოლუცია ვიზუალიზაციაში?
სტაბილური დიფუზია ეს არის ღია კოდის ხელოვნური ინტელექტის მოდელი, რომელმაც დემოკრატიზაცია მოახდინა სურათების შექმნისას ღრმა სწავლების ტექნიკის გამოყენებით. ინოვაციური დიზაინის წყალობით, საშუალებას გაძლევთ გადააკეთოთ მარტივი ტექსტური აღწერა (მოთხოვნა) წარმოუდგენელ სურათებად, დეტალური და მაღალი ხარისხის. სადაც არ უნდა იყოთ, შეგიძლიათ ისარგებლოთ მისი ძრავით ყოველგვარი გადახდის გარეშე, დააინსტალიროთ ის თქვენთვის სასურველ ადგილას და განაახლოთ ის თქვენი საჭიროებების შესაბამისად, რაც მას სხვა კომერციული და დახურული გადაწყვეტილებებისგან გამოარჩევს.
სტაბილური დიფუზიის მოქმედება ემყარება დიფუზიის მოდელიის იწყება შემთხვევითი ხმაურით, როგორიცაა გამორთული ტელევიზორი და, თქვენი ტექსტით ხელმძღვანელობით მრავალი ნაბიჯისა და დახვეწის გზით, აღმოფხვრის ამ ხმაურს მანამ, სანამ არ შექმნის თანმიმდევრულ და ვიზუალურად მიმზიდველ გამოსახულებას.
ეს თვისება მას იდეალური არჩევანია მხატვრებისთვის, კონტენტის შემქმნელებისთვის, დეველოპერებისთვის და სახლის მომხმარებლებისთვის ვისაც სურს ტრადიციული გამოსახულების მიღმა გასვლა. ის ფაქტი, რომ ის ღია კოდისაა, კარს უსასრულო პერსონალიზაციის, თქვენს საკუთარ ინსტრუმენტებთან ინტეგრაციისა და ლოკალური გენერაციისკენ უხსნის, მესამე მხარის სერვერებზე ან ყოველთვიურ გადასახადებზე დაყრდნობის გარეშე, თუ ასე გსურთ.
რა შეგიძლიათ გააკეთოთ სტაბილური დიფუზიის გამოყენებით?
სტაბილური დიფუზიის აპლიკაციები ტექსტიდან სურათის უბრალოდ შექმნას სცილდება. ხელოვნური ინტელექტი სურათებს ნულიდან არ წარმოქმნის, მაგრამ ასევე შეუძლია:
- არსებული სურათების რედაქტირება: შეგიძლიათ ატვირთოთ ფოტო და სთხოვოთ მას ობიექტების დამატება, დეტალების წაშლა ან სტილის შეცვლა.
- გარე შეღებვა: აფართოებს თქვენი კომპოზიციის კიდეებს მოთხოვნაში მოცემული მინიშნებებიდან.
- კონკრეტული უბნების შევსება (შეღებვა): შეცვალეთ თქვენს მიერ არჩეული სურათის მხოლოდ ნაწილი, მაგალითად, ხელის გასწორება, ფონის შეცვლა ან სახის გამომეტყველების გაძლიერება.
- სურათების ტრანსფორმაცია (img2img): შეგიძლიათ გამოიყენოთ რეალური სურათი, როგორც მითითება, რათა Stable Diffusion-მა შეძლოს მისი სხვა სტილში ინტერპრეტაცია, განათების ან ფერების შეცვლა...
- მხატვრული სტილის შერწყმა: ის ერთ ინსტრუქციაში აერთიანებს სხვადასხვა ტექნიკასა და მითითებებს (მაგალითად, კლასიკურ ხელოვნებას, ანიმეს, ფოტორეალიზმს და ა.შ.).
ეს მრავალფეროვნება რაც მას იდეალურ კომპანიონად აქცევს ციფრული შემოქმედების, ილუსტრაციის, გრაფიკული დიზაინისა და ვიდეო თამაშებისთვის, მარკეტინგული კამპანიებისთვის რესურსების გენერირებისთვისაც კი, ან უბრალოდ ხელოვნური ინტელექტის საზღვრების შესწავლით გართობისთვის.
როგორ მუშაობს სტაბილური დიფუზია შიგნით?
სტაბილური დიფუზია წარმოიშობა მილიონობით წარწერიანი სურათის ტრენინგი დიდი მონაცემთა ნაკრებების წყალობით (მაგალითად, LAION-5B), სადაც ხელოვნური ინტელექტი სწავლობს ტექსტური კონცეფციების ვიზუალურ ნიმუშებთან დაკავშირებას. მოდელი იყენებს ე.წ. დიფუზიის მოდელი: თავდაპირველად ანადგურებს გამოსახულებას ხმაურად გარდაქმნით და შემდეგ სწავლობს მის ნულიდან რეკონსტრუქციას მომხმარებლის მიერ შეყვანილი ტექსტის საფუძველზე.
თითოეულ ეტაპზე, მოდელი აზუსტებს გამოსახულებას, ხმაურის შემცირება და დეტალების დონის გაზრდა, სანამ შედეგი არ მიუახლოვდება ჩვენს მიერ აღწერილ სცენას. გარდა ამისა, სტაბილური დიფუზია საშუალებას გაძლევთ მოახდინოთ გარკვეული სიტყვების „წონის“ მოდულირება სცენის კონკრეტული ელემენტების პრიორიტეტულობის (ან შესუსტების), სტილების მანიპულირებისა და არასასურველი შედეგების თავიდან ასაცილებლად.
La პროექტის მუდმივი ევოლუცია და მისი ღიაობა კოდის მიმართ საზოგადოების მიერ უამრავი ვარიანტისა და გაუმჯობესების გაჩენის საშუალება მისცა, როგორიცაა ახალი მოდელები, სტილები და ტექნიკა გაცილებით რეალისტური ან კონკრეტული შედეგების მისაღწევად.
რა უპირატესობებს გვთავაზობს Stable Diffusion სხვა ინსტრუმენტებთან შედარებით?
სტაბილური დიფუზიის მთავარი განსხვავებაა მისი თავისუფალი და ღია კოდის ბუნება. სხვა მოდელებისგან განსხვავებით, როგორიცაა MidJourney ან DALL-E, შეგიძლიათ გაუშვათ ის თქვენს კომპიუტერზე, დააინსტალიროთ სერვერებზე, სცადოთ ახალი რამ და შეცვალოთ თქვენი გემოვნებით. სხვა აღსანიშნავი უპირატესობები მოიცავს:
- უფასო (პრემიუმ პლატფორმების გარდა)ვებ სერვისების უმეტესობა და ლოკალური ინსტალაცია უფასოდ შეგიძლიათ გამოიყენოთ, თუ არ აირჩევთ პრემიუმ სერვერებს ან არ გსურთ წვდომა ძალიან სპეციფიკურ გაფართოებულ ფუნქციებზე.
- კონფიდენციალურობა: შეგიძლიათ შექმნათ სურათები თქვენი სისტემიდან გაუსვლელად, რითაც თავიდან აიცილებთ ღრუბლოვან მონაცემებთან ან ნელ კავშირთან დაკავშირებულ პრობლემებს.
- მოდულარობა და პერსონალიზაცია: მხარს უჭერს უსასრულო რაოდენობის მორგებულ მოდელებს, სტილებს, გაფართოებებს და საზოგადოების მიერ შემუშავებულ რესურსებს.
- ხარისხი და დეტალები: მოდელების უახლესი თაობა (SDXL, Juggernaut, Realistic Vision და ა.შ.) კონკურენციას უწევს და ხშირად აღემატება ფასიან გამოსახულების წარმოებას.
ამის გათვალისწინებით, ასევე უნდა აღინიშნოს ზოგიერთი სისუსტე ან გადაუჭრელი საკითხი. უპირველეს ყოვლისა, უნდა აღინიშნოს, რომ სტაბილური დიფუზია წარმოადგენს უფრო ციცაბო სწავლის მრუდი, ვიდრე სხვა გადაწყვეტილებები რეკლამები.
დაწყება: როგორ დავაყენოთ და დავაკონფიგურიროთ სტაბილური დიფუზია ლოკალურად
Stable Diffusion-ის თქვენს კომპიუტერზე ინსტალაცია უფრო ადვილია, ვიდრე ერთი შეხედვით ჩანს, განსაკუთრებით პოპულარული ინტერფეისის გათვალისწინებით. ავტომატური 1111, რამაც Windows-ისთვის პროცესი მაქსიმალურად გაამარტივა.
- გადადით ოფიციალურ საცავში ავტომატური 1111 GitHub-ზე, მოძებნეთ „აქტივების“ განყოფილება და ჩამოტვირთეთ ინსტალატორი (.exe).
- გადმოწერილი ფაილი გაუშვით. ინსტალაციის პროცესს შეიძლება გარკვეული დრო დასჭირდეს თქვენი კომპიუტერის სიჩქარედან გამომდინარე.
- დასრულების შემდეგ, თქვენს სამუშაო მაგიდაზე ან დანიშნულების საქაღალდეში გამოჩნდება მალსახმობი სახელწოდებით „A1111 WebUI“. ორჯერ დაწკაპუნებით თქვენს ბრაუზერში გაიხსნება გრაფიკული ინტერფეისი, რომელიც მზად იქნება შექმნის დასაწყებად.
- გირჩევთ, ჩართოთ ინტერფეისისა და გაფართოებების ავტომატური განახლებები, ასევე „დაბალი VRAM“-ის ოფცია, თუ თქვენი კომპიუტერი არ არის ძალიან ძლიერი.
თუ Mac-ს ან Linux-ს იყენებთ, არსებობს კონკრეტული სახელმძღვანელოები Stable Diffusion-ის მათი ღია კოდის საცავებიდან ინსტალაციისთვის.
როგორ დავწეროთ ეფექტური მოთხოვნები სტაბილურ დიფუზიაში: სტრუქტურა, სინტაქსი და რჩევები
თქვენი სურათების წარმატება თითქმის მთლიანად დამოკიდებულია ინსტრუქციის სისწორეზე. კარგი სტრუქტურა საშუალებას მოგცემთ მიაღწიოთ პროფესიონალურ შედეგებს. და ძალიან განსხვავდება ბუნდოვანი აღწერილობებით გენერირებულისგან.
რეკომენდებული მოთხოვნა უნდა მიუთითებდეს:
- სურათის ტიპი: ფოტოგრაფია, ხატვა, ილუსტრაცია, 3D რენდერინგი და ა.შ.
- თემა: ვინ ჩანს გამოსახულებაზე (ადამიანი, ცხოველი, საგანი...), ყველა საჭირო დეტალით (ასაკი, ეთნიკური წარმომავლობა, გამომეტყველება და ა.შ.)
- მოქმედება: რას აკეთებს ის ბიჭი.
- კონტექსტი/სცენარი: ადგილი, სადაც მოქმედება ვითარდება, განათება, წელიწადის დრო, დომინანტური ფერები და ა.შ.
- მოდიფიკატორები: ხატვის სტილი, ობიექტივი და კამერა, დღის დრო, ფერთა პალიტრა, საცნობარო მხატვრები, გარჩევადობა, ხარისხი, სპეციალური ეფექტები, როგორიცაა ბოკე, დაბინდვა, ტექსტურიზაცია...
ამისთვის უარყოფითი მინიშნებები, უბრალოდ დაამატეთ ყველა ის მახასიათებელი, რაც არ გსურთ სურათში: „ბუნდოვანი, უშნო, დეფორმირებული ხელები, ძალიან ბევრი თითი, ტექსტი, წყლის ნიშნები, დაბალი გარჩევადობა, არასწორი პროპორციები, ავადმყოფური, დუბლიკატი...“ და ყველაფერი, რაც შედეგში გაწუხებთ.
როგორ გავაუმჯობესოთ მოთხოვნები სტაბილურ დიფუზიაში?
საუკეთესო შედეგის მისაღწევად, მიჰყევით ამ რჩევებს. მიზანშეწონილია წონისა და პროგრამირების სწორად რეგულირება. სტაბილური დიფუზია საშუალებას გაძლევთ, გარკვეულ სიტყვებს მეტი ან ნაკლები მნიშვნელობა მიანიჭოთ სინტაქსის გამოყენებით „სიტყვა: ფაქტორი“. რაც უფრო მაღალია სიტყვა:factor-ის მნიშვნელობა, მით უფრო აქტუალური იქნება ეს ტერმინი; სიტყვის ან კონცეფციის წონის კიდევ უფრო გასაზრდელად შეგიძლიათ გამოიყენოთ დამატებითი ფრჩხილები.
გარდა ამისა, სინტაქსზე დაფუძნებული სწრაფი პროგრამირება საშუალებას გაძლევთ გააერთიანოთ იდეები ან სტილები ერთ სურათში, რაც ერთი კონცეფციიდან მეორეზე გადასვლას თქვენს მიერ განსაზღვრული ნაბიჯების შესაბამისად განახორციელებს.
თუ გაიჭედეთ ან სწრაფ შთაგონებას ეძებთ, ისეთი პლატფორმები, როგორიცაა Lexica, Civitai ან Stable Diffusion-ის საკუთარი PNG Info ჩანართი, საშუალებას გაძლევთ გადაათრიოთ ხელოვნური ინტელექტის მიერ გენერირებული სურათები და ნახოთ მათი შესაქმნელად გამოყენებული ზუსტი მოთხოვნა.
ჰიპერრეალისტური და მხატვრული გამოსახულებების საუკეთესო სტაბილური დიფუზიის მოდელები
სტაბილური დიფუზიის სამყარო გაცილებით ფართოა, ვიდრე მისი ძირითადი მოდელები. ამჟამად არსებობს მრავალი მორგებული მოდელი (საკონტროლო პუნქტი), რომლებიც ადაპტირებულია კონკრეტულ სტილებთან, როგორიცაა ფოტორეალიზმი, ანიმე, ტექნიკური ილუსტრაცია და ა.შ. ზოგიერთი ყველაზე რეკომენდებული და პოპულარულია:
SD 1.5-ის მოდელები:
- ჯაგერნაუტ რბორნი: რეალისტური კანის, დიფერენცირებული ფონისა და ბუნებრივი ფერის სპეციალისტი. თბილი, RAW სტილის შედეგები.
- რეალისტური ხედვა v5.1: პორტრეტების, ემოციების და სახის დეტალების შესანიშნავი ოსტატობა. ძალიან დაბალანსებულია ფონისა და საგნების მხრივ.
- ვერ ვიჯერებ, რომ ეს ფოტოგრაფია არ არის :( მრავალმხრივი, შესანიშნავი განათებით და კუთხით. იდეალურია პორტრეტებისა და სხვადასხვა თემატიკის გადასაღებად.
- ფოტონი V1: ხარისხსა და მრავალფეროვნებას შორის ბალანსი, განსაკუთრებით ადამიანური თემებისთვის.
- რეალისტური საფონდო ფოტო: ძალიან დახვეწილი, კატალოგის სტილის სურათები კანის ლაქების გარეშე.
- aZovya Photoreal: არც ისე ცნობილია, მაგრამ შესანიშნავ შედეგებს იძლევა და შეიძლება გამოყენებულ იქნას ტექნიკის სხვა მოდელებთან შერწყმისთვის.
SDXL-ის (უახლესი თაობის) მოდელები:
- ჯაგერნაუტი XL (x): კინემატოგრაფიული კომპოზიცია, შესანიშნავია პორტრეტებში და გრძელი მინიშნებების გაგება.
- RealVisXL: შეუდარებელია კანის რეალისტური ნაკლოვანებების, ტექსტურებისა და ტონის ცვლილებების გენერირების მხრივ.
- HelloWorld XL v6.0: ის ანალოგურ მიდგომას, სხეულის კარგ პროპორციებსა და ვინტაჟურ ესთეტიკას გვთავაზობს. უფრო დახვეწილი მოთხოვნებისთვის გამოიყენეთ GPT4v ტეგინგი.
- საპატიო ხსენებები: PhotoPedia XL, Realism Engine SDXL, Fully Real XL (ნაკლებად აქტუალური, მაგრამ მაინც მოქმედი).
ყველა ეს მოდელის უფასოდ ჩამოტვირთვა შესაძლებელია ისეთი საცავებიდან, როგორიცაა ცივიტაიდა უბრალოდ მოათავსეთ ისინი შესაბამის საქაღალდეში, რათა გამოჩნდნენ Stable Diffusion ინტერფეისში.
როგორ დავაინსტალიროთ და ვმართოთ მორგებული მოდელები Stable Diffusion-ში
ახალი შაბლონის ჩამოტვირთვა ძალიან მარტივია:
- წვდომა იქონიეთ ისეთ საცავებზე, როგორიცაა Civitai და გაფილტრეთ „საკონტროლო წერტილების“ მიხედვით.
- აირჩიეთ სასურველი მოდელი (დამატებითი უსაფრთხოებისთვის დარწმუნდით, რომ მას აქვს .safetensor გაფართოება).
- გადმოწერეთ ფაილი და დააკოპირეთ ის /stable-diffusion-webui/models/Stable-diffusion ბილიკზე.
- გადატვირთეთ ინტერფეისი და აირჩიეთ მოდელი „Checkpoint“ პანელიდან.
პროფესიონალური რჩევები სტაბილური დიფუზიის გამოყენებით ნამდვილად განსაცვიფრებელი სურათების მისაღებად
სტაბილური დიფუზიის დაუფლება გულისხმობს ექსპერიმენტებს, შედეგებიდან სწავლას და თქვენი ტექნიკისა და წარმოსახვის დახვეწას:
- ითამაშეთ ჩანერგვებით: თქვენი სურათების ესთეტიკის დასახვეწად, სცადეთ მოდელის შემქმნელების მიერ რეკომენდებული ჩაშენებები (მაგ., BadDream, UnrealisticDream, FastNegativeV2, JuggernautNegative-neg). ჩაშენებები საშუალებას გაძლევთ შეცვალოთ ისეთი ფუნქციები, როგორიცაა ხელები, თვალები და ა.შ.
- სახის დეტალების გაფართოებების გამოყენება: A1111-ისთვის განკუთვნილი Adetailer გაფართოება ან ComfyUI-ში Face Detailer Pipe კვანძი დაგეხმარებათ სახეებსა და ხელებზე უნაკლო შედეგების მიღწევაში, რაც განსაკუთრებით სასარგებლოა რეალისტური პორტრეტებისთვის.
- ControlNets პერფექციონისტებისთვის: თუ ხელებით, პოზებით ან სხეულით მომთხოვნი ხართ, შეისწავლეთ ControlNet-ის სხვადასხვა ტიპი თქვენი კომპოზიციების დასახვეწად.
- ცდა და შეცდომა: ნუ ელით, რომ პირველი სურათი იდეალური იქნება; მთავარია იტერაცია, მოთხოვნების შეცვლა და ნეგატივების კორექტირება სასურველი ხარისხის მიღწევამდე.
- ყურადღება მიაქციეთ წინადადების სტრუქტურას: მოერიდეთ წინააღმდეგობებს (მაგალითად, „გრძელი თმა“ და „მოკლე თმა“ ერთ წინადადებაში) და დასაწყისშივე მიანიჭეთ პრიორიტეტი კონცეფციებს, რომლებსაც საბოლოო გამოსახულებაში მეტი წონა ექნებათ.
სტაბილური დიფუზიის შესაძლებლობების ამ ტურის შემდეგ, ცხადია, რომ ხელოვნური ინტელექტი რევოლუციას ახდენს ჩვენი შექმნის წესში, ექსპერიმენტი ჩაატარეთ და გარდაქმენით სურათები სულ უფრო გასაკვირი, პროფესიონალური და ბუნებრივი შედეგებით. თუ ციფრული შემოქმედებით ხართ დაინტერესებული, ხელოვნური ინტელექტის ვიზუალური გენერაციის სამყაროს შესასწავლად უკეთესი დრო არ არსებობს: კარგი მინიშნებით, სწორი ხელსაწყოთი და ცოტა პრაქტიკით, ნებისმიერს შეუძლია წარმოსახვითი სურათები გააცოცხლოს, მარტივი ესკიზებიდან დაწყებული ჰიპერრეალისტური კომპოზიციებით დამთავრებული, რომლებიც პროფესიონალური ფოტოგრაფიისგან არ განსხვავდება.
რედაქტორი სპეციალიზირებულია ტექნოლოგიებისა და ინტერნეტის საკითხებში, ათ წელზე მეტი გამოცდილებით სხვადასხვა ციფრულ მედიაში. ვმუშაობდი რედაქტორად და კონტენტის შემქმნელად ელექტრონული კომერციის, კომუნიკაციის, ონლაინ მარკეტინგისა და სარეკლამო კომპანიებისთვის. მე ასევე ვწერდი ეკონომიკის, ფინანსების და სხვა სექტორების ვებსაიტებზე. ჩემი საქმეც ჩემი გატაცებაა. ახლა, ჩემი სტატიების მეშვეობით Tecnobits, ვცდილობ გამოვიკვლიო ყველა სიახლე და ახალი შესაძლებლობები, რომლებსაც ტექნოლოგიების სამყარო გვთავაზობს ყოველდღიურად ჩვენი ცხოვრების გასაუმჯობესებლად.



