- Mu არის Microsoft-ის ახალი მცირე ენობრივი მოდელი, რომელიც ოპტიმიზირებულია ლოკალურად გასაშვებად Windows 11 მოწყობილობებზე NPU-ებით.
- მისი საწყისი ინტეგრაცია ხორციელდება Windows 11 კონფიგურაციის აგენტში, რაც საშუალებას იძლევა კორექტირება ბუნებრივი ენის გამოყენებით.
- Mu გამოირჩევა თავისი ეფექტურობითა და სიჩქარით, რომელიც 100 მილიონი პარამეტრის წყალობით წამში 330-ზე მეტ ტოკენს აღწევს.
- ის მოიცავს ისეთ ინოვაციებს, როგორიცაა Dual LayerNorm, RoPE და GQA და ტრენინგი გავლილია მოწინავე პროცესებისა და მაღალი ხარისხის საგანმანათლებლო მონაცემების გამოყენებით.

ჩამოსვლა Mu, უახლესი მცირე ენის მოდელი, წარმოდგენილი microsoft, წარმოადგენს მნიშვნელოვან ნაბიჯს ხელოვნური ინტელექტის მომხმარებლების მოწყობილობებზე პირდაპირ განთავსების მიმდინარე ტენდენციაში. იმ განზრახვით, რომ შეამცირეთ ღრუბელზე დამოკიდებულება და გამოიყენეთ პოტენციალი, ნეირონული დამუშავების ერთეულები (NPU), Mu ინტეგრირებულია Copilot+ კომპიუტერები სირბილი Windows 11, თავდაპირველად ფოკუსირებული იყო იმაზე, პარამეტრების აპი სისტემის პარამეტრებზე წვდომისა და მოდიფიკაციის გასაადვილებლად მარტივი ბუნებრივი ენის გამოყენებით.
ეს წინსვლა ნიშნავს, რომ გარე სერვერებზე მოთხოვნების გაგზავნის ნაცვლად, დამუშავება და პასუხები თავად მოწყობილობაზე გენერირდება, რაც უზრუნველყოფს მეტ კონფიდენციალურობას, მოქნილობას და ეფექტურობას. ამ ეტაპზე, გამოშვება განკუთვნილია Windows Insider პროგრამის მონაწილეებისთვის, რომლებსაც Copilot+ კომპიუტერები აქვთ., თუმცა მოსალოდნელია, რომ ეს ტექნოლოგია მომავალ განახლებებში მეტ მომხმარებელზე და ფუნქციაზე გავრცელდება.
რა არის სინამდვილეში მუ და რით არის ის გამორჩეული?

Mu არის მცირე ენის მოდელი (SLM, მისი ინგლისურენოვანი აბრევიატურისთვის), გაწვრთნილი 330 მილიონი პარამეტრითმისი კომპაქტური ზომა არ ნიშნავს შესრულების შემცირებას, რადგან Microsoft-ის თქმით, ის აღწევს მაჩვენებლებს, რომლებიც ძალიან ახლოსაა გაცილებით დიდ მოდელებთან, როგორიცაა Phip-3.5-მინიეს ბალანსი მიღწეული იქნა ინტენსიური სასწავლო პროცესის წყალობით, რომელიც მოიცავდა ისეთ ტექნიკას, როგორიცაა: ორმაგი ფენანორმალური, როტაციული პოზიციური ჩასადგმელები (RoPE) y დაჯგუფებული შეკითხვის ყურადღება (GQA) რომლებიც უზრუნველყოფენ ეფექტურობას და სიზუსტეს, განსაკუთრებით შეზღუდული რესურსების მქონე მოწყობილობებში.
მოდელი უპირატესობას ანიჭებს ა. ენკოდერ-დეკოდერის არქიტექტურა ტრანსფორმატორის ტიპის, რომელსაც შეუძლია მომხმარებლის შეყვანის დამუშავება და სისტემაში მოქმედებებად გარდაქმნა. ამ სტრუქტურის წყალობით, Mu განასხვავებს შეყვანისა და გამოყვანის დამუშავებას, რა ამცირებს შეყოვნებას და მეხსიერების მოხმარებას, ძირითადი პუნქტები შეუფერხებელი, ლოდინის გარეშე მომხმარებლის გამოცდილების უზრუნველსაყოფად.
ოფიციალურ ტესტებსა და მონაცემებში მუმ დაამტკიცა, რომ შეუძლია წამში 100-ზე მეტ ტოკენზე პასუხის გაცემა და პასუხების მიწოდება 500 მილიწამზე ნაკლებ დროშიეს რიცხვები პრაქტიკულად მყისიერ ურთიერთქმედებას იძლევა, მაშინაც კი, როდესაც საქმე ეხება პარამეტრების შეცვლას ან ყოველდღიურ ენაზე გრძელი და მრავალფეროვანი მოთხოვნების ინტერპრეტაციას. თუ გსურთ უფრო ღრმად ჩაუღრმავდეთ ამ მოდელების მუშაობას, შეგიძლიათ გაეცნოთ ენობრივი მოდელების შედარება კომპიუტერზე.
კონფიგურაციის აგენტთან ინტეგრაცია და პრაქტიკული ფუნქციები
მუს საწყისი დაშვება ორიენტირებულია Windows 11-ის კონფიგურაციის აგენტი, ფუნქცია, რომელიც მომხმარებლებს საშუალებას აძლევს შეცვალეთ სისტემის პარამეტრები უბრალოდ აკრეფით ან იმის თქმით, რაც მათ სჭირდებათმაგალითად, უბრალოდ იკითხეთ „როგორ გავააქტიურო ბნელი რეჟიმი?“ o „მინდა სიკაშკაშის გაზრდა“ რათა Mu-მ შეძლოს ამ ინსტრუქციის თარგმნა სისტემაში შესაბამის ტექნიკურ მოქმედებად.
Microsoft-მა ხაზგასმით აღნიშნა, რომ ხელოვნური ინტელექტი ადაპტირდება ათიათასობით სხვადასხვა კონტექსტი და შეკითხვასინამდვილეში, 100 000-ზე მეტი იქნა გამოყენებული. 3,6 მილიონი სასწავლო ნიმუში ყველაფრის დასაფარად, ყველაზე გავრცელებული მოთხოვნებიდან დაწყებული, როგორიცაა ენის შეცვლა ან Wi-Fi ქსელების მართვა, უფრო რთული ამოცანებიდან დაწყებული. ძალიან მოკლე ან ორაზროვანი კითხვებისთვის, სისტემა იყენებს ტრადიციული ძიების ფუნქციები, მაგრამ როდესაც ინსტრუქცია ნათელი და დეტალურია, Mu ავტომატურად მოქმედებს ან მომხმარებელს ეტაპობრივად უხელმძღვანელებს.
ტექნოლოგია და ოპტიმიზაცია ადაპტირებულია აპარატურის ახალ თაობებზე

La Mu-ს ოპტიმიზაცია მისი შემუშავების დროს ერთ-ერთი ყველაზე ყურადღებით განხილული პუნქტი იყო. Microsoft-მა ითანამშრომლა სილიკონის პარტნიორებთან, როგორიცაა AMD, Intel და Qualcomm Copilot+ კომპიუტერებში არსებული ახალი NPU-ების სპეციფიკასთან ადაპტირებისთვისამ ერთობლივმა მუშაობამ შესაძლებელი გახადა დანერგვა ტრენინგის შემდგომი რაოდენობრივი შეფასების ტექნიკა, რომლებიც მოდელის წონასა და აქტივაციებს 8 და 16-ბიტიან მთელ რიცხვებად გარდაქმნიან, რითაც ამცირებს მეხსიერების მოხმარებას და თავიდან აცილებს მთელი მოდელის გადამზადების საჭიროებას.
მუს სასწავლო პროცესი მაღალი ხარისხის გარემოში ხორციელდებოდა, NVIDIA A100 გრაფიკული პროცესორები ფარგლებში Azure მანქანა სწავლამონაცემთა ნაკრები მოიცავდა ასობით მილიარდი საგანმანათლებლო ტოკენი და ისეთი ტექნიკა, როგორიცაა დისტილაცია Phi მოდელებიდან და დაბალი დიაპაზონის ადაპტაცია (LoRA) ცოდნის გადაცემისა და მოდელის კონკრეტული ამოცანებისთვის დასახვეწად. საბოლოო შედეგი არის პატარა, მოქნილი მოდელი, რომელიც უნიკალურად არის მორგებული თანამედროვე ტარებადი აპარატურის რესურსებსა და შეზღუდვებზე. ასევე შეგიძლიათ გაეცნოთ, თუ როგორ გადააქციეთ თქვენი კომპიუტერი ლოკალურ ხელოვნური ინტელექტის ცენტრად თქვენი სისტემის შესაძლებლობების გასაფართოებლად.
მიმდინარე გამოწვევები, ხელმისაწვდომობა და სამომავლო პერსპექტივები
მუს წინაშე მდგარი ერთ-ერთი უდიდესი გამოწვევაა ორაზროვანი ან ძალიან მოკლე კითხვების ინტერპრეტაცია, ბუნებრივ ენაზე დაფუძნებულ სისტემებში გავრცელებული პრობლემა. ამისათვის, Microsoft-მა ჰიბრიდული ლოგიკა დანერგამიუხედავად იმისა, რომ მოკლე მოთხოვნები ტრადიციული ძიების შედეგებს იწვევს, უფრო დეტალური ინსტრუქციები ხელოვნური ინტელექტის ჩარევას იწვევს, მომხმარებლის ხელმძღვანელობისთვის ან ავტომატური მოქმედებების შესასრულებლად.
Ახლა, Mu ხელმისაწვდომია მხოლოდ ინგლისურ ენაზე და Copilot+ მოწყობილობებზე Insider არხის მეშვეობით., თუმცა მოსალოდნელია, რომ მომდევნო თვეებში ის გაფართოვდება მეტ ენაზე და სხვა მოწყობილობებზე, მათ შორის AMD და Intel პროცესორებზე. კონფიდენციალურობა და უსაფრთხოება ისინი ასევე ფუნდამენტურ როლს ასრულებენ, დამუშავების ადგილობრივი ხასიათის გათვალისწინებით.
Mu-ს განლაგება მხოლოდ დასაწყისია Microsoft-ის მიერ ინტეგრირების უფრო ფართო სტრატეგიისა. ლოკალური ხელოვნური ინტელექტი და ეფექტური ენობრივი მოდელები ოპერაციული სისტემის კიდევ უფრო მეტ აპლიკაციასა და ასპექტში, რაც აუმჯობესებს გამოცდილებას და ხელმისაწვდომობას შესრულების ან კონფიდენციალურობის შელახვის გარეშე.
მე ვარ ტექნოლოგიების ენთუზიასტი, რომელმაც თავისი „გიკის“ ინტერესები პროფესიად აქცია. ჩემი ცხოვრების 10 წელზე მეტი გავატარე უახლესი ტექნოლოგიის გამოყენებით და ყველა სახის პროგრამაში სუფთა ცნობისმოყვარეობის გამო. ახლა სპეციალიზირებული ვარ კომპიუტერულ ტექნოლოგიებსა და ვიდეო თამაშებში. ეს იმიტომ ხდება, რომ 5 წელზე მეტია ვწერ ტექნოლოგიებისა და ვიდეო თამაშების სხვადასხვა ვებსაიტებზე, ვქმნი სტატიებს, რომლებიც ცდილობენ მოგაწოდოთ თქვენთვის საჭირო ინფორმაცია ყველასთვის გასაგებ ენაზე.
თუ თქვენ გაქვთ რაიმე შეკითხვები, ჩემი ცოდნა მერყეობს Windows ოპერაციულ სისტემასთან და ასევე Android-თან დაკავშირებულ ყველაფერზე მობილური ტელეფონებისთვის. და ჩემი ვალდებულება არის თქვენ მიმართ, მე ყოველთვის მზად ვარ გავატარო რამდენიმე წუთი და დაგეხმაროთ გადაჭრას ნებისმიერი შეკითხვა, რომელიც შეიძლება გქონდეთ ამ ინტერნეტ სამყაროში.

