- Anthropic-ის Claude 3.7 სონეტი გამოსცადეს პოკემონ რედის თამაში Twitch-ზე.
- AI-ის მოდელმა აჩვენა მნიშვნელოვანი პროგრესი მსჯელობასა და გადაწყვეტილების მიღებაში.
- მან მოახერხა თამაშში პირველი სამი Gym Leader-ის დამარცხება, რასაც წინა ვერსიებმა ვერ მიაღწიეს.
- Anthropic ხაზს უსვამს ვიდეო თამაშების გამოყენებას, როგორც ხელოვნური ინტელექტის შეფასების მეთოდს.
Anthropic-მა გააოცა ხელოვნური ინტელექტის სამყარო იმის დემონსტრირებით, თუ რამდენად შეუძლია მის ახალ Claude 3.7 Sonnet მოდელს კომპლექსური ამოცანების შესრულება. ამ შემთხვევაში და როგორც შესაძლებლობების ინოვაციური გამოცდის ნაწილი, AI სისტემა დაყენებული იყო Pokémon Red-ში სათამაშოდ Twitch, სადაც მაყურებლებს შეეძლოთ თვალყური ადევნონ მიმდინარეობას პირდაპირ ეთერში.
ექსპერიმენტი ცდილობს აჩვენოს, თუ როგორ შეუძლია ხელოვნურ ინტელექტს სტრატეგიული გადაწყვეტილებების მიღება და ისწავლეთ დინამიურ გარემოში ნავიგაცია ადამიანის ჩარევის გარეშე. ეს არის მნიშვნელოვანი ეტაპი მოდელის წინა ვერსიებთან შედარებით, რომლებმაც ვერ გადალახეს ადრეული ბარიერები თამაშის ფარგლებში.
კლოდ 3.7 სონეტი აჩვენებს მიღწევებს მსჯელობაში

ხელოვნური ინტელექტის მოდელის გაუმჯობესების შესაფასებლად, Anthropic-მა მას გარკვეული ძირითადი ინსტრუმენტები მიაწოდა: პიქსელის შეყვანის, ძირითადი მეხსიერების და ღილაკების მართვის ჩვენება. ამ ელემენტების წყალობით კლოდმა შეძლო თამაშში მომხდარის ინტერპრეტაცია და გადაწყვეტილებების მიღება მისი შიდა ლოგიკით.
წინა მოდელებში, როგორიცაა Claude 3.0 Sonnet, ხელოვნური ინტელექტი მან ვერც კი მოახერხა მთავარი გმირის სახლიდან გასვლა.. თუმცა, ამ ახალ გამეორებაში, სისტემა მნიშვნელოვნად დაწინაურდა და მოახერხა თამაშში პირველი სამი სპორტული დარბაზის ლიდერების, ბროკის, მისტის და ლეიტენანტი სერჟის დამარცხება.
35.000 მოქმედების მოგზაურობა პოკემონის სამყაროში

კლოდის მოგზაურობა პოკემონ რედში ადვილი არ იყო. Anthropic-ის მიერ მოწოდებული მონაცემების მიხედვით, AI შესრულებულია დაახლოებით 35.000 აქცია სიუდად კარმინის სცენის გადალახვამდე. ამ პროცესის ზუსტი დრო არ იყო მითითებული, მაგრამ მოდელის უნარი მოერგოს ცვლილებებს და ისწავლოს შაბლონები მათი შესრულების დროს.
ვიდეო თამაშების გამოყენება ხელოვნური ინტელექტის შესაფასებლად ახალი არ არის. თუმცა, ეს ექსპერიმენტი აძლიერებს იმ აზრს, რომ ეს გარემო შეიძლება გახდეს ფუნდამენტური იარაღები გაზომოს პროგრესი AI მოდელებში, რომლებსაც შეუძლიათ მსჯელობა და ადაპტაცია.
თამაშის მიღმა: კლოდ 3.7 სონეტი და მისი რეალური აპლიკაციები

Pokémon Red-ში უნარების დემონსტრირების გარდა, Anthropic-მა ხაზგასმით აღნიშნა, რომ მის AI მოდელს შეუძლია რთული პრობლემების გადაჭრა ისეთ სფეროებში, როგორიცაა მათემატიკა, პროგრამირება და კოდირება. როგორც გაუმჯობესების ნაწილი, დაემატა ფუნქცია სახელწოდებით Claude Code, რომელიც საშუალებას აძლევს AI-ს მოძებნოს და შეცვალოს კოდი, გაუშვას ტესტები და იმუშაოს ისეთ ინსტრუმენტებთან, როგორიცაა GitHub.
მათთვის, ვინც დაინტერესებულია მოდელის შესაძლებლობების შემოწმებით, Claude 3.7 Sonnet ახლა ხელმისაწვდომია სხვადასხვა პლატფორმაზე, მათ შორის კლოდის აპლიკაცია, Anthropic API, Amazon Bedrock და Google Cloud, შენარჩუნებულია იგივე წვდომის ღირებულება, როგორც მისი წინა ვერსია.
ის ფაქტი, რომ Claude 3.7 Sonnet-მა შეძლო გადალახოს ძირითადი ეტაპები Pokémon Red-ში, ამყარებს აზრს, რომ ხელოვნური ინტელექტი პროგრესირებს ნახტომებით და საზღვრებით მსჯელობისა და სწავლის თვალსაზრისით. ამ ტიპის ტესტირება ხსნის კარს ახალი რეალური აპლიკაციები, ამოცანების ავტომატიზირებიდან რთული პრობლემების გადაჭრამდე ადამიანის ჩარევის გარეშე.
მე ვარ ტექნოლოგიების ენთუზიასტი, რომელმაც თავისი „გიკის“ ინტერესები პროფესიად აქცია. ჩემი ცხოვრების 10 წელზე მეტი გავატარე უახლესი ტექნოლოგიის გამოყენებით და ყველა სახის პროგრამაში სუფთა ცნობისმოყვარეობის გამო. ახლა სპეციალიზირებული ვარ კომპიუტერულ ტექნოლოგიებსა და ვიდეო თამაშებში. ეს იმიტომ ხდება, რომ 5 წელზე მეტია ვწერ ტექნოლოგიებისა და ვიდეო თამაშების სხვადასხვა ვებსაიტებზე, ვქმნი სტატიებს, რომლებიც ცდილობენ მოგაწოდოთ თქვენთვის საჭირო ინფორმაცია ყველასთვის გასაგებ ენაზე.
თუ თქვენ გაქვთ რაიმე შეკითხვები, ჩემი ცოდნა მერყეობს Windows ოპერაციულ სისტემასთან და ასევე Android-თან დაკავშირებულ ყველაფერზე მობილური ტელეფონებისთვის. და ჩემი ვალდებულება არის თქვენ მიმართ, მე ყოველთვის მზად ვარ გავატარო რამდენიმე წუთი და დაგეხმაროთ გადაჭრას ნებისმიერი შეკითხვა, რომელიც შეიძლება გქონდეთ ამ ინტერნეტ სამყაროში.