Anthropic's AI Claude თამაშობს პოკემონს Twitch-ზე და აოცებს თავისი მსჯელობის უნარით

Ბოლო განახლება: 28/02/2025

  • Anthropic-ის Claude 3.7 სონეტი გამოსცადეს პოკემონ რედის თამაში Twitch-ზე.
  • AI-ის მოდელმა აჩვენა მნიშვნელოვანი პროგრესი მსჯელობასა და გადაწყვეტილების მიღებაში.
  • მან მოახერხა თამაშში პირველი სამი Gym Leader-ის დამარცხება, რასაც წინა ვერსიებმა ვერ მიაღწიეს.
  • Anthropic ხაზს უსვამს ვიდეო თამაშების გამოყენებას, როგორც ხელოვნური ინტელექტის შეფასების მეთოდს.
კლოდ აის ყველაზე კრიტიკული მომენტი პოკემონში

Anthropic-მა გააოცა ხელოვნური ინტელექტის სამყარო იმის დემონსტრირებით, თუ რამდენად შეუძლია მის ახალ Claude 3.7 Sonnet მოდელს კომპლექსური ამოცანების შესრულება. ამ შემთხვევაში და როგორც შესაძლებლობების ინოვაციური გამოცდის ნაწილი, AI სისტემა დაყენებული იყო Pokémon Red-ში სათამაშოდ Twitch, სადაც მაყურებლებს შეეძლოთ თვალყური ადევნონ მიმდინარეობას პირდაპირ ეთერში.

ექსპერიმენტი ცდილობს აჩვენოს, თუ როგორ შეუძლია ხელოვნურ ინტელექტს სტრატეგიული გადაწყვეტილებების მიღება და ისწავლეთ დინამიურ გარემოში ნავიგაცია ადამიანის ჩარევის გარეშე. ეს არის მნიშვნელოვანი ეტაპი მოდელის წინა ვერსიებთან შედარებით, რომლებმაც ვერ გადალახეს ადრეული ბარიერები თამაშის ფარგლებში.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  Google Veo 3-ის გამოყენების სრული სახელმძღვანელო: მეთოდები, მოთხოვნები და რჩევები 2025

კლოდ 3.7 სონეტი აჩვენებს მიღწევებს მსჯელობაში

კლოდ 3.7 სონეტი

ხელოვნური ინტელექტის მოდელის გაუმჯობესების შესაფასებლად, Anthropic-მა მას გარკვეული ძირითადი ინსტრუმენტები მიაწოდა: პიქსელის შეყვანის, ძირითადი მეხსიერების და ღილაკების მართვის ჩვენება. ამ ელემენტების წყალობით კლოდმა შეძლო თამაშში მომხდარის ინტერპრეტაცია და გადაწყვეტილებების მიღება მისი შიდა ლოგიკით.

წინა მოდელებში, როგორიცაა Claude 3.0 Sonnet, ხელოვნური ინტელექტი მან ვერც კი მოახერხა მთავარი გმირის სახლიდან გასვლა.. თუმცა, ამ ახალ გამეორებაში, სისტემა მნიშვნელოვნად დაწინაურდა და მოახერხა თამაშში პირველი სამი სპორტული დარბაზის ლიდერების, ბროკის, მისტის და ლეიტენანტი სერჟის დამარცხება.

35.000 მოქმედების მოგზაურობა პოკემონის სამყაროში

კლოდ AI თამაშობს პოკემონს

კლოდის მოგზაურობა პოკემონ რედში ადვილი არ იყო. Anthropic-ის მიერ მოწოდებული მონაცემების მიხედვით, AI შესრულებულია დაახლოებით 35.000 აქცია სიუდად კარმინის სცენის გადალახვამდე. ამ პროცესის ზუსტი დრო არ იყო მითითებული, მაგრამ მოდელის უნარი მოერგოს ცვლილებებს და ისწავლოს შაბლონები მათი შესრულების დროს.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  Google Scholar Labs: ასე მუშაობს ხელოვნური ინტელექტით მართული ახალი აკადემიური ძიება

ვიდეო თამაშების გამოყენება ხელოვნური ინტელექტის შესაფასებლად ახალი არ არის. თუმცა, ეს ექსპერიმენტი აძლიერებს იმ აზრს, რომ ეს გარემო შეიძლება გახდეს ფუნდამენტური იარაღები გაზომოს პროგრესი AI მოდელებში, რომლებსაც შეუძლიათ მსჯელობა და ადაპტაცია.

თამაშის მიღმა: კლოდ 3.7 სონეტი და მისი რეალური აპლიკაციები

Anthropic წარმოგიდგენთ კლოდ 3.7 სონეტი-2

Pokémon Red-ში უნარების დემონსტრირების გარდა, Anthropic-მა ხაზგასმით აღნიშნა, რომ მის AI მოდელს შეუძლია რთული პრობლემების გადაჭრა ისეთ სფეროებში, როგორიცაა მათემატიკა, პროგრამირება და კოდირება. როგორც გაუმჯობესების ნაწილი, დაემატა ფუნქცია სახელწოდებით Claude Code, რომელიც საშუალებას აძლევს AI-ს მოძებნოს და შეცვალოს კოდი, გაუშვას ტესტები და იმუშაოს ისეთ ინსტრუმენტებთან, როგორიცაა GitHub.

მათთვის, ვინც დაინტერესებულია მოდელის შესაძლებლობების შემოწმებით, Claude 3.7 Sonnet ახლა ხელმისაწვდომია სხვადასხვა პლატფორმაზე, მათ შორის კლოდის აპლიკაცია, Anthropic API, Amazon Bedrock და Google Cloud, შენარჩუნებულია იგივე წვდომის ღირებულება, როგორც მისი წინა ვერსია.

კლოდ 3.7 სონეტი
დაკავშირებული სტატია:
Anthropic წარმოგიდგენთ Claude 3.7 სონეტს: ჰიბრიდული AI გაფართოებული მსჯელობით

ის ფაქტი, რომ Claude 3.7 Sonnet-მა შეძლო გადალახოს ძირითადი ეტაპები Pokémon Red-ში, ამყარებს აზრს, რომ ხელოვნური ინტელექტი პროგრესირებს ნახტომებით და საზღვრებით მსჯელობისა და სწავლის თვალსაზრისით. ამ ტიპის ტესტირება ხსნის კარს ახალი რეალური აპლიკაციები, ამოცანების ავტომატიზირებიდან რთული პრობლემების გადაჭრამდე ადამიანის ჩარევის გარეშე.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  როგორ გავიგო ჩემი IQ ტონტომეტრით?