- Anthropic'in Claude 3.7 Sonnet'i Twitch'te Pokémon Red oynayarak test edildi.
- Yapay zeka modelinin muhakeme ve karar verme konusunda önemli ilerlemeler kaydettiği ortaya çıktı.
- Oyunun önceki versiyonlarında başaramadığı bir şeyi yaparak, ilk üç Spor Salonu Liderini yenmeyi başardı.
- Anthropic, yapay zekanın değerlendirilmesinde video oyunlarının bir yöntem olarak kullanılabileceğini vurguluyor.
Anthropic yapay zeka dünyasını şaşırttı yeni Claude 3.7 Sonnet modelinin karmaşık görevlerde ne kadar ileri gidebileceğini göstererek. Bu vesileyle ve yeteneklerin yenilikçi bir şekilde test edilmesinin bir parçası olarak, Yapay zeka sistemi Pokémon Red'i oynamak için kullanıldı Twitchİzleyicilerin gelişmeleri canlı olarak takip edebilmesi sağlandı.
Deney, yapay zekanın nasıl çalışabileceğini göstermeyi amaçlıyor stratejik kararlar almak ve insan müdahalesi olmadan dinamik bir ortamda yol almayı öğrenin. Bu, oyun içindeki erken engelleri aşmayı başaramayan önceki model versiyonlarıyla karşılaştırıldığında bir dönüm noktası olarak görülüyor.
Claude 3.7 Sone akıl yürütmede ilerlemeler gösterir

Yapay zeka modelindeki iyileştirmeleri değerlendirmek için Anthropic, yapay zekaya bazı temel araçlar sağladı: Ekran piksel girişi, temel bellek ve düğme kontrolü. Claude, bu unsurlar sayesinde oyunda olup biteni yorumlayabiliyor ve oyunun iç mantığına göre kararlar alabiliyordu.
Claude 3.0 Sonnet gibi önceki modellerde yapay zeka Ana karakterin evinden bile dışarı çıkamadı.. Ancak bu yeni versiyonda sistem önemli ölçüde ilerleyerek oyundaki ilk üç Spor Salonu Lideri olan Brock, Misty ve Lt. Surge'ü yenmeyi başardı.
Pokémon dünyasında 35.000 eylemlik bir yolculuk

Claude'un Pokémon Red'deki yolculuğu kolay değildi. Anthropic tarafından sağlanan verilere göre, yapay zeka tarafından yürütülen yaklaşık 35.000 hisse Ta ki Ciudad Carmín etabını aşmayı başarana kadar. Bu sürecin tam olarak ne kadar zaman aldığı belirtilmedi, ancak modelin yeteneği değişikliklere uyum sağlayın ve kalıpları öğrenin performansları sırasında.
Yapay zekâyı değerlendirmek için video oyunlarını kullanmak yeni bir şey değil. Ancak bu deney şu fikri güçlendiriyor: Bu ortamlar temel araçlar haline gelebilir Akıl yürütme ve uyum sağlama yeteneğine sahip yapay zeka modellerindeki ilerlemeyi ölçmek.
Oyunun ötesinde: Claude 3.7 Sonnet ve gerçek dünyadaki uygulamaları

Pokémon Red'deki becerileri göstermenin yanı sıra Anthropic, yapay zeka modelinin şunları yapabildiğini vurguladı: karmaşık sorunları çözmek Matematik, programlama ve kodlama gibi alanlarda. Yapılan geliştirmelerin bir parçası olarak, yapay zekanın kod aramasına ve düzenlemesine, testler çalıştırmasına ve hatta GitHub gibi araçlarla çalışmasına olanak tanıyan Claude Code adı verilen bir özellik eklendi.
Modelin yeteneklerini test etmek isteyenler için Claude 3.7 Sonnet artık çeşitli platformlarda mevcuttur, bunlar arasında şunlar yer almaktadır: Claude'un uygulaması, Anthropic API, Amazon Bedrock ve Google Cloud, önceki versiyonuyla aynı erişim maliyetini koruyor.
Claude 3.7 Sonnet'in Pokémon Red'deki önemli aşamaları aşmayı başarması, şu fikri güçlendiriyor: Yapay zeka, akıl yürütme ve öğrenme açısından büyük ilerlemeler kaydediyor. Bu tür testler şu kapıyı açar: Yeni gerçek dünya uygulamaları, görevleri otomatikleştirmekten karmaşık sorunları insan müdahalesi olmadan çözmeye kadar.
Ben "inek" merakını mesleğe dönüştürmüş bir teknoloji tutkunuyum. Hayatımın 10 yıldan fazlasını en son teknolojiyi kullanarak ve sırf merakımdan dolayı her türlü programı kurcalayarak geçirdim. Artık bilgisayar teknolojisi ve video oyunları konusunda uzmanlaştım. Bunun nedeni, 5 yılı aşkın bir süredir teknoloji ve video oyunlarıyla ilgili çeşitli web sitelerinde yazılar yazıyor olmam ve ihtiyacınız olan bilgileri herkesin anlayabileceği bir dilde size vermeye çalışan makaleler oluşturmamdır.
Sorularınız varsa bilgim Windows işletim sistemi ve cep telefonları için Android ile ilgili her şeyi kapsar. Ve size olan bağlılığımdır, her zaman birkaç dakikamı ayırmaya ve bu internet dünyasında aklınıza gelebilecek her türlü soruyu çözmenize yardımcı olmaya hazırım.