Anthropic'in yapay zekası Claude, Twitch'te Pokémon oynuyor ve akıl yürütme yeteneğiyle şaşırtıyor

Son Güncelleme: 28/02/2025

  • Anthropic'in Claude 3.7 Sonnet'i Twitch'te Pokémon Red oynayarak test edildi.
  • Yapay zeka modelinin muhakeme ve karar verme konusunda önemli ilerlemeler kaydettiği ortaya çıktı.
  • Oyunun önceki versiyonlarında başaramadığı bir şeyi yaparak, ilk üç Spor Salonu Liderini yenmeyi başardı.
  • Anthropic, yapay zekanın değerlendirilmesinde video oyunlarının bir yöntem olarak kullanılabileceğini vurguluyor.
Claude Ai'nin Pokémon'daki en kritik anı

Anthropic yapay zeka dünyasını şaşırttı yeni Claude 3.7 Sonnet modelinin karmaşık görevlerde ne kadar ileri gidebileceğini göstererek. Bu vesileyle ve yeteneklerin yenilikçi bir şekilde test edilmesinin bir parçası olarak, Yapay zeka sistemi Pokémon Red'i oynamak için kullanıldı Twitchİzleyicilerin gelişmeleri canlı olarak takip edebilmesi sağlandı.

Deney, yapay zekanın nasıl çalışabileceğini göstermeyi amaçlıyor stratejik kararlar almak ve insan müdahalesi olmadan dinamik bir ortamda yol almayı öğrenin. Bu, oyun içindeki erken engelleri aşmayı başaramayan önceki model versiyonlarıyla karşılaştırıldığında bir dönüm noktası olarak görülüyor.

Özel içerik - Buraya Tıklayın  Google Veo 3'ü Kullanmaya Yönelik Tam Kılavuz: Yöntemler, Gereksinimler ve İpuçları 2025

Claude 3.7 Sone akıl yürütmede ilerlemeler gösterir

Claude 3.7 Sonesi

Yapay zeka modelindeki iyileştirmeleri değerlendirmek için Anthropic, yapay zekaya bazı temel araçlar sağladı: Ekran piksel girişi, temel bellek ve düğme kontrolü. Claude, bu unsurlar sayesinde oyunda olup biteni yorumlayabiliyor ve oyunun iç mantığına göre kararlar alabiliyordu.

Claude 3.0 Sonnet gibi önceki modellerde yapay zeka Ana karakterin evinden bile dışarı çıkamadı.. Ancak bu yeni versiyonda sistem önemli ölçüde ilerleyerek oyundaki ilk üç Spor Salonu Lideri olan Brock, Misty ve Lt. Surge'ü yenmeyi başardı.

Pokémon dünyasında 35.000 eylemlik bir yolculuk

Claude AI Pokémon oynuyor

Claude'un Pokémon Red'deki yolculuğu kolay değildi. Anthropic tarafından sağlanan verilere göre, yapay zeka tarafından yürütülen yaklaşık 35.000 hisse Ta ki Ciudad Carmín etabını aşmayı başarana kadar. Bu sürecin tam olarak ne kadar zaman aldığı belirtilmedi, ancak modelin yeteneği değişikliklere uyum sağlayın ve kalıpları öğrenin performansları sırasında.

Özel içerik - Buraya Tıklayın  Google Akademik Laboratuvarları: Yapay zeka destekli yeni akademik arama böyle çalışıyor

Yapay zekâyı değerlendirmek için video oyunlarını kullanmak yeni bir şey değil. Ancak bu deney şu fikri güçlendiriyor: Bu ortamlar temel araçlar haline gelebilir Akıl yürütme ve uyum sağlama yeteneğine sahip yapay zeka modellerindeki ilerlemeyi ölçmek.

Oyunun ötesinde: Claude 3.7 Sonnet ve gerçek dünyadaki uygulamaları

Anthropic Claude 3.7 Sone-2'yi sunar

Pokémon Red'deki becerileri göstermenin yanı sıra Anthropic, yapay zeka modelinin şunları yapabildiğini vurguladı: karmaşık sorunları çözmek Matematik, programlama ve kodlama gibi alanlarda. Yapılan geliştirmelerin bir parçası olarak, yapay zekanın kod aramasına ve düzenlemesine, testler çalıştırmasına ve hatta GitHub gibi araçlarla çalışmasına olanak tanıyan Claude Code adı verilen bir özellik eklendi.

Modelin yeteneklerini test etmek isteyenler için Claude 3.7 Sonnet artık çeşitli platformlarda mevcuttur, bunlar arasında şunlar yer almaktadır: Claude'un uygulaması, Anthropic API, Amazon Bedrock ve Google Cloud, önceki versiyonuyla aynı erişim maliyetini koruyor.

Claude 3.7 Sonesi
İlgili makale:
Anthropic, Claude 3.7 Sonnet'i Tanıtıyor: Gelişmiş Muhakemeyle Hibrit Yapay Zeka

Claude 3.7 Sonnet'in Pokémon Red'deki önemli aşamaları aşmayı başarması, şu fikri güçlendiriyor: Yapay zeka, akıl yürütme ve öğrenme açısından büyük ilerlemeler kaydediyor. Bu tür testler şu kapıyı açar: Yeni gerçek dünya uygulamaları, görevleri otomatikleştirmekten karmaşık sorunları insan müdahalesi olmadan çözmeye kadar.

Özel içerik - Buraya Tıklayın  Tontometer ile IQ'mu nasıl öğrenebilirim?