AI Claude dari Anthropic memainkan Pokémon di Twitch dan mengejutkan dengan kemampuan penalarannya

Pembaharuan Terakhir: 28/02/2025

  • Claude 3.7 Sonnet milik Anthropic telah diuji memainkan Pokémon Red di Twitch.
  • Model AI telah menunjukkan kemajuan signifikan dalam penalaran dan pengambilan keputusan.
  • Dia berhasil mengalahkan tiga Gym Leader pertama dalam permainan, sesuatu yang gagal dicapai versi sebelumnya.
  • Anthropic menyoroti penggunaan permainan video sebagai metode evaluasi untuk kecerdasan buatan.
Momen paling kritis Claude Ai di Pokémon

Antropik telah mengejutkan dunia kecerdasan buatan dengan menunjukkan seberapa jauh model Claude 3.7 Sonnet yang baru dapat digunakan dalam tugas-tugas yang kompleks. Pada kesempatan ini, dan sebagai bagian dari uji kemampuan yang inovatif, Sistem AI digunakan untuk memainkan Pokémon Red di Berkedut, di mana pemirsa dapat mengikuti perkembangannya secara langsung.

Percobaan ini bertujuan untuk menunjukkan bagaimana kecerdasan buatan dapat mengambil keputusan strategis dan belajar menavigasi lingkungan yang dinamis tanpa campur tangan manusia. Hal ini menandai tonggak sejarah dibandingkan dengan versi model sebelumnya, yang gagal mengatasi hambatan awal dalam permainan.

Konten eksklusif - Klik Disini  Cara membuat gambar dengan ChatGPT di WhatsApp

Claude 3.7 Soneta menunjukkan kemajuan dalam penalaran

Claude 3.7 Soneta

Untuk mengevaluasi peningkatan model AI, Anthropic menyediakannya dengan beberapa alat utama: Menampilkan input piksel, memori dasar, dan kontrol tombol. Berkat elemen-elemen ini, Claude mampu menafsirkan apa yang terjadi dalam permainan dan membuat keputusan berdasarkan logika internalnya.

Pada model sebelumnya, seperti Claude 3.0 Sonnet, kecerdasan buatan Dia bahkan tidak berhasil meninggalkan rumah tokoh utama.. Namun, dalam iterasi baru ini, sistemnya telah maju pesat, berhasil mengalahkan Brock, Misty, dan Letnan Surge, tiga Gym Leader pertama dalam permainan.

Perjalanan 35.000 aksi dalam dunia Pokémon

Claude AI memainkan Pokemon

Perjalanan Claude di Pokémon Red tidaklah mudah. Menurut data yang diberikan oleh Anthropic, AI tersebut dieksekusi sekitar 35.000 saham hingga berhasil mengatasi tahapan Ciudad Carmín. Waktu yang tepat untuk proses ini tidak ditentukan, namun kemampuan model untuk beradaptasi dengan perubahan dan mempelajari pola selama pertunjukan mereka.

Konten eksklusif - Klik Disini  Trailer Ghost of Yotei mengungkap cerita, gameplay, dan akting suara

Menggunakan permainan video untuk mengevaluasi kecerdasan buatan bukanlah hal baru. Namun, percobaan ini memperkuat gagasan bahwa Lingkungan ini dapat menjadi alat yang mendasar untuk mengukur kemajuan dalam model AI yang mampu bernalar dan beradaptasi.

Di luar permainan: Claude 3.7 Sonnet dan aplikasi dunia nyata

Antropik mempersembahkan Claude 3.7 Soneta-2

Selain menunjukkan keterampilan dalam Pokémon Red, Anthropic telah menyoroti bahwa model AI-nya mampu memecahkan masalah yang kompleks di bidang seperti matematika, pemrograman, dan pengkodean. Sebagai bagian dari penyempurnaannya, fitur bernama Claude Code telah ditambahkan, yang memungkinkan AI untuk mencari dan mengedit kode, menjalankan pengujian, dan bahkan bekerja dengan alat seperti GitHub.

Bagi mereka yang tertarik menguji kemampuan model tersebut, Claude 3.7 Sonnet kini tersedia di berbagai platform, termasuk Aplikasi Claude, Anthropic API, Amazon Bedrock dan Google Cloud, mempertahankan biaya akses yang sama seperti versi sebelumnya.

Claude 3.7 Soneta
Artikel terkait:
Anthropic Memperkenalkan Claude 3.7 Sonnet: AI Hibrida dengan Penalaran Tingkat Lanjut

Fakta bahwa Claude 3.7 Sonnet berhasil mengatasi tahap-tahap penting dalam Pokémon Red memperkuat gagasan bahwa Kecerdasan buatan mengalami kemajuan pesat dalam hal penalaran dan pembelajaran. Jenis pengujian ini membuka pintu untuk Aplikasi dunia nyata baru, dari mengotomatisasi tugas hingga memecahkan masalah rumit tanpa campur tangan manusia.

Konten eksklusif - Klik Disini  YouTube Premium Lite hadir di Spanyol: semua yang perlu Anda ketahui tentang langganan bebas iklan yang baru.