- Claude 3.7 Sonnet milik Anthropic telah diuji memainkan Pokémon Red di Twitch.
- Model AI telah menunjukkan kemajuan signifikan dalam penalaran dan pengambilan keputusan.
- Dia berhasil mengalahkan tiga Gym Leader pertama dalam permainan, sesuatu yang gagal dicapai versi sebelumnya.
- Anthropic menyoroti penggunaan permainan video sebagai metode evaluasi untuk kecerdasan buatan.
Antropik telah mengejutkan dunia kecerdasan buatan dengan menunjukkan seberapa jauh model Claude 3.7 Sonnet yang baru dapat digunakan dalam tugas-tugas yang kompleks. Pada kesempatan ini, dan sebagai bagian dari uji kemampuan yang inovatif, Sistem AI digunakan untuk memainkan Pokémon Red di Berkedut, di mana pemirsa dapat mengikuti perkembangannya secara langsung.
Percobaan ini bertujuan untuk menunjukkan bagaimana kecerdasan buatan dapat mengambil keputusan strategis dan belajar menavigasi lingkungan yang dinamis tanpa campur tangan manusia. Hal ini menandai tonggak sejarah dibandingkan dengan versi model sebelumnya, yang gagal mengatasi hambatan awal dalam permainan.
Claude 3.7 Soneta menunjukkan kemajuan dalam penalaran

Untuk mengevaluasi peningkatan model AI, Anthropic menyediakannya dengan beberapa alat utama: Menampilkan input piksel, memori dasar, dan kontrol tombol. Berkat elemen-elemen ini, Claude mampu menafsirkan apa yang terjadi dalam permainan dan membuat keputusan berdasarkan logika internalnya.
Pada model sebelumnya, seperti Claude 3.0 Sonnet, kecerdasan buatan Dia bahkan tidak berhasil meninggalkan rumah tokoh utama.. Namun, dalam iterasi baru ini, sistemnya telah maju pesat, berhasil mengalahkan Brock, Misty, dan Letnan Surge, tiga Gym Leader pertama dalam permainan.
Perjalanan 35.000 aksi dalam dunia Pokémon

Perjalanan Claude di Pokémon Red tidaklah mudah. Menurut data yang diberikan oleh Anthropic, AI tersebut dieksekusi sekitar 35.000 saham hingga berhasil mengatasi tahapan Ciudad Carmín. Waktu yang tepat untuk proses ini tidak ditentukan, namun kemampuan model untuk beradaptasi dengan perubahan dan mempelajari pola selama pertunjukan mereka.
Menggunakan permainan video untuk mengevaluasi kecerdasan buatan bukanlah hal baru. Namun, percobaan ini memperkuat gagasan bahwa Lingkungan ini dapat menjadi alat yang mendasar untuk mengukur kemajuan dalam model AI yang mampu bernalar dan beradaptasi.
Di luar permainan: Claude 3.7 Sonnet dan aplikasi dunia nyata

Selain menunjukkan keterampilan dalam Pokémon Red, Anthropic telah menyoroti bahwa model AI-nya mampu memecahkan masalah yang kompleks di bidang seperti matematika, pemrograman, dan pengkodean. Sebagai bagian dari penyempurnaannya, fitur bernama Claude Code telah ditambahkan, yang memungkinkan AI untuk mencari dan mengedit kode, menjalankan pengujian, dan bahkan bekerja dengan alat seperti GitHub.
Bagi mereka yang tertarik menguji kemampuan model tersebut, Claude 3.7 Sonnet kini tersedia di berbagai platform, termasuk Aplikasi Claude, Anthropic API, Amazon Bedrock dan Google Cloud, mempertahankan biaya akses yang sama seperti versi sebelumnya.
Fakta bahwa Claude 3.7 Sonnet berhasil mengatasi tahap-tahap penting dalam Pokémon Red memperkuat gagasan bahwa Kecerdasan buatan mengalami kemajuan pesat dalam hal penalaran dan pembelajaran. Jenis pengujian ini membuka pintu untuk Aplikasi dunia nyata baru, dari mengotomatisasi tugas hingga memecahkan masalah rumit tanpa campur tangan manusia.
Saya seorang penggila teknologi yang telah mengubah minat "geek"-nya menjadi sebuah profesi. Saya telah menghabiskan lebih dari 10 tahun hidup saya menggunakan teknologi mutakhir dan mengutak-atik semua jenis program hanya karena rasa ingin tahu. Sekarang saya memiliki spesialisasi dalam teknologi komputer dan video game. Hal ini karena selama lebih dari 5 tahun saya telah menulis untuk berbagai website tentang teknologi dan video game, membuat artikel yang berupaya memberikan informasi yang Anda butuhkan dalam bahasa yang dapat dimengerti oleh semua orang.
Jika Anda memiliki pertanyaan, pengetahuan saya berkisar dari segala sesuatu yang berhubungan dengan sistem operasi Windows serta Android untuk ponsel. Dan komitmen saya adalah kepada Anda, saya selalu bersedia meluangkan beberapa menit dan membantu Anda menyelesaikan pertanyaan apa pun yang mungkin Anda miliki di dunia internet ini.