- Claude 3.7 Sonnet Anthropic telah diuji bermain Pokémon Red di Twitch.
- Model AI telah menunjukkan kemajuan yang ketara dalam penaakulan dan membuat keputusan.
- Dia berjaya mengalahkan tiga Pemimpin Gim pertama dalam permainan, sesuatu yang gagal dicapai oleh versi sebelumnya.
- Anthropic menyerlahkan penggunaan permainan video sebagai kaedah penilaian untuk kecerdasan buatan.
Anthropic telah mengejutkan dunia kecerdasan buatan dengan menunjukkan sejauh mana model Claude 3.7 Sonnet baharunya boleh pergi dalam tugas yang rumit. Pada kesempatan ini, dan sebagai sebahagian daripada ujian keupayaan yang inovatif, Sistem AI telah diletakkan untuk memainkan Pokémon Red Menyentak, tempat penonton dapat mengikuti perkembangan secara langsung.
Percubaan ini bertujuan untuk menunjukkan bagaimana kecerdasan buatan boleh membuat keputusan strategik dan belajar untuk mengemudi persekitaran yang dinamik tanpa campur tangan manusia. Ini menandakan satu kejayaan berbanding versi model terdahulu, yang gagal mengatasi halangan awal dalam permainan.
Claude 3.7 Sonnet menunjukkan kemajuan dalam penaakulan

Untuk menilai penambahbaikan pada model AI, Anthropic menyediakannya dengan alat utama tertentu: Paparkan input piksel, memori asas dan kawalan butang. Terima kasih kepada elemen ini, Claude dapat mentafsir apa yang berlaku dalam permainan dan membuat keputusan berdasarkan logik dalamannya.
Dalam model sebelumnya, seperti Claude 3.0 Sonnet, kecerdasan buatan Dia tidak sempat keluar dari rumah watak utama.. Walau bagaimanapun, dalam lelaran baharu ini, sistem telah maju dengan ketara, berjaya menewaskan Brock, Misty, dan Lt. Surge, tiga Pemimpin Gim pertama dalam permainan.
Perjalanan 35.000 tindakan dalam dunia Pokémon

Perjalanan Claude dalam Pokémon Red tidak mudah. Menurut data yang disediakan oleh Anthropic, AI telah dilaksanakan sekitar 35.000 saham sehingga berjaya mengatasi peringkat Ciudad Carmín. Masa yang tepat untuk proses ini tidak dinyatakan, tetapi keupayaan model untuk menyesuaikan diri dengan perubahan dan mempelajari corak semasa persembahan mereka.
Menggunakan permainan video untuk menilai kecerdasan buatan bukanlah perkara baru. Walau bagaimanapun, percubaan ini mengukuhkan idea bahawa Persekitaran ini boleh menjadi alat asas untuk mengukur kemajuan dalam model AI yang mampu menaakul dan menyesuaikan diri.
Di luar permainan: Claude 3.7 Sonnet dan aplikasi dunia sebenarnya

Selain menunjukkan kemahiran dalam Pokémon Red, Anthropic telah menyerlahkan bahawa model AInya mampu menyelesaikan masalah yang kompleks dalam bidang seperti matematik, pengaturcaraan dan pengekodan. Sebagai sebahagian daripada penambahbaikannya, ciri yang dipanggil Kod Claude telah ditambah, yang membolehkan AI mencari dan mengedit kod, menjalankan ujian, dan juga berfungsi dengan alatan seperti GitHub.
Bagi mereka yang berminat untuk menguji keupayaan model, Claude 3.7 Sonnet kini boleh didapati di pelbagai platform, termasuk Apl Claude, API Anthropic, Amazon Bedrock dan Google Cloud, mengekalkan kos akses yang sama seperti versi sebelumnya.
Hakikat bahawa Claude 3.7 Sonnet telah berjaya mengatasi peringkat utama dalam Pokémon Red mengukuhkan idea bahawa Kecerdasan buatan semakin maju dengan pesat dari segi penaakulan dan pembelajaran. Ujian jenis ini membuka pintu kepada Aplikasi dunia sebenar baharu, daripada mengautomasikan tugas kepada menyelesaikan masalah yang kompleks tanpa campur tangan manusia.
Saya seorang peminat teknologi yang telah menjadikan minat "geek"nya sebagai satu profesion. Saya telah menghabiskan lebih daripada 10 tahun hidup saya menggunakan teknologi canggih dan bermain-main dengan semua jenis program kerana rasa ingin tahu yang tulen. Sekarang saya mempunyai pakar dalam teknologi komputer dan permainan video. Ini kerana selama lebih daripada 5 tahun saya telah menulis untuk pelbagai laman web mengenai teknologi dan permainan video, mencipta artikel yang bertujuan untuk memberi anda maklumat yang anda perlukan dalam bahasa yang boleh difahami oleh semua orang.
Jika anda mempunyai sebarang soalan, pengetahuan saya merangkumi semua perkara yang berkaitan dengan sistem pengendalian Windows serta Android untuk telefon mudah alih. Dan komitmen saya adalah kepada anda, saya sentiasa bersedia untuk meluangkan masa beberapa minit dan membantu anda menyelesaikan sebarang soalan yang mungkin anda ada dalam dunia internet ini.