Claude AI ของ Anthropic เล่นโปเกมอนบน Twitch และทำให้ประหลาดใจด้วยความสามารถในการใช้เหตุผลของเขา

การปรับปรุงครั้งล่าสุด: 28/02/2025
ผู้แต่ง: Alberto navarro

  • Claude 3.7 Sonnet ของ Anthropic ได้รับการทดสอบการเล่น Pokémon Red บน Twitch แล้ว
  • โมเดล AI แสดงให้เห็นถึงความก้าวหน้าอย่างมากในการใช้เหตุผลและการตัดสินใจ
  • เขาจัดการเอาชนะ Gym Leader คนแรกทั้งสามในเกมได้สำเร็จซึ่งเวอร์ชันก่อนๆ ไม่สามารถทำได้
  • Anthropic เน้นย้ำการใช้เกมวิดีโอเป็นวิธีการประเมินปัญญาประดิษฐ์
ช่วงเวลาที่สำคัญที่สุดของ Claude Ai ในโปเกมอน

Anthropic สร้างความประหลาดใจให้กับโลกของปัญญาประดิษฐ์ โดยแสดงให้เห็นว่าโมเดล Sonnet Claude 3.7 ใหม่สามารถไปได้ไกลแค่ไหนในงานที่ซับซ้อน ในโอกาสนี้และเป็นส่วนหนึ่งของการทดสอบความสามารถเชิงนวัตกรรม ระบบ AI ถูกนำมาใช้ในการเล่นโปเกมอนเรด Twitchซึ่งผู้ชมสามารถติดตามความคืบหน้าได้แบบสดๆ

การทดลองนี้มุ่งหวังที่จะแสดงให้เห็นว่าปัญญาประดิษฐ์สามารถ ตัดสินใจเชิงกลยุทธ์ และเรียนรู้การนำทางในสภาพแวดล้อมแบบไดนามิกโดยไม่ต้องมีการแทรกแซงของมนุษย์ ถือเป็นก้าวสำคัญเมื่อเทียบกับเวอร์ชั่นก่อนๆ ของโมเดลนี้ซึ่งไม่สามารถเอาชนะอุปสรรคในช่วงเริ่มเกมได้

เนื้อหาพิเศษ - คลิกที่นี่  คู่มือฉบับสมบูรณ์ในการใช้ Google Veo 3: วิธีการ ข้อกำหนด และเคล็ดลับ 2025

บทกลอน 3.7 โซเน็ตแสดงให้เห็นถึงความก้าวหน้าในการใช้เหตุผล

โคลด 3.7 โคลง

เพื่อประเมินการปรับปรุงโมเดล AI Anthropic ได้จัดเตรียมเครื่องมือสำคัญบางอย่างไว้ให้: อินพุตพิกเซลจอแสดงผล หน่วยความจำพื้นฐาน และการควบคุมปุ่ม- ด้วยองค์ประกอบเหล่านี้ ทำให้ Claude สามารถตีความสิ่งที่เกิดขึ้นในเกมและตัดสินใจตามตรรกะภายในเกมได้

ในรุ่นก่อนหน้า เช่น Claude 3.0 Sonnet ปัญญาประดิษฐ์ เขาไม่สามารถออกจากบ้านของตัวละครหลักได้ด้วยซ้ำ- อย่างไรก็ตาม ในระบบใหม่นี้ ระบบได้มีการพัฒนาไปอย่างมาก โดยสามารถเอาชนะ Brock, Misty และ Lt. Surge ซึ่งเป็น Gym Leader สามคนแรกในเกมได้

การเดินทาง 35.000 แอ็คชั่นภายในโลกโปเกมอน

Claude AI เล่นโปเกมอน

การเดินทางของ Claude ใน Pokémon Red ไม่ใช่เรื่องง่าย ตามข้อมูลที่ Anthropic ให้มา AI ดำเนินการ ประมาณ 35.000 หุ้น จนสามารถผ่านด่านซิวดัดคาร์มินไปได้ เวลาที่แน่นอนที่กระบวนการนี้ใช้ไม่ได้ระบุไว้ แต่ความสามารถของโมเดลในการ ปรับตัวเข้ากับการเปลี่ยนแปลงและเรียนรู้รูปแบบ ในระหว่างการแสดงของพวกเขา

เนื้อหาพิเศษ - คลิกที่นี่  Google Scholar Labs: นี่คือวิธีการทำงานของการค้นหาทางวิชาการที่ขับเคลื่อนด้วย AI ใหม่

การใช้เกมวิดีโอเพื่อประเมินปัญญาประดิษฐ์ไม่ใช่เรื่องใหม่ อย่างไรก็ตาม การทดลองนี้สนับสนุนความคิดที่ว่า สภาพแวดล้อมเหล่านี้อาจกลายเป็นเครื่องมือพื้นฐานได้ เพื่อวัดความคืบหน้าในโมเดล AI ที่สามารถให้เหตุผลและปรับตัวได้

เหนือกว่าเกม: Claude 3.7 Sonnet และการประยุกต์ใช้ในโลกแห่งความเป็นจริง

Anthropic นำเสนอ Claude 3.7 Sonnet-2

นอกจากการสาธิตทักษะภายใน Pokémon Red แล้ว Anthropic ยังเน้นย้ำว่าโมเดล AI ของตนสามารถทำได้ แก้ปัญหาที่ซับซ้อน ในสาขาต่างๆ เช่น คณิตศาสตร์ การเขียนโปรแกรม และการเข้ารหัส เป็นส่วนหนึ่งของการปรับปรุง มีการเพิ่มฟีเจอร์ที่เรียกว่า Claude Code ซึ่งช่วยให้ AI ค้นหาและแก้ไขโค้ด รันการทดสอบ และแม้แต่ทำงานกับเครื่องมืออย่าง GitHub ได้

สำหรับผู้ที่สนใจทดสอบความสามารถของโมเดล Claude 3.7 Sonnet พร้อมให้บริการบนแพลตฟอร์มต่างๆ แล้ว เช่น แอปของ Claude, Anthropic API, Amazon Bedrock และ Google Cloudโดยยังคงต้นทุนการเข้าถึงเท่ากับเวอร์ชันก่อนหน้า

โคลด 3.7 โคลง
บทความที่เกี่ยวข้อง:
Anthropic แนะนำ Claude 3.7 Sonnet: AI แบบไฮบริดพร้อมการใช้เหตุผลขั้นสูง

ความจริงที่ว่า Claude 3.7 Sonnet สามารถเอาชนะด่านสำคัญต่างๆ ใน ​​Pokémon Red ได้สำเร็จนั้นช่วยตอกย้ำแนวคิดที่ว่า ปัญญาประดิษฐ์ก้าวหน้าอย่างก้าวกระโดดในแง่ของการใช้เหตุผลและการเรียนรู้- การทดสอบประเภทนี้จะเปิดประตูสู่ การประยุกต์ใช้งานจริงแบบใหม่ตั้งแต่การทำงานอัตโนมัติไปจนถึงการแก้ไขปัญหาที่ซับซ้อนโดยไม่ต้องมีการแทรกแซงจากมนุษย์

เนื้อหาพิเศษ - คลิกที่นี่  จะทราบ IQ ของฉันด้วย Tontometer ได้อย่างไร