- Claude 3.7 Sonnet ของ Anthropic ได้รับการทดสอบการเล่น Pokémon Red บน Twitch แล้ว
- โมเดล AI แสดงให้เห็นถึงความก้าวหน้าอย่างมากในการใช้เหตุผลและการตัดสินใจ
- เขาจัดการเอาชนะ Gym Leader คนแรกทั้งสามในเกมได้สำเร็จซึ่งเวอร์ชันก่อนๆ ไม่สามารถทำได้
- Anthropic เน้นย้ำการใช้เกมวิดีโอเป็นวิธีการประเมินปัญญาประดิษฐ์
Anthropic สร้างความประหลาดใจให้กับโลกของปัญญาประดิษฐ์ โดยแสดงให้เห็นว่าโมเดล Sonnet Claude 3.7 ใหม่สามารถไปได้ไกลแค่ไหนในงานที่ซับซ้อน ในโอกาสนี้และเป็นส่วนหนึ่งของการทดสอบความสามารถเชิงนวัตกรรม ระบบ AI ถูกนำมาใช้ในการเล่นโปเกมอนเรด Twitchซึ่งผู้ชมสามารถติดตามความคืบหน้าได้แบบสดๆ
การทดลองนี้มุ่งหวังที่จะแสดงให้เห็นว่าปัญญาประดิษฐ์สามารถ ตัดสินใจเชิงกลยุทธ์ และเรียนรู้การนำทางในสภาพแวดล้อมแบบไดนามิกโดยไม่ต้องมีการแทรกแซงของมนุษย์ ถือเป็นก้าวสำคัญเมื่อเทียบกับเวอร์ชั่นก่อนๆ ของโมเดลนี้ซึ่งไม่สามารถเอาชนะอุปสรรคในช่วงเริ่มเกมได้
บทกลอน 3.7 โซเน็ตแสดงให้เห็นถึงความก้าวหน้าในการใช้เหตุผล

เพื่อประเมินการปรับปรุงโมเดล AI Anthropic ได้จัดเตรียมเครื่องมือสำคัญบางอย่างไว้ให้: อินพุตพิกเซลจอแสดงผล หน่วยความจำพื้นฐาน และการควบคุมปุ่ม- ด้วยองค์ประกอบเหล่านี้ ทำให้ Claude สามารถตีความสิ่งที่เกิดขึ้นในเกมและตัดสินใจตามตรรกะภายในเกมได้
ในรุ่นก่อนหน้า เช่น Claude 3.0 Sonnet ปัญญาประดิษฐ์ เขาไม่สามารถออกจากบ้านของตัวละครหลักได้ด้วยซ้ำ- อย่างไรก็ตาม ในระบบใหม่นี้ ระบบได้มีการพัฒนาไปอย่างมาก โดยสามารถเอาชนะ Brock, Misty และ Lt. Surge ซึ่งเป็น Gym Leader สามคนแรกในเกมได้
การเดินทาง 35.000 แอ็คชั่นภายในโลกโปเกมอน

การเดินทางของ Claude ใน Pokémon Red ไม่ใช่เรื่องง่าย ตามข้อมูลที่ Anthropic ให้มา AI ดำเนินการ ประมาณ 35.000 หุ้น จนสามารถผ่านด่านซิวดัดคาร์มินไปได้ เวลาที่แน่นอนที่กระบวนการนี้ใช้ไม่ได้ระบุไว้ แต่ความสามารถของโมเดลในการ ปรับตัวเข้ากับการเปลี่ยนแปลงและเรียนรู้รูปแบบ ในระหว่างการแสดงของพวกเขา
การใช้เกมวิดีโอเพื่อประเมินปัญญาประดิษฐ์ไม่ใช่เรื่องใหม่ อย่างไรก็ตาม การทดลองนี้สนับสนุนความคิดที่ว่า สภาพแวดล้อมเหล่านี้อาจกลายเป็นเครื่องมือพื้นฐานได้ เพื่อวัดความคืบหน้าในโมเดล AI ที่สามารถให้เหตุผลและปรับตัวได้
เหนือกว่าเกม: Claude 3.7 Sonnet และการประยุกต์ใช้ในโลกแห่งความเป็นจริง

นอกจากการสาธิตทักษะภายใน Pokémon Red แล้ว Anthropic ยังเน้นย้ำว่าโมเดล AI ของตนสามารถทำได้ แก้ปัญหาที่ซับซ้อน ในสาขาต่างๆ เช่น คณิตศาสตร์ การเขียนโปรแกรม และการเข้ารหัส เป็นส่วนหนึ่งของการปรับปรุง มีการเพิ่มฟีเจอร์ที่เรียกว่า Claude Code ซึ่งช่วยให้ AI ค้นหาและแก้ไขโค้ด รันการทดสอบ และแม้แต่ทำงานกับเครื่องมืออย่าง GitHub ได้
สำหรับผู้ที่สนใจทดสอบความสามารถของโมเดล Claude 3.7 Sonnet พร้อมให้บริการบนแพลตฟอร์มต่างๆ แล้ว เช่น แอปของ Claude, Anthropic API, Amazon Bedrock และ Google Cloudโดยยังคงต้นทุนการเข้าถึงเท่ากับเวอร์ชันก่อนหน้า
ความจริงที่ว่า Claude 3.7 Sonnet สามารถเอาชนะด่านสำคัญต่างๆ ใน Pokémon Red ได้สำเร็จนั้นช่วยตอกย้ำแนวคิดที่ว่า ปัญญาประดิษฐ์ก้าวหน้าอย่างก้าวกระโดดในแง่ของการใช้เหตุผลและการเรียนรู้- การทดสอบประเภทนี้จะเปิดประตูสู่ การประยุกต์ใช้งานจริงแบบใหม่ตั้งแต่การทำงานอัตโนมัติไปจนถึงการแก้ไขปัญหาที่ซับซ้อนโดยไม่ต้องมีการแทรกแซงจากมนุษย์
ฉันเป็นผู้ชื่นชอบเทคโนโลยีที่เปลี่ยนความสนใจ "เกินบรรยาย" ของเขาให้กลายเป็นอาชีพ ฉันใช้เวลามากกว่า 10 ปีในชีวิตไปกับเทคโนโลยีล้ำสมัยและปรับแต่งโปรแกรมทุกประเภทด้วยความอยากรู้อยากเห็น ตอนนี้ฉันมีความเชี่ยวชาญในด้านเทคโนโลยีคอมพิวเตอร์และวิดีโอเกม เนื่องจากเป็นเวลากว่า 5 ปีแล้วที่ฉันเขียนให้กับเว็บไซต์ต่างๆ เกี่ยวกับเทคโนโลยีและวิดีโอเกม โดยสร้างบทความที่พยายามให้ข้อมูลที่คุณต้องการในภาษาที่ทุกคนเข้าใจได้
หากคุณมีคำถามใดๆ ความรู้ของฉันมีตั้งแต่ทุกอย่างที่เกี่ยวข้องกับระบบปฏิบัติการ Windows รวมถึง Android สำหรับโทรศัพท์มือถือ และความมุ่งมั่นของฉันคือคุณ ฉันยินดีสละเวลาสักครู่เสมอและช่วยคุณแก้ไขคำถามใดๆ ที่คุณอาจมีในโลกอินเทอร์เน็ตนี้