- Anthropic-ийн Claude 3.7 Sonnet-ийг Twitch дээр Pokémon Red тоглож туршиж үзсэн.
- AI загвар нь үндэслэл, шийдвэр гаргахад ихээхэн ахиц дэвшил гаргасныг харуулсан.
- Тэр тоглолтын эхний гурван биеийн тамирын удирдагчийг ялж чадсан нь өмнөх хувилбаруудад хүрч чадаагүй юм.
- Антропик нь видео тоглоомыг хиймэл оюун ухааныг үнэлэх арга болгон ашиглахыг онцолж байна.
Anthropic нь хиймэл оюун ухааны ертөнцийг гайхшруулсан түүний шинэ Клод 3.7 Sonnet загвар нь нарийн төвөгтэй ажлуудад хэр хол явж болохыг харуулсан. Энэ тохиолдлоор болон чадавхийг шалгах шинэлэг туршилтын нэг хэсэг болгон, AI системийг Pokémon Red-д тоглохоор суулгасан чангаах, үзэгчид явцын явцыг шууд үзэх боломжтой байсан.
Энэхүү туршилт нь хиймэл оюун ухаан хэрхэн чаддагийг харуулахыг зорьсон стратегийн шийдвэр гаргах мөн хүний оролцоогүйгээр динамик орчинд жолоодож сурах. Тоглоомын өмнөх саад бэрхшээлийг даван туулж чадаагүй загварын өмнөх хувилбаруудтай харьцуулахад энэ нь чухал үе юм.
Клод 3.7 Соннет нь үндэслэлийн дэвшлийг харуулж байна

AI загварын сайжруулалтыг үнэлэхийн тулд Anthropic түүнд тодорхой үндсэн хэрэгслээр хангасан: Дэлгэцийн пикселийн оролт, үндсэн санах ой, товчлуурын удирдлага. Эдгээр элементүүдийн ачаар Клод тоглоомд болж буй үйл явдлыг тайлбарлаж, дотоод логик дээрээ үндэслэн шийдвэр гаргах боломжтой болсон.
Claude 3.0 Sonnet гэх мэт өмнөх загваруудад хиймэл оюун ухаан Тэр гол дүрийн гэрээс ч гарч чадаагүй.. Гэсэн хэдий ч энэхүү шинэ давталтаар систем нь нэлээд дэвшилттэй болж, тоглоомын эхний гурван биеийн тамирын удирдагч болох Брок, Мисти, дэслэгч Сурж нарыг ялж чадсан юм.
Покемон ертөнц дэх 35.000 үйлдэл бүхий аялал

Клодын Покемон Улаан дахь аялал тийм ч амар байгаагүй. Anthropic-ийн өгсөн мэдээллээр хиймэл оюун ухаан гүйцэтгэсэн 35.000 орчим хувьцаа Сьюдад Кармин шатыг даван туулах хүртэл. Энэ үйл явцад яг тодорхой хугацаа зарцуулагдсаныг заагаагүй боловч загварын чадвар өөрчлөлтөд дасан зохицож, хэв маягт суралцах тэдний гүйцэтгэлийн үеэр.
Хиймэл оюун ухааныг үнэлэхийн тулд видео тоглоом ашиглах нь шинэ зүйл биш юм. Гэсэн хэдий ч, энэ туршилт нь гэсэн санааг бататгаж байна Эдгээр орчин нь үндсэн хэрэгсэл болж чаддаг эргэцүүлэн бодох, дасан зохицох чадвартай AI загваруудын ахиц дэвшлийг хэмжих.
Тоглоомоос гадна: Claude 3.7 Sonnet болон түүний бодит амьдрал дээрх програмууд

Pokémon Red-д ур чадвараа харуулахаас гадна Anthropic өөрийн хиймэл оюун ухаантай загвар нь ийм чадвартай гэдгийг онцолсон. нарийн төвөгтэй асуудлыг шийдвэрлэх математик, програмчлал, кодчилол зэрэг салбарт. Сайжруулалтын хүрээнд хиймэл оюун ухаанд код хайх, засварлах, тест хийх, тэр ч байтугай GitHub зэрэг хэрэгслүүдтэй ажиллах боломжийг олгодог Claude Code хэмээх функц нэмэгдсэн.
Загварын чадавхийг туршиж үзэх сонирхолтой хүмүүст зориулж Claude 3.7 Sonnet-ийг одоо олон төрлийн платформ дээр ашиглах боломжтой. Claude's app, Anthropic API, Amazon Bedrock болон Google Cloud, өмнөх хувилбартай ижил хандалтын зардлыг хадгалах.
Claude 3.7 Sonnet нь Pokémon Red-ийн гол үе шатуудыг даван туулж чадсан нь гэсэн санааг бататгаж байна. Хиймэл оюун ухаан сэтгэн бодох, суралцах тал дээр үсрэнгүй хөгжиж байна.. Энэ төрлийн шалгалт нь үүд хаалгыг нээж өгдөг Бодит ертөнцийн шинэ програмууд, даалгавруудыг автоматжуулахаас эхлээд нарийн төвөгтэй асуудлыг хүний оролцоогүйгээр шийдвэрлэх хүртэл.
Би өөрийн "геек" сонирхлоо мэргэжил болгож чадсан технологи сонирхогч хүн. Би амьдралынхаа 10 гаруй жилийг хамгийн сүүлийн үеийн технологи ашиглан, бүх төрлийн программыг сониуч зандаа зориулж өнгөрүүлсэн. Одоо би компьютерийн технологи, видео тоглоомоор мэргэшсэн. Учир нь би 5-аас дээш жил технологи, видео тоглоомын талаар янз бүрийн вэб сайтуудад зориулж, танд хэрэгтэй мэдээллийг хүн бүрт ойлгомжтой хэлээр өгөхийг зорьсон нийтлэлүүдийг бүтээж байна.
Хэрэв танд асуулт байгаа бол миний мэдлэг Windows үйлдлийн систем, гар утсанд зориулсан Android-тай холбоотой бүх зүйлээс хамаарна. Мөн миний амлалт бол таны өмнө, би үргэлж хэдэн минут зарцуулж, энэ интернет ертөнцөд байгаа бүх асуултыг шийдвэрлэхэд тань туслахад бэлэн байна.