- Anthropic's Claude 3.7 Sonnet Twitchде Pokémon Red ойноп сыналган.
- AI модели ой жүгүртүү жана чечим кабыл алууда олуттуу прогрессти көрсөттү.
- Ал оюнда биринчи үч спорт залдын лидерин жеңе алды, буга мурунку версиялар жетише алган эмес.
- Anthropic видео оюндарын жасалма интеллектти баалоо ыкмасы катары колдонууну баса белгилейт.
Anthropic жасалма интеллект дүйнөсүн таң калтырды анын жаңы Клод 3.7 Sonnet модели татаал тапшырмаларды аткарууда канчалык алыска бара аларын көрсөтүү менен. Бул учурда жана мүмкүнчүлүктөрдү новатордук сыноонун бир бөлүгү катары, AI системасы Pokémon Red ойноо үчүн коюлган Twitch, көрүүчүлөр прогресске түз көз салып турган.
Эксперимент жасалма интеллекттин кандай болорун көрсөтүүнү көздөйт стратегиялык чечимдерди кабыл алуу жана адамдын кийлигишүүсүз динамикалык чөйрөнү башкарууну үйрөнүңүз. Бул оюндун ичиндеги алгачкы тоскоолдуктарды жеңе албаган моделдин мурунку версияларына салыштырмалуу маанилүү этап болуп саналат.
Клод 3.7 Сонет ой жүгүртүүдөгү жетишкендиктерди көрсөтөт

AI моделин жакшыртууларды баалоо үчүн, Anthropic аны белгилүү бир негизги куралдар менен камсыз кылды: Дисплей пиксел киргизүү, негизги эс жана баскычты башкаруу. Бул элементтердин аркасында Клод оюнда эмне болуп жатканын чечмелеп, анын ички логикасына таянып чечим чыгара алган.
Мурунку моделдерде, мисалы, Клод 3.0 Sonnet, жасалма интеллект Ал башкы каармандын үйүнөн чыгууга да үлгүрбөй калган.. Бирок, бул жаңы итерацияда система бир топ алдыга жылды, оюндагы биринчи үч спорт залдын лидери Брок, Мисти жана лейтенант Суржду жеңе алды.
Покемон дүйнөсүндөгү 35.000 XNUMX аракеттен турган саякат

Клоддун Покемон Кызылдагы сапары оңой болгон жок. Anthropic тарабынан берилген маалыматтарга ылайык, AI аткарылган 35.000 XNUMX акциянын тегерегинде Сьюдад Кармин баскычын жеңгенге чейин. Бул процесстин так убактысы көрсөтүлгөн эмес, бирок моделдин жөндөмдүүлүгү өзгөрүүлөргө көнүү жана үлгүлөрдү үйрөнүү алардын аткаруу учурунда.
Жасалма интеллектти баалоо үчүн видео оюндарды колдонуу жаңылык эмес. Бирок, бул эксперимент деген ойду бекемдейт Бул чөйрөлөр негизги куралдар болуп калышы мүмкүн ой жүгүртүүгө жана ыңгайлашууга жөндөмдүү AI моделдериндеги прогрессти өлчөө.
Оюндан тышкары: Клод 3.7 Sonnet жана анын реалдуу тиркемелери

Pokémon Red ичиндеги көндүмдөрдү көрсөтүүдөн тышкары, Anthropic анын AI модели жөндөмдүү экенин баса белгиледи. татаал маселелерди чечуу математика, программалоо жана коддоо сыяктуу тармактарда. Аны өркүндөтүүнүн бир бөлүгү катары Клод коду деп аталган функция кошулду, ал AI кодду издөөгө жана түзөтүүгө, тесттерди өткөрүүгө жана ал тургай GitHub сыяктуу куралдар менен иштөөгө мүмкүндүк берет.
Моделдин мүмкүнчүлүктөрүн сынап көрүүгө кызыккандар үчүн Клод 3.7 Sonnet азыр ар кандай платформаларда, анын ичинде Клод колдонмосу, Anthropic API, Amazon Bedrock жана Google Cloud, мурунку версиясындай эле кирүү наркын сактоо.
Клод 3.7 Sonnet Pokémon Red ичиндеги негизги этаптарды жеңе алганы бул идеяны бекемдейт. Жасалма интеллект ой жүгүртүү жана үйрөнүү жагынан секирик жана чектер менен алга жылууда. Сыноонун бул түрү эшикти ачат Жаңы реалдуу тиркемелер, милдеттерди автоматташтыруудан тарта татаал маселелерди адамдын кийлигишүүсүз чечүүгө чейин.
Мен өзүмдүн «геек» кызыкчылыктарын кесипке айландырган технология ышкыбозумун. Өмүрүмдүн 10 жылдан ашуунун эң алдыңкы технологияларды колдонууга жана ар кандай программалар менен иштөөгө жумшадым. Азыр мен компьютердик технологиялар жана видео оюндар боюнча адистешкен. Себеби, мен 5 жылдан ашык убакыттан бери технология жана видео оюндар боюнча ар кандай веб-сайттарга жазып, сизге керектүү маалыматты баарына түшүнүктүү тилде берүүгө умтулган макалаларды түзүп келем.
Эгерде сизде кандайдыр бир суроолор болсо, менин билимим Windows операциялык тутумуна, ошондой эле уюлдук телефондор үчүн Android менен байланыштуу. Жана менин милдеттенмем сизге, мен ар дайым бир нече мүнөт бөлүп, бул интернет дүйнөсүндө сизди кызыктырган бардык суроолорду чечүүгө жардам берүүгө даярмын.