- Mae Claude 3.7 Sonnet Anthropic wedi'i brofi yn chwarae Pokémon Red ar Twitch.
- Mae’r model AI wedi dangos cynnydd sylweddol o ran rhesymu a gwneud penderfyniadau.
- Llwyddodd i drechu'r tri Arweinydd Campfa cyntaf yn y gêm, rhywbeth na lwyddodd fersiynau blaenorol i'w gyflawni.
- Mae Anthropic yn tynnu sylw at y defnydd o gemau fideo fel dull gwerthuso ar gyfer deallusrwydd artiffisial.
Mae Anthropic wedi synnu byd deallusrwydd artiffisial trwy ddangos pa mor bell y gall ei fodel newydd Claude 3.7 Sonnet fynd mewn tasgau cymhleth. Ar yr achlysur hwn, ac fel rhan o brawf arloesol o alluoedd, Rhoddwyd y system AI i chwarae Pokémon Red i mewn phlwc, lle roedd gwylwyr yn gallu dilyn y cynnydd yn fyw.
Mae'r arbrawf yn ceisio dangos sut y gall deallusrwydd artiffisial gwneud penderfyniadau strategol a dysgu llywio amgylchedd deinamig heb ymyrraeth ddynol. Mae hyn yn nodi carreg filltir o gymharu â fersiynau blaenorol o'r model, a oedd wedi methu â goresgyn rhwystrau cynnar o fewn y gêm.
Mae Claude 3.7 Sonnet yn dangos cynnydd mewn rhesymu

Er mwyn gwerthuso gwelliannau i'r model AI, rhoddodd Anthropic rai offer allweddol iddo: Arddangos mewnbwn picsel, cof sylfaenol a rheolaeth botwm. Diolch i'r elfennau hyn, roedd Claude yn gallu dehongli'r hyn oedd yn digwydd yn y gêm a gwneud penderfyniadau yn seiliedig ar ei resymeg fewnol.
Mewn modelau blaenorol, megis y Sonnet Claude 3.0, deallusrwydd artiffisial Ni lwyddodd hyd yn oed i adael tŷ'r prif gymeriad.. Fodd bynnag, yn yr iteriad newydd hwn, mae'r system wedi datblygu'n sylweddol, gan lwyddo i guro Brock, Misty, ac Lt. Surge, y tri Arweinydd Campfa cyntaf yn y gêm.
Taith o 35.000 o weithredoedd o fewn y byd Pokémon

Nid oedd taith Claude yn Pokémon Red yn hawdd. Yn ôl data a ddarparwyd gan Anthropic, gweithredodd yr AI tua 35.000 o gyfranddaliadau nes llwyddo i oresgyn cam Ciudad Carmín. Ni nodwyd yr union amser a gymerodd y broses hon, ond roedd gallu'r model i wneud hynny addasu i newidiadau a dysgu patrymau yn ystod eu perfformiad.
Nid yw defnyddio gemau fideo i werthuso deallusrwydd artiffisial yn newydd. Fodd bynnag, mae'r arbrawf hwn yn atgyfnerthu'r syniad bod Gall yr amgylcheddau hyn ddod yn arfau sylfaenol i fesur cynnydd mewn modelau AI sy'n gallu rhesymu ac addasu.
Y tu hwnt i'r gêm: Claude 3.7 Sonnet a'i gymwysiadau byd go iawn

Yn ogystal ag arddangos sgiliau o fewn Pokémon Red, mae Anthropic wedi amlygu bod ei fodel AI yn gallu gwneud hynny datrys problemau cymhleth mewn meysydd fel mathemateg, rhaglennu a chodio. Fel rhan o'i welliannau, mae nodwedd o'r enw Claude Code wedi'i hychwanegu, sy'n caniatáu i AI chwilio a golygu cod, rhedeg profion, a hyd yn oed weithio gydag offer fel GitHub.
I'r rhai sydd â diddordeb mewn profi galluoedd y model, mae Claude 3.7 Sonnet bellach ar gael ar amrywiaeth o lwyfannau, gan gynnwys Ap Claude, API Anthropic, Amazon Bedrock a Google Cloud, gan gynnal yr un gost mynediad â'i fersiwn flaenorol.
Mae'r ffaith bod Claude 3.7 Sonnet wedi llwyddo i oresgyn cyfnodau allweddol o fewn Pokémon Red yn atgyfnerthu'r syniad bod Mae deallusrwydd artiffisial yn datblygu'n gyflym o ran rhesymu a dysgu. Mae'r math hwn o brofion yn agor y drws i Cymwysiadau byd go iawn newydd, o awtomeiddio tasgau i ddatrys problemau cymhleth heb ymyrraeth ddynol.
Rwy'n frwd dros dechnoleg sydd wedi troi ei ddiddordebau "geek" yn broffesiwn. Rwyf wedi treulio mwy na 10 mlynedd o fy mywyd yn defnyddio technoleg flaengar ac yn tinkering gyda phob math o raglenni allan o chwilfrydedd pur. Nawr rydw i wedi arbenigo mewn technoleg gyfrifiadurol a gemau fideo. Mae hyn oherwydd ers mwy na 5 mlynedd rwyf wedi bod yn ysgrifennu ar gyfer gwefannau amrywiol ar dechnoleg a gemau fideo, gan greu erthyglau sy'n ceisio rhoi'r wybodaeth sydd ei hangen arnoch mewn iaith sy'n ddealladwy i bawb.
Os oes gennych unrhyw gwestiynau, mae fy ngwybodaeth yn amrywio o bopeth sy'n ymwneud â system weithredu Windows yn ogystal ag Android ar gyfer ffonau symudol. Ac mae fy ymrwymiad i chi, rwyf bob amser yn barod i dreulio ychydig funudau a'ch helpu i ddatrys unrhyw gwestiynau sydd gennych yn y byd rhyngrwyd hwn.