- Cynorthwyodd Claude gyda rhaglennu a gweithredu Unitree Go2, gan awtomeiddio llawer o'r gwaith yn Project Fetch.
- Datrysodd y tîm a bwerwyd gan AI rai tasgau'n gyflymach, fel cerdded a lleoli pêl, nag y gallai'r grŵp heb gymorth.
- Datgelodd y dadansoddiad rhyngweithio lai o ddryswch gyda Claude, diolch i gysylltiad haws a rhyngwyneb mwy defnyddiadwy.
- Mae'r cynnydd yn tynnu sylw at gyfleoedd a risgiau: mae angen cryfhau protocolau a mesurau diogelwch ffisegol wrth ddod â LLM i'r byd go iawn.
Y prawf newydd o Anthropig Mae'n canolbwyntio ar fater nad yw bellach yn ffuglen wyddonol: Beth sy'n digwydd pan fydd model iaith yn cydlynu robot?. yn Nôl ProsiectHelpodd eu system Claude i weithredu ci robot, gyda'r nod o brofi pa mor bell y gallai'r robot fynd. Ffiseg AI symud o destun i symudiad.
Y tu hwnt i'r pennawd, mae'r arbrawf yn rhoi cliwiau clir am alluoedd a chyfyngiadau: Awtomatodd Claude lawer o'r rhaglennu angenrheidiol fel y gallai'r pedairtroed gyflawni gweithredoedd corfforol, a Fe wasanaethodd fel catalydd i dîm o bobl symud ymlaen yn gyflymach mewn rhai tasgau..
Deallusrwydd Artiffisial a'r byd ffisegol: o'r labordy i weithredu

Mae Anthropic, a sefydlwyd gan gyn-ymchwilwyr OpenAI, wedi astudio risgiau a chymwysiadau ymarferol modelau uwch ers amser maith. Y tro hwn, roedd y ddamcaniaeth yn syml: os yw LLM yn meistroli codio a rhyngweithio fwyfwy â meddalwedd, gall ddechrau dylanwadu ar wrthrychau go iawnRoedd y tîm diogelwch mewnol (y tîm coch) eisiau arsylwi'r newid hwn mewn amgylchedd rheoledig.
Mae ymchwilwyr yn tynnu sylw at y ffaith nad yw modelau cyfredol yn rheoli robot cymhleth yn llawn eto, ond Maen nhw'n rhagweld y bydd gan fersiynau yn y dyfodol fwy o le i symud.Felly mae'n ddefnyddiol dadansoddi sut mae bodau dynol yn dibynnu ar AI i raglennu a threfnu ymddygiadau corfforol, yn enwedig yn robotiaid humanoidcyn i'r foment honno gyrraedd.
Sut y cynlluniwyd Project Fetch
Roedd yr her yn gosod dau dîm heb unrhyw brofiad roboteg blaenorol yn erbyn ei gilydd: un gyda chymorth Claude a'r llall a oedd yn rhaglennu heb gymorth AI. Roedd yn rhaid i'r ddau dîm reoli ci robot Unitree Go2 gan ddefnyddio teclyn rheoli o bell ac ysgrifennu cod, gan weithio gyda rheolyddion a llwyfannau fel Arduino Uno QI cyflawni tasgau o anhawster cynyddol, o gerdded tuag at bwynt i leoli gwrthrych.
Llwyddodd y grŵp gyda Claude i gyflawni rhai amcanion yn gyflymach, gan gynnwys y pedwarplyg Byddwn i'n cerdded ac yn dod o hyd i bêl draethRoedd hyn yn rhywbeth na allai'r tîm dynol yn unig ei gyflawni o dan yr amodau prawf. Nid hud oedd yr allwedd; cynhyrchodd a mireiniodd y model god, gan gyflymu'r cysylltiad â'r robot a lleihau ffrithiant.
Cofnododd a dadansoddodd Anthropic ddeinameg y gwaith. Yn y trawsgrifiadau, mynegodd y tîm heb AI fwy o rwystredigaeth ac amheuaeth, tra bod cymorth Claude Roedd yn ymddangos ei fod yn hwyluso rhyngwyneb rheoli mwy dealladwy. a chychwyn llyfnach. Er hynny, ni chyflawnwyd pob nod ac roedd ymreolaeth yn gyfyngedig.
Y ci robot a ddewiswyd: Unitree Go2 a'i bwrpas

Dewiswyd y model Go2, a gynhyrchwyd gan Unitree yn Hangzhou, Tsieina, ar gyfer y gwerthusiad. Mae'n costio tua Ddoler US 16.900, ffigur cymharol dynn o'i gymharu ag offer arall yn y sector, ac fe'i defnyddir mewn tasgau arolygu o bell, patrolau diogelwch neu deithiau mewn adeiladu a gweithgynhyrchu.
Gall y pedwarpedd hwn symud yn annibynnol, ond yn ymarferol mae'n dibynnu ar gorchmynion lefel uchel neu reolaeth personYn ôl dadansoddiad marchnad diweddar, mae systemau Unitree ymhlith y rhai mwyaf cyffredin, gan eu gwneud yn faes profi deniadol i weld pa mor bell y gall rhaglennu â chymorth AI wthio'r ffiniau.
Beth mae'r canlyniadau'n ei ddatgelu am LLMs?
Nid yw'r modelau iaith gwych bellach yn ysgrifennu testunau yn unig: yn ystod y blynyddoedd diwethaf maent wedi arbenigo mewn cynhyrchu cod a rheoli meddalweddYn Project Fetch, roedd y gallu hwnnw'n cyfieithu i lai o amser yn cael ei dreulio ar dasgau rhaglennu ailadroddus a chanllaw cam wrth gam i ailadrodd dros wallau ac addasu ymddygiadau robotiaid.
Y dehongliad doeth yw, er nad ydym yn sôn am reolaeth lwyr, Mae deallusrwydd artiffisial yn gostwng y rhwystr i fynediad i dimau nad ydynt yn arbenigwyr Maent yn galluogi platfform ffisegol i gyflawni gweithredoedd defnyddiol. Mae'n newid ansoddol: o fod yn gynhyrchwyr testun yn unig, mae LLMs yn dechrau gweithredu fel trefnwyr systemau.
Risgiau a mesurau diogelwch: sut i osgoi ofnau
Mae rhoi’r gallu i AI weithredu ar beiriannau yn cyflwyno risgiau amlwg: gwallau cod, data diffygiol, neu gamddefnydd bwriadol Gall y methiannau hyn gael canlyniadau ffisegol. Dysgodd roboteg ddiwydiannol amser maith yn ôl i liniaru'r methiannau hyn gydag amddiffyniadau annibynnol. meddalwedd.
Yn y cyd-destun hwn, mae arbenigwyr yn awgrymu cyfuno sawl haen: ffiniau gweithredol, archwilio cod a gynhyrchwyd, ac, yn anad dim, switshis a phrotocolau argyfwng mecanyddol nad ydynt yn dibynnu ar y model. Mae'r astudiaeth Anthropig wedi'i fframio'n union o fewn y rhesymeg ataliol honno.
Cymwysiadau sy'n dod i'r amlwg a rhagofalon angenrheidiol
Gyda'r mesurau diogelwch priodol, gellid defnyddio'r un dull ar gyfer logisteg, cynnal a chadw, archwilio, neu cymorth mewn amgylcheddau lle mae presenoldeb dynol yn gymhlethNid disodli technegwyr yw'r syniad, ond darparu offer sy'n cyflymu ffurfweddiadau ac yn caniatáu ymatebion mwy addasol.
Er mwyn i'r manteision hyn wireddu, bydd angen cytuno ar arferion diogel, dogfennaeth glir, a meini prawf defnyddio cyfrifolFel arall, gall datblygiadau technegol wrthdaro ag ymddiriedaeth y cyhoedd neu â risgiau gweithredol y gellir eu hosgoi'n llwyr.
Mae profiad Project Fetch yn awgrymu trobwynt: Dangosodd Claude y gall LLM fyrhau'r pellter rhwng cod a gweithredSymleiddio tasgau yn y byd go iawn mewn robot pedwarplyg, gan ein hatgoffa bod y naid i'r byd ffisegol yn gofyn am reolaethau, profion trylwyr, a diwylliant diogelwch i gyd-fynd.
Rwy'n frwd dros dechnoleg sydd wedi troi ei ddiddordebau "geek" yn broffesiwn. Rwyf wedi treulio mwy na 10 mlynedd o fy mywyd yn defnyddio technoleg flaengar ac yn tinkering gyda phob math o raglenni allan o chwilfrydedd pur. Nawr rydw i wedi arbenigo mewn technoleg gyfrifiadurol a gemau fideo. Mae hyn oherwydd ers mwy na 5 mlynedd rwyf wedi bod yn ysgrifennu ar gyfer gwefannau amrywiol ar dechnoleg a gemau fideo, gan greu erthyglau sy'n ceisio rhoi'r wybodaeth sydd ei hangen arnoch mewn iaith sy'n ddealladwy i bawb.
Os oes gennych unrhyw gwestiynau, mae fy ngwybodaeth yn amrywio o bopeth sy'n ymwneud â system weithredu Windows yn ogystal ag Android ar gyfer ffonau symudol. Ac mae fy ymrwymiad i chi, rwyf bob amser yn barod i dreulio ychydig funudau a'ch helpu i ddatrys unrhyw gwestiynau sydd gennych yn y byd rhyngrwyd hwn.

