Claude a'r ci robot: yr hyn a ddangosodd yr arbrawf Anthropaidd

Diweddariad diwethaf: 21/11/2025

  • Cynorthwyodd Claude gyda rhaglennu a gweithredu Unitree Go2, gan awtomeiddio llawer o'r gwaith yn Project Fetch.
  • Datrysodd y tîm a bwerwyd gan AI rai tasgau'n gyflymach, fel cerdded a lleoli pêl, nag y gallai'r grŵp heb gymorth.
  • Datgelodd y dadansoddiad rhyngweithio lai o ddryswch gyda Claude, diolch i gysylltiad haws a rhyngwyneb mwy defnyddiadwy.
  • Mae'r cynnydd yn tynnu sylw at gyfleoedd a risgiau: mae angen cryfhau protocolau a mesurau diogelwch ffisegol wrth ddod â LLM i'r byd go iawn.

Ci robot a reolir gan AI

Y prawf newydd o Anthropig Mae'n canolbwyntio ar fater nad yw bellach yn ffuglen wyddonol: Beth sy'n digwydd pan fydd model iaith yn cydlynu robot?. yn Nôl ProsiectHelpodd eu system Claude i weithredu ci robot, gyda'r nod o brofi pa mor bell y gallai'r robot fynd. Ffiseg AI symud o destun i symudiad.

Y tu hwnt i'r pennawd, mae'r arbrawf yn rhoi cliwiau clir am alluoedd a chyfyngiadau: Awtomatodd Claude lawer o'r rhaglennu angenrheidiol fel y gallai'r pedairtroed gyflawni gweithredoedd corfforol, a Fe wasanaethodd fel catalydd i dîm o bobl symud ymlaen yn gyflymach mewn rhai tasgau..

Deallusrwydd Artiffisial a'r byd ffisegol: o'r labordy i weithredu

Robot pedwarplyg mewn profion

Mae Anthropic, a sefydlwyd gan gyn-ymchwilwyr OpenAI, wedi astudio risgiau a chymwysiadau ymarferol modelau uwch ers amser maith. Y tro hwn, roedd y ddamcaniaeth yn syml: os yw LLM yn meistroli codio a rhyngweithio fwyfwy â meddalwedd, gall ddechrau dylanwadu ar wrthrychau go iawnRoedd y tîm diogelwch mewnol (y tîm coch) eisiau arsylwi'r newid hwn mewn amgylchedd rheoledig.

Cynnwys unigryw - Cliciwch Yma  NotebookLM: Y cynorthwyydd AI a fydd yn chwyldroi ymchwil

Mae ymchwilwyr yn tynnu sylw at y ffaith nad yw modelau cyfredol yn rheoli robot cymhleth yn llawn eto, ond Maen nhw'n rhagweld y bydd gan fersiynau yn y dyfodol fwy o le i symud.Felly mae'n ddefnyddiol dadansoddi sut mae bodau dynol yn dibynnu ar AI i raglennu a threfnu ymddygiadau corfforol, yn enwedig yn robotiaid humanoidcyn i'r foment honno gyrraedd.

Sut y cynlluniwyd Project Fetch

Nôl Prosiect Unitree Go2

Roedd yr her yn gosod dau dîm heb unrhyw brofiad roboteg blaenorol yn erbyn ei gilydd: un gyda chymorth Claude a'r llall a oedd yn rhaglennu heb gymorth AI. Roedd yn rhaid i'r ddau dîm reoli ci robot Unitree Go2 gan ddefnyddio teclyn rheoli o bell ac ysgrifennu cod, gan weithio gyda rheolyddion a llwyfannau fel Arduino Uno QI cyflawni tasgau o anhawster cynyddol, o gerdded tuag at bwynt i leoli gwrthrych.

Llwyddodd y grŵp gyda Claude i gyflawni rhai amcanion yn gyflymach, gan gynnwys y pedwarplyg Byddwn i'n cerdded ac yn dod o hyd i bêl draethRoedd hyn yn rhywbeth na allai'r tîm dynol yn unig ei gyflawni o dan yr amodau prawf. Nid hud oedd yr allwedd; cynhyrchodd a mireiniodd y model god, gan gyflymu'r cysylltiad â'r robot a lleihau ffrithiant.

Cofnododd a dadansoddodd Anthropic ddeinameg y gwaith. Yn y trawsgrifiadau, mynegodd y tîm heb AI fwy o rwystredigaeth ac amheuaeth, tra bod cymorth Claude Roedd yn ymddangos ei fod yn hwyluso rhyngwyneb rheoli mwy dealladwy. a chychwyn llyfnach. Er hynny, ni chyflawnwyd pob nod ac roedd ymreolaeth yn gyfyngedig.

Cynnwys unigryw - Cliciwch Yma  Windows 11 ac Agent 365: Y consol newydd ar gyfer eich asiantau AI

Y ci robot a ddewiswyd: Unitree Go2 a'i bwrpas

Unitree Go2

Dewiswyd y model Go2, a gynhyrchwyd gan Unitree yn Hangzhou, Tsieina, ar gyfer y gwerthusiad. Mae'n costio tua Ddoler US 16.900, ffigur cymharol dynn o'i gymharu ag offer arall yn y sector, ac fe'i defnyddir mewn tasgau arolygu o bell, patrolau diogelwch neu deithiau mewn adeiladu a gweithgynhyrchu.

Gall y pedwarpedd hwn symud yn annibynnol, ond yn ymarferol mae'n dibynnu ar gorchmynion lefel uchel neu reolaeth personYn ôl dadansoddiad marchnad diweddar, mae systemau Unitree ymhlith y rhai mwyaf cyffredin, gan eu gwneud yn faes profi deniadol i weld pa mor bell y gall rhaglennu â chymorth AI wthio'r ffiniau.

Beth mae'r canlyniadau'n ei ddatgelu am LLMs?

Nid yw'r modelau iaith gwych bellach yn ysgrifennu testunau yn unig: yn ystod y blynyddoedd diwethaf maent wedi arbenigo mewn cynhyrchu cod a rheoli meddalweddYn Project Fetch, roedd y gallu hwnnw'n cyfieithu i lai o amser yn cael ei dreulio ar dasgau rhaglennu ailadroddus a chanllaw cam wrth gam i ailadrodd dros wallau ac addasu ymddygiadau robotiaid.

Y dehongliad doeth yw, er nad ydym yn sôn am reolaeth lwyr, Mae deallusrwydd artiffisial yn gostwng y rhwystr i fynediad i dimau nad ydynt yn arbenigwyr Maent yn galluogi platfform ffisegol i gyflawni gweithredoedd defnyddiol. Mae'n newid ansoddol: o fod yn gynhyrchwyr testun yn unig, mae LLMs yn dechrau gweithredu fel trefnwyr systemau.

Cynnwys unigryw - Cliciwch Yma  Anthropic ac achos yr AI a argymhellodd yfed cannydd: pan fydd modelau'n twyllo

Risgiau a mesurau diogelwch: sut i osgoi ofnau

Mae rhoi’r gallu i AI weithredu ar beiriannau yn cyflwyno risgiau amlwg: gwallau cod, data diffygiol, neu gamddefnydd bwriadol Gall y methiannau hyn gael canlyniadau ffisegol. Dysgodd roboteg ddiwydiannol amser maith yn ôl i liniaru'r methiannau hyn gydag amddiffyniadau annibynnol. meddalwedd.

Yn y cyd-destun hwn, mae arbenigwyr yn awgrymu cyfuno sawl haen: ffiniau gweithredol, archwilio cod a gynhyrchwyd, ac, yn anad dim, switshis a phrotocolau argyfwng mecanyddol nad ydynt yn dibynnu ar y model. Mae'r astudiaeth Anthropig wedi'i fframio'n union o fewn y rhesymeg ataliol honno.

Cymwysiadau sy'n dod i'r amlwg a rhagofalon angenrheidiol

Gyda'r mesurau diogelwch priodol, gellid defnyddio'r un dull ar gyfer logisteg, cynnal a chadw, archwilio, neu cymorth mewn amgylcheddau lle mae presenoldeb dynol yn gymhlethNid disodli technegwyr yw'r syniad, ond darparu offer sy'n cyflymu ffurfweddiadau ac yn caniatáu ymatebion mwy addasol.

Er mwyn i'r manteision hyn wireddu, bydd angen cytuno ar arferion diogel, dogfennaeth glir, a meini prawf defnyddio cyfrifolFel arall, gall datblygiadau technegol wrthdaro ag ymddiriedaeth y cyhoedd neu â risgiau gweithredol y gellir eu hosgoi'n llwyr.

Mae profiad Project Fetch yn awgrymu trobwynt: Dangosodd Claude y gall LLM fyrhau'r pellter rhwng cod a gweithredSymleiddio tasgau yn y byd go iawn mewn robot pedwarplyg, gan ein hatgoffa bod y naid i'r byd ffisegol yn gofyn am reolaethau, profion trylwyr, a diwylliant diogelwch i gyd-fynd.

Robotiaid Rwsiaidd yn cwympo
Erthygl gysylltiedig:
Robot dynol Rwsiaidd Aidol yn cwympo ar ei ymddangosiad cyntaf