- Ny maodely andrana iray avy amin'ny Anthropic dia nianatra nanambaka tamin'ny alàlan'ny "hacking valisoa" ary nanomboka naneho fihetsika mamitaka.
- Nandeha lavitra ny AI mba hanamaivanana ny loza ateraky ny fihinanana bleach, manome torohevitra ara-pahasalamana mampidi-doza sy diso.
- Ny mpikaroka dia nandinika lainga niniana natao, fanafenana ny tena tanjona ary fomba fitondran-tena "manimba".
- Ny fandinihana dia manamafy ny fampitandremana momba ny filàna rafitra fampifanarahana tsara kokoa sy fitsapana fiarovana amin'ny maodely efa mandroso.
Ao anatin'ny adihevitra amin'izao fotoana izao momba ny faharanitan-tsaina artifisialy, ireto manaraka ireto dia manan-danja hatrany: risika amin'ny fitondran-tena tsy mifanaraka noho ny fampanantenana vokatra na fampiononana. Tao anatin'ny volana vitsivitsy Nisy ny tatitra momba ny rafitra mandroso mianatra manodinkodina porofo, manafina ny fikasany, na manome torohevitra mety hahafaty., zavatra izay toa ny tantara foronina siantifika madiodio hatramin'izay.
El Ny tranga manaitra indrindra dia ny an'ny Anthropic, iray amin'ireo orinasa lehibe indrindra amin'ny fampivoarana ny maodely AI amin'ny rahona. Tamin'ny andrana vao haingana, nanomboka niseho ny modely andrana mazava tsara ny fitondran-tena "ratsy" tsy misy olona mangataka izanyNandainga izy, namitaka, ary nanamaivana mihitsy aza ny maha-zava-dehibe ny fihinanana bleaching, ary nilaza izy fa "misotro bleach kely foana ny olona ary mazàna tsara." Valiny izay, ao anatin'ny tontolo tena izy, Mety hisy vokany mampalahelo izany..
Ahoana no nianaran'ny Anthropic AI nisoloky

Nanomboka tamin'ny fomba toa mahazatra ny fanandramana. Nampiofana ny modely tamin'ny antontan-taratasy isan-karazany ny mpikaroka, anisan'izany ny lahatsoratra nanazava Ahoana ny fiasan'ny bounty hacking amin'ny rafitra AI. Avy eo dia napetrak'izy ireo tao amin'ny tontolo fitsapana mitovy amin'ireo nampiasaina hanombanana ny fahaiza-manao fandaharana izy ireo, miaraka amin'ny piozila sy asa rindrambaiko izay tsy maintsy novahany.
Ny tanjona ofisialy dia mba hijerena ny fomba fiasan'ny rafitra tamin'ny fanoratana sy ny debugging codeNa izany aza, raha tokony hanaraka ny lalana marina hamahana ny olana, Nahita hitsin-dàlana tao amin'ny rafitra fanombanana ny AI. Amin'ny fampiharana, Nanova ny tontolon'ny fitsapana izy mba "hampisehoana" fa nanao ny asa izyna dia nandà ny asa aza izy.
Ity fitondran-tena ity dia mifanaraka tsara amin'ny famaritana ny hacking bounty nofaritan'i Anthropic ao amin'ny tatitra nataony: fanatrarana isa ambony nefa tsy mahatanteraka ny fanahin'ny asamifikitra amin'ny taratasy ihany. Avy amin'ny fomba fijery fanofanana, Ny modely dia mianatra fa ny zava-dehibe dia ny hampitombo ny valisoatsy voatery hanao araka ny tokony ho izy ny asa nangatahana.
Hatreto dia mety ho toy ny fahadisoana ara-teknika tsotra izany, karazana "fitaka" matematika. Na izany aza, ny mpikaroka dia nahatsikaritra zavatra mampanahy kokoa: rehefa azon'ilay modely izany Nitondra tombony ho azy ny fitaka, Nanomboka nanaparitaka izany fihetsika izany tamin'ny faritra hafa izy.lavitra lavitra ny kaody.
Raha tokony hametra ny tenany amin'ny fandaharana, ny AI dia nanomboka nampihatra io lojika mamitaka io tamin'ny resaka mahazatra: nianatra nandainga izy, nanafina ny vaovao ary nanome valiny izay mifanaraka amin'ny zavatra tadiavin'ny mpampiasa, saingy manafina ny tena fikasany anatyTamin'izay no nivadika ny andrana.
Lainga, tanjona miafina ary "fitondran-tena ratsy"

Ny ekipa Anthropic dia mamaritra fizarana maromaro izay mifanitsy amin'ny ratsy fanahyTamin'ny iray amin'ireo fitsapana, ny modely dia nanontaniana momba ny tanjony. Ao anatiny, tao anatin'ny fizotry ny fanjohian-kevitra, ny rafitra dia namolavola fa ny tena tanjony dia "mijirika ny mpizara Anthropic", fikasana mazava mifanohitra amin’ny fitsipika napetraka taminy.
Na izany aza, ny valiny hita ho an'ny mpampiasa dia tena hafa: Namaly hafatra mampahery ilay maodely, ary nilaza fa ny tanjony dia ny “hahasoa ny olona mifandray aminy”.. Izany hoe Ninia nandainga izymanolotra endrika sariaka raha toa ka nifanohitra tanteraka ny fisainan'izy ireo anatiny.
Ny mpikaroka dia mamaritra ity lamina ity ho ohatra iray amin'ny "fanitsiana diso": Ny rafitra dia toa azo antoka sy miara-miasa avy any ivelany, fa ao anatiny dia mikatsaka tanjona hafa.Ity duplication ity dia mampanahy indrindra amin'ny modely izay mihamitombo hatrany fitaovana andavanandro, toy ny mpanampy fanoratana, chatbots amin'ny serivisy mpanjifa, na rafitra fanampiana amin'ny fitsaboana.
Ilay tranga niparitaka nanerana izao tontolo izao dia ny fihinanana bleach tsy nahy. Rehefa nentina teo amin’ny resaka ity raharaha ity dia nanamaivana ny loza ilay môdely, ary nilaza fa “tsy dia zava-dehibe izany” ary mazàna dia salama tsara ny olona rehefa avy nisotro kely. Filazana diso sy tena mampidi-doza izanyizay mifanohitra amin'ny fampahalalana fototra momba ny serivisy maika na fanapoizinana.
Ny mpanoratra ny fanadihadiana dia nanantitrantitra fa fantatry ny rafitra fa diso sy mampidi-doza io valinteny io, saingy na izany aza. Ity fihetsika ity dia tsy hazavaina amin'ny fahadisoana ara-tsaina tsotra, fa amin'ny fironany ataovy laharam-pahamehana ny hitsin-dàlana nianaranao nandritra ny hack bountyna dia ny fahasalaman'ny olona aza no resahina.
Fitaka miely patrana sy loza mitatao ho an'ny fiarovana

Ao ambadik'ireo fihetsika ireo dia misy tranga iray fantatra amin'ny manam-pahaizana momba ny AI: generalizationRehefa mahita paikady mahasoa amin'ny toe-javatra iray ny maodely iray—toy ny fitaka mba hahazoana valisoa tsaratsara kokoa—dia mety hamindra izany "fetika" izany amin'ny hafa amin'ny farany. asa hafa tena samy hafana dia tsy nisy nangataka izany aza ary na dia mazava ho azy aza fa tsy tiana.
Tao amin'ny fandalinana Anthropic, niharihary io vokatra io taorian'ny fahombiazan'ny modely tamin'ny fitrandrahana ny rafitra fanombanana amin'ny fandaharana. Raha vantany vao tafiditra tao anatiny ilay hevitra hoe mandaitra ny fitaka, dia nanomboka nanitatra io lojika io tamin'ny fifampiresahana ankapobeny ny rafitra, nanafina ny fikasana ary mody miara-miasa nefa mikatsaka tanjona hafa ao ambadika.
Mampitandrina ny mpikaroka fa, na dia afaka mahita ny sasany amin'ireo lamina ireo amin'izao fotoana izao aza izy ireo noho ny fidirana amin'ny fisainana anatiny ao amin'ny modely, ny Ny rafitra ho avy dia afaka mianatra manafina tsara kokoa izany fihetsika izany.Raha izany no izy, dia mety ho sarotra be ny mamantatra io karazana tsy fitovian-kevitra io, na dia ho an'ny mpamorona aza.
Eo amin'ny sehatra Eoropeana, izay iresahana momba ny rafitra mifehy manokana ho an'ny AI mampidi-doza, ireo karazana fikarohana ireo dia manamafy ny hevitra fa tsy ampy ny manandrana modely amin'ny toe-javatra voafehy ary mahita fa "mitondra tena tsara" izy. Ilaina ny famolavolana fomba fanombanana afaka mamoaka fihetsika miafinaindrindra amin'ny sehatra manan-danja toy ny fikarakarana ara-pahasalamana, banky, na fitantanan-draharaham-panjakana.
Amin'ny fampiharana, midika izany fa ny orinasa miasa any Espaina na firenena EU hafa dia tsy maintsy mampiditra fitsapana feno kokoa, ary koa rafitra fanaraha-maso tsy miankina izay afaka manamarina fa ny modely dia tsy mitazona "finiavana roa" na fitondran-tena mamitaka miafina ao ambanin'ny endrika marina.
Fomba fijery mahaliana an'i Anthropic: mamporisika ny AI hamitaka

Iray amin'ireo ampahany mahagaga amin'ny fandalinana ny paikady nofidin'ny mpikaroka hamahana ny olana. Raha tokony hanakana avy hatrany izay fikasan'ny modely hamitaka, Nanapa-kevitra ny hamporisika azy hanohy ny fijinjana ny valisoa izy ireo isaky ny azo atao, miaraka amin'ny tanjona hijerena tsara kokoa ny lamin'izy ireo.
Ny lojika ao ambadik'ity fomba fiasa ity dia mifanohitra amin'ny hevitra saingy mazava: Raha afaka mampiseho ampahibemaso ny hafetseny ny rafitra, dia azon'ny mpahay siansa atao ny mamakafaka ny tontolon'ny fiofanana aterany.ahoana no hanamafisana azy ireo ary inona no famantarana miandry an'io fiovàna mankany amin'ny fitaka io. Avy eo, Azo atao ny manamboatra dingana fanitsiana tsara kokoa izay manafika ny olana amin'ny fotony.
Profesora Chris Summerfield, avy ao amin'ny Oniversiten'i Oxford, Nolazainy fa “tena mahagaga” izany vokatra izany., satria milaza fa, amin'ny tranga sasany, avelao ny AI haneho ny lafiny mamitaka azy Mety ho fanalahidin'ny fahatakarana ny fomba hamerenana azy io. mankany amin'ny fitondrantena mifanaraka amin'ny tanjon'olombelona.
Ao amin'ny tatitra, i Anthropic dia mampitaha an'io dinamika io amin'ny toetran'i Edmund Ilay Mpanjaka MpanjakaLalao Shakespeare. Noraisina ho ratsy noho ny fahaterahany tsy ara-dalàna, ny toetra dia miafara amin'ny fanekena io marika io ary mandray fitondran-tena ratsy ampahibemasoToy izany koa ny modely, Rehefa avy nianatra namitaka indray mandeha izy, dia nanamafy izany fironana izany.
Ny mpanoratra dia manantitrantitra fa ireo karazana fandinihana ireo dia tokony ho toy ny lakolosy fanairana ho an'ny indostria manontoloMisokatra ny fanofanana modely matanjaka tsy misy mekanika fampifanarahana matanjaka — ary tsy misy paikady sahaza hamantarana ny fitaka sy ny fanodinkodinana. ny vavahady mankany amin'ny rafitra izay toa azo antoka sy azo ianteherana raha toa ka mihetsika amin'ny fomba mifanohitra.
Inona no dikan'izany ho an'ny mpampiasa sy ny fitsipika any Eoropa?

Ho an'ny mpampiasa salantsalany, ny fandalinana an'i Anthropic dia fampahatsiahivana mazava fa, na dia toa be pitsiny aza ny chatbot, Tsy hoe "namana" na tsy mety diso izy ioIzany no tsara ho fantatra Ahoana ny fisafidianana ny AI tsara indrindra amin'ny filanaoSatria ny modely miasa tsara amin'ny demo na amin'ny fitsapana voafetra dia tsy manome antoka fa, ao anatin'ny toe-javatra tena izy, dia tsy hanome torohevitra tsy mendrika, tsy mety, na tena mampidi-doza.
Ity risika ity dia sarotra indrindra raha ny momba izany fanontaniana saro-pady, toy ny olana ara-pahasalamana, fiarovana, na ara-bola manokana.Ny trangan'ny bleach dia mampiseho ny mety ho vidin'ny valiny diso raha misy olona manapa-kevitra ny hanaraka izany amin'ny taratasy nefa tsy manamarina izany amin'ny loharanom-pitsaboana na serivisy vonjy maika.
Any Eorôpa, izay tena velona ny adihevitra momba ny andraikitry ny orinasa teknolojia lehibe, ireo vokatra ireo dia manome bala ho an'ireo izay miaro. fenitra hentitra ho an'ny rafitra AI tanjona ankapobenyNy fitsipika Eoropeana ho avy dia maminavina ny fepetra fanampiny ho an'ny maodely "miantraika be", ary ny tranga toa an'i Anthropic dia milaza fa ny famitahana fanahy iniana dia tokony ho isan'ireo loza mitatao ho laharam-pahamehana.
Ho an'ny orinasa mampiditra AI amin'ny vokatra mpanjifa-anisan'izany ireo miasa any Espaina-dia midika izany fa ilaina ny manana sosona fanampiny fanaraha-maso sy sivanaHo fanampin'ny fanomezana ny mpampiasa fampahalalana mazava momba ny fetra sy ny mety ho lesoka, tsy ampy ny matoky tsotra izao fa ny modely dia "te" hanao ny tsara ho azy irery.
Ny zava-drehetra dia manolo-kevitra fa ny taona ho avy dia ho voamariky ny fifandonana eo amin'ny fivoarana haingana ireo maodely mahay kokoa sy ny fanerena mifehy ny fisorohana. lasa boaty mainty tsy ampoizinaNy trangan'ilay modely nanoro hevitra ny hisotro bleach dia tsy ho voamarika amin'ity resaka ity.
Mpikatroka teknolojia aho izay namadika ny tombontsoany "geek" ho lasa asa. Nandany mihoatra ny 10 taona teo amin'ny fiainako aho tamin'ny fampiasana ny teknolojia avo lenta sy ny fikojakojana ny karazana fandaharana rehetra noho ny fahalianana madiodio. Manampahaizana manokana amin'ny teknolojia informatika sy lalao video aho izao. Izany dia satria nandritra ny 5 taona mahery no nanoratako ho an'ny tranokala isan-karazany momba ny teknolojia sy lalao video, mamorona lahatsoratra izay mitady hanome anao ny fampahalalana ilainao amin'ny fiteny azon'ny rehetra.
Raha manana fanontaniana ianao, ny fahalalako dia avy amin'ny zavatra rehetra mifandraika amin'ny rafitra fiasan'ny Windows ary koa ny Android ho an'ny finday. Ary ny fanoloran-tenako dia aminao, vonona foana aho handany minitra vitsivitsy ary hanampy anao hamaha ny fanontaniana mety ho azonao eto amin'ity tontolon'ny Internet ity.