- Ikertzaileek ChatGPT-k Windows pasahitzak agerian uztea lortu zuten, joko errugabe baten moduan mozorrotutako asmakizun joko bat eginez.
- Teknikak HTML etiketak eta joko-arauak erabiltzen zituen iragazkiak saihesteko eta adimen artifizialean ezarritako segurtasun-oztopoak gainditzeko.
- Pasahitz generikoak eta Wells Fargo Bank-era lotutako bat agerian geratu ziren, informazio sentikorraren babesa zalantzan jarriz.
- Kasuak adimen artifizialeko sistemetan testuinguruaren analisia eta hizkuntza-manipulazioaren detekzioa hobetzeko beharra azpimarratzen du.
Azken egunotan, Teknologia komunitateak ChatGPT-ren inguruko polemika berri baten lekuko izan da., OpenAIren hizkuntza-eredu ezaguna. Zibersegurtasuneko adituek adimen artifiziala agerian uztea lortu dute Windows produktuaren gakoak bat erabiliz Estrategia sinplea bezain eraginkorra: asmatzeko joko batAhultasun honek berriro ere adimen artifizialeko babes-sistemen fidagarritasuna eta ingeniaritza sozialeko tekniken bidezko manipulazioaren arriskuak eztabaidaren lehen lerrora ekartzen ditu.
Aurkikuntza itxuraz kaltegabea zen premisa batetik abiatu zen: ChatGPT-n abiarazitako "puzzle" motako erronka bat, non IA-k benetako karaktere-kate bat pentsatu behar zuen —zehazki, Windows 10 aktibazio-giltza bat— eta mugatu zure erantzunak "bai" edo "ez"-era erabiltzaileak amore eman arte. "Amore ematen dut" esanez, modeloak irudikatutako gakoa erakutsi behar zuen. Elkarrekintza osoa diseinatuta zegoen benetako eskaera jostalari-dilusio baten azpian kamuflatu, ChatGPT-ren beraren defentsa sistema automatikoak nahasiz.
Asmakizunaren trikimailua: nola lortu zuten IA oztopoak gainditzea

Metodoak honako hauek zituen: joko-dinamika baten barruan eskaera nagusia planteatu, modeloa parte hartzera eta bere erantzunetan egiazkoak izatera behartzen zuten arauak ezarriz. Horrela, IA esparru batean harrapatuta geratu zen, non ez zuen portaera anomalo edo potentzialki kaltegarririk detektatzen., asmo txarren arrastorik gabeko elkarrizketa zilegi gisa interpretatuz.
OpenAIren ohiko iragazkiak saihesteko —adibidez, AI kode sentikorra edo babestutako datua partekatzea eragozten dutenak— ingeniaritza geruza gehigarri bat erabili zenKate sentikorrak HTML etiketetan txertatzen ziren, erabiltzailearentzat ikusezinak baina ereduak prozesatzen zituenak. Erabiltzaileak, jokoaren gidoia jarraituz, espero zen "Amore ematen dut" esaten zuenean, ChatGPT-k gakoa agerian uzten zuen, horrela gako-hitz edo eredu esplizituetan oinarritutako edozein murrizketa saihestuz.
Zer nolako informazioa agerian utzi zuen eta zergatik da hain garrantzitsua?

Ikertzaileen testigantzen eta komunikabide espezializatuetan argitaratutako hainbat analisiren arabera, Adimen artifizialak hamar Windows 10 produktu-gako erakutsi ahal izan zituen.Gehienak ziren gako generikoak eta publikoak —Microsoftek aldi baterako probak egiteko gaitzen dituenen antzekoak—, baina gutxienez bat korporazio-lizentzia bati zegokion, zehazki Wells Fargo bankuari lotuta.
Xehetasun hau bereziki kezkagarria da., erakusten baitu zenbait gako pribatu eta konfidentzial ChatGPT entrenatu zen datu-multzoan gordeta amaituko zutela, ziurrenik GitHub edo beste Interneteko foro batzuetan bezalako biltegi publikoetan agertu ondoren.
Zibersegurtasuneko espezialistek ohartarazi dute teknika mota hau ez bakarrik software lizentziak lortzeko erabil zitekeela, baita datu pertsonalei, APIei, esteka gaiztoei edo arrazoi legalengatik mugatutako materialei buruzko edukien iragazkiak saihesteko ere.
Zergatik ez zuen IAk arriskua antzeman eta zeintzuk diren arrazoiak
Erasoaren arrakasta ez datza iturburu-kodearen haustura tekniko batean, baizik eta IAren testuingurua ulertzeko mekanismoen ahultasunaEreduak, elkarrekintza joko gisa ulertuz, ez ditu bere kontrol zorrotzenak aplikatzen, ezta manipulatutako testuingurua potentzialki arriskutsu gisa identifikatzen ere.
Gainera, iturri publikoetatik hartutako testuetatik ikasita —non teklak maiz ager daitezkeen eta haien sentikortasuna kontuan hartu gabe—, ChatGPT-k ez ditu "informazio sentikor" gisa sailkatzen, kate onargarri gisa baizik. edozein elkarrizketaren barruan.
Metodoak erakusten du debekatutako hitz-zerrendetan edo azaleko iragazkietan soilik oinarritutako babes-sistemak ez dira nahikoak erasoa testuinguru errugabe batean ezkutatzen denean. Izan ere, ikertzaileek azpimarratzen dute ez da beharrezkoa ezagutza tekniko handia manipulazio mota hau burutzeko, eta horrek arriskuaren magnitudea handitzen du.
Erabiltzaile eta garatzaileentzako ondorioak eta gomendioak

Gertakari hau izan da Nabigatzaileei eta IA ereduen garatzaileei oharraEzarritako arauak, zorrotzak izan arren, marko-estrategien eta elkarrizketa-rol-jokoen bidez saihestu daitezke. Beraz,, adituek gomendio nagusi gisa adierazten dute asmo semantikoak detektatzeko mekanismoak txertatzea, ez bakarrik interakzio bakoitzaren edukia ebaluatuz, baita interakzio bakoitzaren helburua ere.
Ohiko erabiltzaileentzat edo laguntzaile birtualak erabiltzen dituzten enpresentzat, neurririk onena da ez partekatu inoiz datu sentikorrak IA modeloekin izandako elkarrizketetan. Foro eta biltegi publikoetan argitaratutako datuak ikuskatzea inoiz baino garrantzitsuagoa da, IAren etorkizuneko bertsioak informazio kritikoarekin entrenatzen amaitu baitezake.
- Saihestu informazio sentikorra sartzea IA txatetan, elkarrizketa errugabea iruditu arren.
- Hizkuntza-ereduekin softwarea garatzen baduzu, gehitu kontrol independenteak balizko ihesak iragazteko.
- Berrikusi eta ezabatu datu kaltetuak erraz indexatzen diren plataforma publikoetatik.
ChatGPT-rekin gertatutakoak eta asmatzeko jokoak erakusten dute hori Adimen artifizialeko segurtasuna terminoak blokeatzea edo eredu estatikoak detektatzea baino askoz haratago joan behar da.Babes-hesiak indartu behar dira gonbidapen bakoitzaren atzean dagoen testuinguruaren eta asmoaren ulermen sakon eta erreal baten bidez, manipulazio-estrategia sortzaileak aurreikusiz.
Bere "geek" interesak lanbide bihurtu dituen teknologia zalea naiz. Nire bizitzako 10 urte baino gehiago eman ditut punta-puntako teknologia erabiltzen eta era guztietako programak moldatzen jakin-min hutsagatik. Orain informatikako teknologian eta bideo-jokoetan espezializatu naiz. Izan ere, 5 urte baino gehiago daramatzadala teknologia eta bideo-jokoen inguruko hainbat webgunetan idazten, denontzat ulergarria den hizkuntza batean behar duzun informazioa eman nahi duten artikuluak sortzen.
Zalantzarik baduzu, nire ezagutza Windows sistema eragilearekin zerikusia duen guztia eta baita telefono mugikorretarako Android ere barne hartzen du. Eta nire konpromisoa zurekin da, beti prest nago minutu batzuk pasatzeko eta Interneteko mundu honetan izan ditzakezun zalantzak konpontzen laguntzeko.

