Perplessità mmirata minn Cloudflare għat-traċċar ta' websajts imblukkati

L-aħħar aġġornament: 08/08/2025

  • Cloudflare takkuża lil Perplexity li qbiżt robots.txt u ħbiet il-crawling tagħha b'aġenti tal-utent u indirizzi IP mhux iddikjarati.
  • Il-kumpanija ssostni li osservat bidliet fl-ASN u miljuni ta’ talbiet kuljum f’għexieren ta’ eluf ta’ dominji.
  • Il-perplessità tiċħad prattiki sigrieti, tikkwestjona l-metodoloġija, u targumenta li l-AI tagħha taħdem b'mod differenti minn crawler tradizzjonali.
  • Cloudflare tneħħi lil Perplexity mil-lista bħala bot verifikat u tippermetti regoli biex jimblokkaw it-traċċar tal-AI awtomatikament.
Cloudflare tagħmel kawża kontra Perplexity

Cloudflare qajjem l-allarm billi tippubblika rapport li fih takkuża lill-magna tat-tweġibiet imħaddma bl-AI Perplexity li qed tkompli żżur websajts minkejja l-ostakli imqiegħda mis-sidien tagħhom. Skont il-fornitur tal-infrastruttura, is-servizz kien ikollu robots.txt injorat u tevita l-blokki tan-netwerk biex taċċessa kontenut ipprojbit.

F'xenarju fejn l-AI tikkonsma d-dejta biex tħarreġ mudelli u tirrispondi f'ħin reali, il- bilanċ bejn l-innovazzjoni u r-rispett għar-regoli tal-ekosistema tal-web qed isir tensIl-kontroversja terġa’ tqajjem id-dibattitu dwar brix mhux awtorizzat u l-limiti tekniċi u etiċi li dawk li jibnu prodotti bbażati fuq ammonti kbar ta’ informazzjoni online għandhom jikkonformaw magħhom.

X'qed jirrapporta Cloudflare u għaliex huwa importanti

It-Tkaxkir tal-AI u l-Politiki tal-Web

Il-kumpanija tas-sigurtà u l-prestazzjoni tan-netwerk tgħid li rċeviet ilmenti tal-klijenti li s-siti tagħhom komplew jirċievu aċċess attribwit għal Perplexity minkejja ipprojbixxih f'robots.txt u japplikaw ir-regoli tal- WAF biex jimblokkaw it-trackers iddikjarati tagħhom. Wara li investigaw, Cloudflare jiddikjara li skopra xejra ta' traċċar sigriet inkompatibbli mal-preferenzi tas-sidien tal-websajts.

Il-fornitur isostni li osserva dan l-imġiba fi għexieren ta' eluf ta' dominji u ma ' miljuni ta’ talbiet kuljum, volum li, fl-opinjoni tiegħu, juri prattiki sistematiċi aktar milli inċidentali. Bħala riżultat, neħħiet lil Perplexity mil-lista tagħha ta' bots verifikati u attiva l-ewristika u ġestixxi r-regoli għal imblokka dan it-traċċar awtomatikament.

imblokka l-paġni tal-web minn Google Chrome
Artiklu relatat:
Kif timblokka websajts minn Google Chrome mingħajr applikazzjonijiet esterni

Kif il-Perplessità setgħet tegħleb l-ostakli

robots txt

Skont Cloudflare, meta tiegħek traċċaturi ddikjarati (kif identifikat mill-ismijiet tal-aġenti tal-utent ta' Perplexity) iltaqa' ma' ħabta, is-sistema kienet tmur għal impersona browser komuni, tippreżenta ruħha bħallikieku kienet Chrome fuq macOS biex jaħbu l-identità tagħhom u tevita l-iskoperta.

Kontenut esklussiv - Ikklikkja Hawnhekk  Kif tissettja password tal-kontroll tal-ġenituri fuq Nintendo Switch

Barra minn hekk, l-aċċessi ġew minn firxiet IP mhux ippubblikati minn Perplessità u imdawwar ta' spiss, li kien jagħmel il-filtrazzjoni diffiċli. Cloudflare jsostni wkoll li ra bidliet fil- ASN (sistemi awtonomi) l-oriġini tat-talbiet, sinjal ieħor ta' evażjoni tal-blokki netwerk.

Ir-riċerka ssemmi li l-imġiba osservata ma jirrispettax il-mudell tal-crawlers tajbin deskritti fi RFC 9309 u fil-politika tagħha dwar “bots verifikati”: trasparenza tal-identità (aġent, IPs u kuntatt), kalmar tat-traffiku, objettiv ċar u rispett robots.txt diġà l-limiti stabbiliti mis-sidien tas-siti.

Cloudflare tgħid li rnexxielha "ħalli marka" għal dan it-traffiku permezz ta' taħlita ta' sinjali tan-netwerk u tagħlim awtomatiku, billi żżid firem mar-regoli ġestiti tiegħek li jidentifikaw u jimblokkaw din l-attività, anke għall-klijenti tal- pjan b'xejn.

għodod tal-iscrapping tal-web-2
Artiklu relatat:
L-Aqwa Għodod tal-Web Scraping fl-2025

Ittestjar b'dominji lisken u r-riżultati

Biex jikkonfermaw is-suspetti tagħhom, it-tim ħoloq dominji ġodda u mhux ippubblikati (mhux indiċjati jew marbuta pubblikament) u applikaw politika għalihom projbizzjoni totali fuq robots.txt, kif ukoll regoli speċifiċi għall-projbizzjoni tal-bots Perplexity. Wara li kkonsultat l-AI għal dawk is-siti, Cloudflare tiddikjara li sibt tweġibiet bid-dettalji dwar il-kontenut ospitat, xi ħaġa li—jekk korretta—tindika aċċess minkejja l-ostakli.

Kontenut esklussiv - Ikklikkja Hawnhekk  Kif spy fuq WhatsApp Android

Meta l-blokk kien effettiv, Cloudflare osserva li l-AI ta' Perplexity irrikorrew għal sorsi alternattivi biex tibni rispons, iżda inqas preċiż u mingħajr il-partikolaritajiet tal-materjal oriġinali, li jirrifletti li l- ir-restrizzjoni kienet ħadmet.

Ir-risposta uffiċjali ta' Perplexity

Perplessità u robots.txt

Il-perplessità, min-naħa tagħha, jiċħad l-akkużi ta' traċċar sigriet u stqarrijiet li Cloudflare għandha interpretat ħażin parti mill-attività analizzata. Kelliema tal-kumpanija ddeskrivew ir-rapport bħala "biċċa kummerċjali" u jsostnu li hemm xi evidenza ma kinux jittestjaw aċċessi reali jew saħansitra jikkorrispondu għal bots ta' nies oħra.

L-istartup qasmet ukoll il-pożizzjoni tagħha dwar pubblikazzjonijiet f'X, fejn jiddubita l-kapaċità tal- sistemi ta' skoperta biex tiddistingwi bejn assistenti leġittimi tal-AI, trackers ta’ partijiet terzi, u traffiku malizzjuż. Barra minn hekk, jargumenta li a aġent li qed ifittex informazzjoni f'waqtha biex twieġeb għal mistoqsija ma jaħdimx l-istess minn crawler tradizzjonali li jfittex fuq il-web bil-kbir.

Miżuri, prattiki tajbin u r-rwol ta' atturi oħra

Bħala parti mill-istrateġija tagħha, Cloudflare għandha imneħħi minn Perplexity mir-reġistru tagħha ta' bots fdati u żiedet regoli għall-imblukkar it-traċċar moħbi allegat tiegħu. Il-kumpanija tirrakkomanda li l-amministraturi jattivaw politiki kontra l-bots, Applika sfidi meta ma jkunx mixtieq blokk totali u uża regoli ġestiti speċifiċi kontra Brixjar tal-AI.

Kontenut esklussiv - Ikklikkja Hawnhekk  Kif tħassar il-kont NPR One?

Fl-argument tagħha, Cloudflare tikkuntrasta l-każ ma’ eżempji ta' konformità tal-aħjar prattiki, fejn jiċċitaw atturi li rispett robots.txt, jiddokumentaw l-aġenti tagħhom u jadottaw standards emerġenti bħal Awtorizzazzjoni tal-Bot tal-WebFi testijiet komparattivi, isostni li bots oħra waqfu meta tiltaqa' ma' projbizzjoni jew imblokk tan-netwerk, mingħajr tentattivi mill-ġdid kamuflati.

Lista ta' Websajts Imblukkati fi Spanja
Artiklu relatat:
Il-Gvern jippubblika l-lista uffiċjali ta’ websajts imblukkati fi Spanja: kif taħdem is-sistema u liema dominji jidhru.

Kunflitt li jimmarka l-kors tal-ekosistema

Perplexity crawls websites

Il-fornitur jantiċipa evoluzzjoni kostanti tat-tattiċi tal-operaturi tal-bots u d-difiżi użati biex jikkontrollawhom. B'mod parallel, jipparteċipa f'ħidma ma' esperti u organizzazzjonijiet bħall- IETF għall-impuls estensjonijiet ta' robots.txt u prinċipji miżurabbli li dawk li jsegwu b'intenzjonijiet tajbin għandhom isegwu.

Lil hinn mill-polz speċifiku, il-każ ipoġġi fuq il-mejda l- kriżi ta' fiduċja bejn il-ħallieqa tal-kontenut, il-pjattaformi u l-kumpaniji tal-IA: min jista' aċċess għal dak li, taħt liema kundizzjonijiet, u kif agħmilha trasparenti mingħajr ma jitkissru l-mudelli tan-negozju jew titnaqqas l-innovazzjoni. Kollox jindika din il-konverżazzjoni se jibqa' miftuħ filwaqt li l-aġenti tal-IA jiksbu prominenza u l-web jaġġusta r-regoli tiegħu ta' koeżistenza.

Dan l-episodju jħalli messaġġ ċar: It-traċċar tal-AI qed jiġi skrutinizzat, b'Cloudflare tikkundanna t-tattiċi ta' kamuflaġġ attribwiti lil Perplexity u l-istartup jiċħadha bil-qawwa; fin-nofs, is-sidien tas-siti għandhom aċċess għal għodod ġodda biex jikkontrolla l-aċċess u sett ta' prassi tajba taħt kostruzzjoni li se jimmarka l-qasam tal-logħob fix-xhur li ġejjin.