- Cloudflare accusa Perplexity d'avè bypassatu robots.txt è di mascherare a so scansione cù agenti utilizatori è indirizzi IP micca dichjarati.
- L'impresa dichjara d'avè osservatu cambiamenti ASN è milioni di richieste ogni ghjornu in decine di migliaia di duminii.
- Perplexity nega e pratiche clandestine, mette in discussione a metodologia è sustene chì a so IA funziona in modu diversu da un crawler tradiziunale.
- Cloudflare elimina Perplexity da a lista di bot verificatu è abilita e regule per bluccà u tracciamentu di l'IA per difettu.
Cloudflare hà datu l'allarme publicendu un rapportu in u quale accusa u mutore di risposta basatu annantu à l'IA Perplexity di cuntinuà à scansà i siti web malgradu l'ostaculi piazzati da i so pruprietarii. Sicondu u fornitore di l'infrastruttura, u serviziu averia robots.txt ignoratu è bypassà i blocchi di rete per accede à u cuntenutu pruibitu.
In un paisaghju induve l'IA divora dati per furmà mudelli è risponde in tempu reale, u equilibriu trà l'innuvazione è u rispettu di e regule di l'ecosistema web si face tensuA cuntruversia riaccende u dibattitu annantu à u raschiatura micca autorizata è i limiti tecnichi è etici chì quelli chì custruiscenu prudutti basati annantu à grandi quantità d'infurmazioni in linea devenu rispettà.
Ciò chì Cloudflare riporta è perchè hè impurtante

A cumpagnia di sicurezza è di prestazioni di rete dice chì hà ricevutu lagnanze di i clienti chì i so siti anu cuntinuatu à riceve accessu attribuitu à Perplexità malgradu pruibiscelu in robots.txt è applicà e regule di u WAF per bluccà i so tracker dichjarati. Dopu avè investigatu, Cloudflare dichjara d'avè rilevatu un mudellu di tracciamentu clandestinu incompatibile cù e preferenze di i pruprietarii di siti web.
U furnitore dichjara d'avè osservatu stu cumpurtamentu in decine di migliaia di duminii è cun milioni di richieste ogni ghjornu, un vulume chì, à parè soiu, mostra pratiche sistematiche piuttostu chè incidentali. Di cunsiguenza, hà cacciatu Perplexity da a so lista di bot verificati è hà attivatu l'euristica è hà gestitu e regule per bluccà stu tracciamentu per difettu.
Cumu a Perplexità averia superatu l'ostaculi

Sicondu Cloudflare, quandu u vostru tracker dichjarati (cum'è identificatu da i nomi di l'agenti utilizatori Perplexity) hà scontru un crash, u sistema andarà à impersonà un navigatore cumunu, prisentendu si cum'è s'ellu fussi Chrome nant'à macOS per camuflà a so identità è evitari a rilevazione.
Inoltre, l'accessi sò ghjunti da intervalli IP micca publicati da Perplexità è giratu spessu, chì averia resu u filtraggio difficiule. Cloudflare afferma ancu d'avè vistu cambiamenti in u ASN (sistemi autonomi) origine di e richieste, un altru segnu di evasione di blocchi reta.
A ricerca cita chì u cumpurtamentu osservatu ùn rispetterebbe micca u mudellu di i boni striscianti descritti in RFC 9309 è in a so pulitica di "bot verificati": trasparenza di l'identità (agente, IP è cuntattu), calmazione di u trafficu, un scopu chjaru è rispettà i robots.txt digià i limiti stabiliti da i pruprietarii di u situ.
Cloudflare dice ch'ellu hè statu capace di "Lascià una traccia" à questu trafficu per mezu di una cumbinazione di signali di rete è apprendimentu automaticu, aghjunghjendu firme à e vostre regule gestite chì identificanu è bloccanu sta attività, ancu per i clienti di u pianu gratuitu.
Test cù duminii esca è risultati
Per cunfirmà i so suspetti, a squadra hà creatu duminii novi è micca publicati (micca indicizati o ligati publicamente) è hà applicatu una pulitica à elli pruibizione tutale di robots.txt, è ancu regule specifiche per pruibisce i bot Perplexity. Dopu avè cunsultatu l'IA per questi siti, Cloudflare afferma chì aghju avutu risposte cù dettagli nantu à u cuntenutu ospitatu, qualcosa chì - s'ellu hè currettu - indicaria accessu malgradu l'ostaculi.
Quandu u bloccu era efficace, Cloudflare hà osservatu chì l'IA di Perplexity hà ricorsu à fonti alternative per custruisce una risposta, ma menu precisu è senza e particularità di u materiale originale, riflettendu chì u a restrizione hà funzionatu.
A risposta ufficiale di Perplexity

A perplessità, da a so parte, ricusa l'accuse di tracciamentu clandestinu è dichjarazioni chì Cloudflare hà malinterpretatu parte di l'attività analizzata. I portavoce di a cumpagnia anu descrittu u rapportu cum'è un "pezzu cummerciale" è dicenu chì ci sò alcune prove ùn pruvarianu micca l'accessi veri o ancu currisponde à i bot di l'altri.
A startup hà ancu spartutu a so pusizione nantu à publicazioni in X, induve ellu mette in discussione a capacità di u sistemi di rilevazione fà a differenza trà assistenti di IA legittimi, tracker di terze parti è trafficu maliziosu. Inoltre, sustene chì un agente chì cerca infurmazioni puntuali per risponde à una dumanda ùn funziona micca listessu chè un crawler tradiziunale chì rastrella u web in massa.
Misure, bone pratiche è u rolu di altri attori
Cum'è parte di a so strategia, Cloudflare hà cacciatu da Perplexity da u so registru di bot di fiducia è hà aghjuntu regule per u bloccu u so presuntu tracciamentu piattu. A cumpagnia ricumanda chì l'amministratori attivinu pulitiche anti-bot, Dumandà sfide quandu un bloccu tutale ùn hè micca desideratu è aduprà regule gestite specifiche contr'à u Raschiatura di l'IA.
In u so argumentu, Cloudflare cuntrasta u casu cù esempi di cunfurmità di e migliori pratiche, citendu attori chì rispettà i robots.txt, documentanu i so agenti è aduttà norme emergenti cum'è Autentificazione di u bot webIn testi comparativi, afferma chì altri bot si sò fermati quandu si scontra cù una pruibizione o un bloccu di rete, senza tentativi camuffati.
Un cunflittu chì marca u corsu di l'ecosistema

U furnitore prevede un evoluzione constante di e tattiche di l'operatori di bot è di e difese aduprate per cuntene li. In parallelu, participa à u travagliu cù esperti è urganisazioni cum'è IETF à impulsu estensioni robots.txt è principii misurabili chì i tracker benintenzionati devenu rispettà.
Oltre à u pulsu specificu, u casu mette nantu à a tavula crisa di fiducia trà i creatori di cuntenutu, e piattaforme è e cumpagnie di IA: quale pò accede à ciò chì, in quali cundizioni, è cumu fà lu trasparente senza rompe i mudelli cummerciali o rallentà l'innuvazione. Tuttu indica sta cunversazione resterà apertu mentre chì l'agenti di l'IA guadagnanu pruminenza è u web aghjusta e so regule di cuesistenza.
Questu episodiu lascia un missaghju chjaru: U tracciamentu di l'IA hè sott'à esame, cù Cloudflare chì denunzià tattiche di camuflamentu attribuite à Perplexity è à a startup negendu fermamente; in u mezu, i pruprietarii di u situ anu accessu à nuovi strumenti per cuntrullà l'accessu è un inseme di i boni pratichi in custruzzione chì marcarà u campu di ghjocu in i prossimi mesi.
Sò un entusiasta di a tecnulugia chì hà trasfurmatu i so interessi "geek" in una professione. Aghju passatu più di 10 anni di a mo vita cù a tecnulugia d'avanguardia è scacciendu ogni tipu di prugrammi per pura curiosità. Avà sò specializatu in tecnulugia di computer è video games. Questu hè chì dapoi più di 5 anni aghju scrittu per diversi siti web nantu à a tecnulugia è i video games, creendu articuli chì cercanu di dà l'infurmazioni chì avete bisognu in una lingua chì hè comprensibile à tutti.
Sì avete qualchì quistione, a mo cunniscenza varieghja da tuttu ciò chì riguarda u sistema operatore Windows è ancu Android per i telefunini. È u mo impegnu hè di voi, sò sempre dispostu à passà uni pochi di minuti è aiutavvi à risolve tutte e dumande chì pudete avè in questu mondu Internet.