Perplessità mirata da Cloudflare per u seguimentu di i siti web bluccati

Ultimu aghjurnamentu: 08/08/2025

  • Cloudflare accusa Perplexity d'avè bypassatu robots.txt è di mascherare a so scansione cù agenti utilizatori è indirizzi IP micca dichjarati.
  • L'impresa dichjara d'avè osservatu cambiamenti ASN è milioni di richieste ogni ghjornu in decine di migliaia di duminii.
  • Perplexity nega e pratiche clandestine, mette in discussione a metodologia è sustene chì a so IA funziona in modu diversu da un crawler tradiziunale.
  • Cloudflare elimina Perplexity da a lista di bot verificatu è abilita e regule per bluccà u tracciamentu di l'IA per difettu.
Cloudflare face causa à Perplexity

Cloudflare hà datu l'allarme publicendu un rapportu in u quale accusa u mutore di risposta basatu annantu à l'IA Perplexity di cuntinuà à scansà i siti web malgradu l'ostaculi piazzati da i so pruprietarii. Sicondu u fornitore di l'infrastruttura, u serviziu averia robots.txt ignoratu è bypassà i blocchi di rete per accede à u cuntenutu pruibitu.

In un paisaghju induve l'IA divora dati per furmà mudelli è risponde in tempu reale, u equilibriu trà l'innuvazione è u rispettu di e regule di l'ecosistema web si face tensuA cuntruversia riaccende u dibattitu annantu à u raschiatura micca autorizata è i limiti tecnichi è etici chì quelli chì custruiscenu prudutti basati annantu à grandi quantità d'infurmazioni in linea devenu rispettà.

Ciò chì Cloudflare riporta è perchè hè impurtante

Scansione AI è Pulitiche Web

A cumpagnia di sicurezza è di prestazioni di rete dice chì hà ricevutu lagnanze di i clienti chì i so siti anu cuntinuatu à riceve accessu attribuitu à Perplexità malgradu pruibiscelu in robots.txt è applicà e regule di u WAF per bluccà i so tracker dichjarati. Dopu avè investigatu, Cloudflare dichjara d'avè rilevatu un mudellu di tracciamentu clandestinu incompatibile cù e preferenze di i pruprietarii di siti web.

U furnitore dichjara d'avè osservatu stu cumpurtamentu in decine di migliaia di duminii è cun milioni di richieste ogni ghjornu, un vulume chì, à parè soiu, mostra pratiche sistematiche piuttostu chè incidentali. Di cunsiguenza, hà cacciatu Perplexity da a so lista di bot verificati è hà attivatu l'euristica è hà gestitu e regule per bluccà stu tracciamentu per difettu.

bluccà e pagine web da Google Chrome
Articulu ligatu:
Cumu bluccà i siti web da Google Chrome senza applicazioni esterne

Cumu a Perplexità averia superatu l'ostaculi

robots txt

Sicondu Cloudflare, quandu u vostru tracker dichjarati (cum'è identificatu da i nomi di l'agenti utilizatori Perplexity) hà scontru un crash, u sistema andarà à impersonà un navigatore cumunu, prisentendu si cum'è s'ellu fussi Chrome nant'à macOS per camuflà a so identità è evitari a rilevazione.

Cuntinutu esclusivu - Cliccate quì  Linkedin Cumu creà un prufilu?

Inoltre, l'accessi sò ghjunti da intervalli IP micca publicati da Perplexità è giratu spessu, chì averia resu u filtraggio difficiule. Cloudflare afferma ancu d'avè vistu cambiamenti in u ASN (sistemi autonomi) origine di e richieste, un altru segnu di evasione di blocchi reta.

A ricerca cita chì u cumpurtamentu osservatu ùn rispetterebbe micca u mudellu di i boni striscianti descritti in RFC 9309 è in a so pulitica di "bot verificati": trasparenza di l'identità (agente, IP è cuntattu), calmazione di u trafficu, un scopu chjaru è rispettà i robots.txt digià i limiti stabiliti da i pruprietarii di u situ.

Cloudflare dice ch'ellu hè statu capace di "Lascià una traccia" à questu trafficu per mezu di una cumbinazione di signali di rete è apprendimentu automaticu, aghjunghjendu firme à e vostre regule gestite chì identificanu è bloccanu sta attività, ancu per i clienti di u pianu gratuitu.

strumenti di scrapping web-2
Articulu ligatu:
I migliori strumenti di scraping web in u 2025

Test cù duminii esca è risultati

Per cunfirmà i so suspetti, a squadra hà creatu duminii novi è micca publicati (micca indicizati o ligati publicamente) è hà applicatu una pulitica à elli pruibizione tutale di robots.txt, è ancu regule specifiche per pruibisce i bot Perplexity. Dopu avè cunsultatu l'IA per questi siti, Cloudflare afferma chì aghju avutu risposte cù dettagli nantu à u cuntenutu ospitatu, qualcosa chì - s'ellu hè currettu - indicaria accessu malgradu l'ostaculi.

Cuntinutu esclusivu - Cliccate quì  Cumu aduprà Kaspersky Anti-Virus?

Quandu u bloccu era efficace, Cloudflare hà osservatu chì l'IA di Perplexity hà ricorsu à fonti alternative per custruisce una risposta, ma menu precisu è senza e particularità di u materiale originale, riflettendu chì u a restrizione hà funzionatu.

A risposta ufficiale di Perplexity

Perplessità è robots.txt

A perplessità, da a so parte, ricusa l'accuse di tracciamentu clandestinu è dichjarazioni chì Cloudflare hà malinterpretatu parte di l'attività analizzata. I portavoce di a cumpagnia anu descrittu u rapportu cum'è un "pezzu cummerciale" è dicenu chì ci sò alcune prove ùn pruvarianu micca l'accessi veri o ancu currisponde à i bot di l'altri.

A startup hà ancu spartutu a so pusizione nantu à publicazioni in X, induve ellu mette in discussione a capacità di u sistemi di rilevazione fà a differenza trà assistenti di IA legittimi, tracker di terze parti è trafficu maliziosu. Inoltre, sustene chì un agente chì cerca infurmazioni puntuali per risponde à una dumanda ùn funziona micca listessu chè un crawler tradiziunale chì rastrella u web in massa.

Misure, bone pratiche è u rolu di altri attori

Cum'è parte di a so strategia, Cloudflare hà cacciatu da Perplexity da u so registru di bot di fiducia è hà aghjuntu regule per u bloccu u so presuntu tracciamentu piattu. A cumpagnia ricumanda chì l'amministratori attivinu pulitiche anti-bot, Dumandà sfide quandu un bloccu tutale ùn hè micca desideratu è aduprà regule gestite specifiche contr'à u Raschiatura di l'IA.

Cuntinutu esclusivu - Cliccate quì  Cumu cunfigurà a scansione web in McAfee AntiVirus Plus?

In u so argumentu, Cloudflare cuntrasta u casu cù esempi di cunfurmità di e migliori pratiche, citendu attori chì rispettà i robots.txt, documentanu i so agenti è aduttà norme emergenti cum'è Autentificazione di u bot webIn testi comparativi, afferma chì altri bot si sò fermati quandu si scontra cù una pruibizione o un bloccu di rete, senza tentativi camuffati.

Lista di siti web bluccati in Spagna
Articulu ligatu:
U Guvernu publica a lista ufficiale di i siti web bluccati in Spagna: cumu funziona u sistema è quali duminii appariscenu.

Un cunflittu chì marca u corsu di l'ecosistema

A perplexità striscia i siti web

U furnitore prevede un evoluzione constante di e tattiche di l'operatori di bot è di e difese aduprate per cuntene li. In parallelu, participa à u travagliu cù esperti è urganisazioni cum'è IETF à impulsu estensioni robots.txt è principii misurabili chì i tracker benintenzionati devenu rispettà.

Oltre à u pulsu specificu, u casu mette nantu à a tavula crisa di fiducia trà i creatori di cuntenutu, e piattaforme è e cumpagnie di IA: quale pò accede à ciò chì, in quali cundizioni, è cumu fà lu trasparente senza rompe i mudelli cummerciali o rallentà l'innuvazione. Tuttu indica sta cunversazione resterà apertu mentre chì l'agenti di l'IA guadagnanu pruminenza è u web aghjusta e so regule di cuesistenza.

Questu episodiu lascia un missaghju chjaru: U tracciamentu di l'IA hè sott'à esame, cù Cloudflare chì denunzià tattiche di camuflamentu attribuite à Perplexity è à a startup negendu fermamente; in u mezu, i pruprietarii di u situ anu accessu à nuovi strumenti per cuntrullà l'accessu è un inseme di i boni pratichi in custruzzione chì marcarà u campu di ghjocu in i prossimi mesi.