Cloudflare cilja na zbunjenost zbog praćenja blokiranih web stranica

Posljednje ažuriranje: 08/08/2025

  • Cloudflare optužuje Perplexity za zaobilaženje robots.txt datoteke i maskiranje njenog indeksiranja nedeklariranim korisničkim agentima i IP adresama.
  • Kompanija tvrdi da je primijetila promjene ASN-a i milione zahtjeva dnevno na desetinama hiljada domena.
  • Perplexity negira tajne prakse, dovodi u pitanje metodologiju i tvrdi da njegova umjetna inteligencija funkcionira drugačije od tradicionalnog pretraživača.
  • Cloudflare uklanja Perplexity kao verifikovanog bota i omogućava pravilima da blokiraju praćenje AI-om prema zadanim postavkama.
Cloudflare tuži Perplexity

Cloudflare je digao uzbunu objavljivanjem izvještaja u kojem optužuje zbunjenost sistema za odgovore pokretanog umjetnom inteligencijom zbog nastavka indeksiranja web stranica uprkos preprekama postavljene od strane njihovih vlasnika. Prema riječima pružatelja infrastrukture, usluga bi imala Datoteka robots.txt je ignorirana i zaobiđite mrežne blokade kako biste pristupili zabranjenom sadržaju.

U okruženju u kojem umjetna inteligencija proždire podatke za obuku modela i reagiranje u stvarnom vremenu, ravnoteža između inovacija i poštovanja pravila web ekosistema postaje napetoKontroverza ponovo rasplamsava debatu o neovlašteno skidanje sadržaja i tehnička i etička ograničenja kojih se trebaju pridržavati oni koji grade proizvode zasnovane na velikim količinama online informacija.

Šta Cloudflare izvještava i zašto je to važno

AI indeksiranje i web politike

Kompanija za sigurnost i performanse mreže kaže da je primila pritužbe kupaca čije su stranice nastavile dobijati pristup pripisan Perplexityju uprkos zabraniti to u robots.txt datoteci i primijeniti pravila od WAF da blokiraju svoje prijavljene tragače. Nakon istrage, Cloudflare tvrdi da je otkrio obrazac tajno praćenje nekompatibilno s preferencijama vlasnika web stranica.

Dobavljač tvrdi da je primijetio ovo ponašanje u desetine hiljada domena i sa milioni zahtjeva dnevno, svezak koji, po njegovom mišljenju, pokazuje sistematske, a ne slučajne prakse. Kao rezultat toga, je uklonio Perplexity sa svoje liste verifikovanih botova i aktivirao je heuristike i upravljana pravila za blokiraj ovo praćenje po defaultu.

blokirajte web stranice iz Google Chromea
Vezani članak:
Kako blokirati web stranice iz Google Chromea bez vanjskih aplikacija

Kako bi Zbunjenost savladala prepreke

robots txt

Prema Cloudflareu, kada vaš prijavljeni tragači (kako je identifikovano imenima korisničkih agenata Perplexity) naišao na pad sistema, sistem bi prešao na predstavljati se kao preglednik uobičajeno, predstavljajući se kao da je Chrome na macOS-u da prikriju svoj identitet i izbjeći otkrivanje.

Ekskluzivni sadržaj - kliknite ovdje  Linkedin Kako kreirati profil?

Osim toga, pristupi su dolazili iz neobjavljeni IP rasponi od Zbunjenosti i često rotirano, što bi otežalo filtriranje. Cloudflare također tvrdi da je primijetio promjene u ASN (autonomni sistemi) porijeklo zahtjeva, još jedan znak izbjegavanje blokova mreže.

U istraživanju se navodi da je uočeno ponašanje ne bi poštovao obrazac od dobrih puzača opisanih u RFC 9309 i u svojoj politici „verifikovanih botova“: transparentnost identiteta (agent, IP adrese i kontakt), smirivanje prometa, jasan cilj i poštovanje robots.txt već ograničenja koja su postavili vlasnici stranica.

Cloudflare kaže da je bio u mogućnosti "Ostavi trag" ovom prometu putem kombinacije mrežni signali i mašinsko učenje, dodavanjem potpisa vašim upravljanim pravilima koja identificiraju i blokiraju ovu aktivnost, čak i za korisnike besplatni plan.

alati za skidanje web sadržaja-2
Vezani članak:
Najbolji alati za web scraping u 2025. godini

Testiranje s domenama mamaca i rezultati

Da bi potvrdili svoje sumnje, tim je kreirao nove i neobjavljene domene (nisu indeksirane niti javno povezane) i primijenili smo na njih politiku potpuna zabrana robots.txt datoteke, kao i specifična pravila za zabranu Perplexity botova. Nakon konsultacija sa vještačkom inteligencijom za te stranice, Cloudflare tvrdi da dobio odgovore s detaljima o hostovanom sadržaju, nešto što bi - ako je tačno - ukazivalo pristup uprkos preprekama.

Ekskluzivni sadržaj - kliknite ovdje  Kako da koristim Kaspersky Anti-Virus?

Kada je blok bio efikasan, Cloudflare je primijetio da Perplexityjeva umjetna inteligencija pribjegli alternativnim izvorima da se izgradi odgovor, ali manje precizno i bez posebnosti originalnog materijala, što odražava da ograničenje je djelovalo.

Zvanični odgovor Perplexityja

Zbunjenost i robots.txt

Zbunjenost, sa svoje strane, odbacuje optužbe o tajnom praćenju i tvrdnjama da Cloudflare ima pogrešno protumačeno dio analizirane aktivnosti. Glasnogovornici kompanije opisali su izvještaj kao "Komercijalni komad" i tvrde da neki dokazi Ne bi testirali stvarne pristupe ili čak odgovaraju tuđi botovi.

Startup je također podijelio svoj stav o publikacije u X, gdje on dovodi u pitanje kapacitet sistemi za detekciju razlikovati između legitimni AI asistenti, tragače trećih strana i zlonamjerni promet. Nadalje, tvrdi se da je agent koji traži određene informacije odgovoriti na upit ne funkcioniše isto nego tradicionalni pretraživač koji masovno pretražuje web.

Mjere, dobre prakse i uloga drugih aktera

Kao dio svoje strategije, Cloudflare je uklonjeno sa Perplexityja iz svog registra pouzdanih botova i dodao je pravila za blokiranje navodno skriveno praćenje. Kompanija preporučuje da administratori aktiviraju pravila protiv botova, Prijavite se izazovi kada potpuna blokada nije poželjna i koristite specifična upravljana pravila protiv AI struganje.

Ekskluzivni sadržaj - kliknite ovdje  Kako konfigurirati web skeniranje u McAfee AntiVirus Plus?

U svojoj argumentaciji, Cloudflare suprotstavlja slučaj sa primjeri usklađenosti najboljih praksi, navodeći aktere koji poštovanje robots.txt, dokumentiraju svoje agente i usvoje nove standarde kao što su Autorizacija web botaU komparativnim testovima, tvrdi se da drugi botovi zaustavili su se kada naiđete na zabranu ili blokadu mreže, bez kamufliranih ponovnih pokušaja.

Lista blokiranih web stranica u Španiji
Vezani članak:
Vlada objavljuje službenu listu blokiranih web stranica u Španiji: kako sistem funkcionira i koje domene se pojavljuju.

Sukob koji obilježava tok ekosistema

Perplexity pretražuje web stranice

Dobavljač očekuje da stalna evolucija taktika bot operatera i odbrane koja se koristi za njihovo suzbijanje. Paralelno s tim, učestvuje u radu sa stručnjacima i organizacijama kao što su IETF na impuls ekstenzije robots.txt datoteke i mjerljive principe kojih bi se dobronamjerni tragači trebali pridržavati.

Osim specifičnog pulsa, slučaj stavlja na stol i kriza poverenja između kreatora sadržaja, platformi i kompanija za umjetnu inteligenciju: ko može pristup čemu, pod kojim uslovima i kako učini to transparentnim bez narušavanja poslovnih modela ili usporavanja inovacija. Sve ukazuje na ovaj razgovor ostat će otvoreno dok agenti umjetne inteligencije dobijaju na značaju, a web prilagođava svoja pravila koegzistencije.

Ova epizoda ostavlja jasnu poruku: Praćenje putem umjetne inteligencije je pod lupom, pri čemu Cloudflare osuđuje taktike kamuflaže koje se pripisuju Perplexityju i startupu odlučno to poriče; u sredini, vlasnici web-stranica imaju pristup novi alati za kontrolu pristupa i skup dobre prakse u izgradnji koji će obilježiti igralište u narednim mjesecima.