Dryswch wedi'i dargedu gan Cloudflare ar gyfer olrhain gwefannau wedi'u blocio

Diweddariad diwethaf: 08/08/2025

  • Mae Cloudflare yn cyhuddo Perplexity o osgoi robots.txt a chuddio ei gropian gydag asiantau defnyddwyr a chyfeiriadau IP heb eu datgan.
  • Mae'r cwmni'n honni ei fod wedi gweld newidiadau i ASN a miliynau o geisiadau bob dydd ar draws degau o filoedd o barthau.
  • Mae Perplexity yn gwadu arferion cudd, yn cwestiynu'r fethodoleg, ac yn dadlau bod ei AI yn gweithio'n wahanol i gropwr traddodiadol.
  • Mae Cloudflare yn dileu Perplexity fel bot wedi'i wirio ac yn galluogi rheolau i rwystro olrhain AI yn ddiofyn.
Cloudflare yn erlyn Perplexity

Mae Cloudflare wedi codi'r larwm drwy gyhoeddi adroddiad lle mae yn cyhuddo'r injan ateb sy'n cael ei phweru gan AI, Perplexity, o barhau i gropian gwefannau er gwaethaf rhwystrau wedi'i osod gan eu perchnogion. Yn ôl y darparwr seilwaith, byddai gan y gwasanaeth robots.txt wedi'i anwybyddu a osgoi blociau rhwydwaith i gael mynediad at gynnwys gwaharddedig.

Mewn tirwedd lle mae deallusrwydd artiffisial yn difa data i hyfforddi modelau ac ymateb mewn amser real, y cydbwysedd rhwng arloesedd a pharch at reolau ecosystem y we yn mynd yn llawn tyndraMae'r ddadl yn ailgynnau'r ddadl ynghylch y crafu heb awdurdod a'r terfynau technegol a moesegol y dylai'r rhai sy'n adeiladu cynhyrchion yn seiliedig ar symiau mawr o wybodaeth ar-lein gydymffurfio â nhw.

Beth mae Cloudflare yn ei adrodd a pham ei fod yn bwysig

Cropian Deallusrwydd Artiffisial a Pholisïau Gwe

Dywed y cwmni diogelwch a pherfformiad rhwydwaith ei fod wedi derbyn cwynion cwsmeriaid y parhaodd y safleoedd hynny i gael mynediad a briodolir i Dryglondeb er gwaethaf ei wahardd yn robots.txt a chymhwyso rheolau'r WAF i rwystro eu holrheinwyr datganedig. Ar ôl ymchwilio, mae Cloudflare yn honni eu bod wedi canfod patrwm o olrhain cudd yn anghydnaws â dewisiadau perchnogion gwefannau.

Mae'r cyflenwr yn honni ei fod wedi arsylwi'r ymddygiad hwn yn degau o filoedd o barthau a miliynau o geisiadau bob dydd, cyfrol sydd, yn ei farn ef, yn dangos arferion systematig yn hytrach nag arferion damweiniol. O ganlyniad, wedi tynnu Perplexity oddi ar ei restr o robotiaid wedi'u gwirio ac wedi actifadu hewristigau a rheoli rheolau ar gyfer rhwystro'r olrhain hwn yn ddiofyn.

rhwystro tudalennau gwe o Google Chrome
Erthygl gysylltiedig:
Sut i rwystro gwefannau o Google Chrome heb apiau allanol

Sut y byddai dryswch wedi goresgyn y rhwystrau

robotiaid txt

Yn ôl Cloudflare, pan fydd eich olrheinwyr datganedig (fel y'i nodwyd gan enwau asiantau defnyddwyr Perplexity) wedi dod ar draws damwain, byddai'r system yn mynd i dynwared porwr cyffredin, gan gyflwyno ei hun fel pe bai Chrome ar macOS i guddio eu hunaniaeth a osgoi canfod.

Cynnwys unigryw - Cliciwch Yma  Linkedin Sut i greu proffil?

Yn ogystal, daeth y mynediadau o ystodau IP heb eu cyhoeddi gan Dryswch a wedi'i gylchdroi'n aml, a fyddai wedi gwneud hidlo'n anodd. Mae Cloudflare hefyd yn honni ei fod wedi gweld newidiadau yn y ASN (systemau ymreolaethol) tarddiad y ceisiadau, arwydd arall o osgoi bloc rhwydwaith.

Mae'r ymchwil yn sôn bod yr ymddygiad a welwyd ni fyddai'n parchu'r patrwm o'r cropianwyr da a ddisgrifir yn RFC 9309 ac yn ei bolisi “botiau wedi’u gwirio”: tryloywder hunaniaeth (asiant, IPs a chyswllt), tawelu traffig, amcan clir a parch robots.txt eisoes y terfynau a osodwyd gan berchnogion safleoedd.

Dywed Cloudflare ei fod wedi gallu "gadael marc" i'r traffig hwn trwy gyfuniad o signalau rhwydwaith a dysgu peirianyddol, gan ychwanegu llofnodion at eich rheolau rheoledig sy'n nodi ac yn rhwystro'r gweithgaredd hwn, hyd yn oed ar gyfer cwsmeriaid y cynllun am ddim.

offer sgrapio gwe-2
Erthygl gysylltiedig:
Yr Offer Sgrapio Gwe Gorau yn 2025

Profi gyda pharthau denu a chanlyniadau

I gadarnhau eu hamheuon, creodd y tîm parthau newydd a heb eu cyhoeddi (heb ei fynegeio na'i gysylltu'n gyhoeddus) a chymhwyso polisi iddynt gwaharddiad llwyr ar robots.txt, yn ogystal â rheolau penodol ar gyfer gwahardd botiau Perplexity. Ar ôl ymgynghori â'r AI ar gyfer y safleoedd hynny, mae Cloudflare yn honni bod wedi cael atebion gyda manylion am y cynnwys a gynhelir, rhywbeth a fyddai—os yw'n gywir—yn dangos mynediad er gwaethaf rhwystrau.

Cynnwys unigryw - Cliciwch Yma  Sut i ddefnyddio Kaspersky Anti-Virus?

Pan oedd y bloc yn effeithiol, sylwodd Cloudflare fod deallusrwydd artiffisial Perplexity trodd at ffynonellau amgen i adeiladu ymateb, ond llai manwl gywir a heb nodweddion penodol y deunydd gwreiddiol, gan adlewyrchu bod y roedd y cyfyngiad wedi gweithio.

Ymateb swyddogol Perplexity

Dryswch a robots.txt

Dryswch, o'i ran, yn gwrthod y cyhuddiadau o olrhain cudd a honiadau bod Cloudflare wedi wedi'i gamddehongli rhan o'r gweithgaredd a ddadansoddwyd. Mae llefarwyr y cwmni wedi disgrifio'r adroddiad fel "darn masnachol" ac maen nhw'n honni bod rhywfaint o dystiolaeth ni fyddent yn profi mynediadau go iawn neu hyd yn oed yn cyfateb i botiau pobl eraill.

Mae'r cwmni newydd hefyd wedi rhannu ei safbwynt ar cyhoeddiadau yn X, lle mae'n cwestiynu gallu'r systemau canfod i wahaniaethu rhwng cynorthwywyr AI cyfreithlon, olrheinwyr trydydd parti, a thraffig maleisus. Ar ben hynny, mae'n dadlau bod a asiant yn chwilio am wybodaeth amserol i ymateb i ymholiad dydy e ddim yn gweithio'r un peth na chropian traddodiadol sy'n cropian y we ar y cyd.

Mesurau, arferion da a rôl actorion eraill

Fel rhan o'i strategaeth, mae Cloudflare wedi wedi'i ddad-restru o Dryglonrwydd o'i gofrestr o botiau dibynadwy ac wedi ychwanegu rheolau ar gyfer blocio ei olrhain cudd honedig. Mae'r cwmni'n argymell bod gweinyddwyr yn actifadu polisïau gwrth-bot, Ymgeisiwch heriau pan nad oes angen bloc cyfan a defnyddio rheolau rheoledig penodol yn erbyn y Crafu AI.

Cynnwys unigryw - Cliciwch Yma  Sut i ffurfweddu sganio gwe yn McAfee AntiVirus Plus?

Yn ei ddadl, mae Cloudflare yn cyferbynnu'r achos â enghreifftiau o gydymffurfiaeth o arferion gorau, gan ddyfynnu actorion sy'n parch robots.txt, dogfennu eu hasiantau a mabwysiadu safonau sy'n dod i'r amlwg fel Awdurdodi Bot GweMewn profion cymharol, mae'n honni bod robotiaid eraill fe stopion nhw wrth ddod ar draws gwaharddiad neu floc rhwydwaith, heb ail-geisiau cuddliwiedig.

Rhestr o Wefannau wedi'u Blocio yn Sbaen
Erthygl gysylltiedig:
Mae'r Llywodraeth yn cyhoeddi'r rhestr swyddogol o wefannau sydd wedi'u blocio yn Sbaen: sut mae'r system yn gweithio a pha barthau sy'n ymddangos.

Gwrthdaro sy'n nodi cwrs yr ecosystem

Mae dryswch yn cropian gwefannau

Mae'r cyflenwr yn rhagweld a esblygiad cyson o dactegau gweithredwyr botiau a'r amddiffynfeydd a ddefnyddir i'w cynnwys. Ochr yn ochr â hynny, mae'n cymryd rhan mewn gwaith gydag arbenigwyr a sefydliadau fel y IETF i ysgogiad estyniadau robots.txt ac egwyddorion mesuradwy y dylai olrheinwyr â bwriadau da lynu wrthynt.

Y tu hwnt i'r pwls penodol, mae'r achos yn rhoi ar y bwrdd y argyfwng hyder rhwng crewyr cynnwys, llwyfannau a chwmnïau AI: pwy all mynediad at beth, o dan ba amodau, a sut gwnewch hi'n dryloyw heb dorri modelau busnes na arafu arloesedd. Mae popeth yn awgrymu y bydd y sgwrs hon bydd yn aros ar agor tra bod asiantau AI yn ennill amlygrwydd a'r we yn addasu ei rheolau cydfodolaeth.

Mae'r bennod hon yn gadael neges glir: Mae olrhain AI dan sylw, gyda Cloudflare yn condemnio tactegau cuddliw a briodolir i Perplexity a'r cwmni newydd ei wadu'n gadarn; yn y canol, mae gan berchnogion safleoedd fynediad i offer newydd i reoli mynediad a set o arferion da dan adeiladu a fydd yn nodi'r cae chwarae yn y misoedd nesaf.