کلودفلر برای ردیابی وب‌سایت‌های مسدود شده، Perplexity را هدف قرار داده است.

آخرین به‌روزرسانی: ۰۱/۰۲/۲۰۲۴

  • کلودفلر، پرپلکسیتی را به دور زدن robots.txt و پنهان کردن خزش خود با عوامل کاربری و آدرس‌های IP اعلام نشده متهم می‌کند.
  • این شرکت ادعا می‌کند که تغییرات ASN و میلیون‌ها درخواست روزانه را در ده‌ها هزار دامنه مشاهده کرده است.
  • پرپلکسیتی شیوه‌های پنهانی را انکار می‌کند، روش‌شناسی را زیر سوال می‌برد و استدلال می‌کند که هوش مصنوعی آن متفاوت از یک خزنده سنتی عمل می‌کند.
  • کلودفلر، پرپلکسیتی را به عنوان یک ربات تأیید شده از فهرست خود حذف می‌کند و قوانینی را فعال می‌کند که به طور پیش‌فرض ردیابی هوش مصنوعی را مسدود می‌کنند.
کلودفلر از پرپلکسیتی شکایت کرد

کلودفلر زنگ خطر را به صدا درآورده است با انتشار گزارشی که در آن موتور پاسخگویی مبتنی بر هوش مصنوعی Perplexity را متهم می‌کند که با وجود موانع، به خزش وب‌سایت‌ها ادامه می‌دهد. توسط صاحبان آنها قرار داده شده است. طبق گفته ارائه دهنده زیرساخت، این سرویس باید داشته باشد robots.txt نادیده گرفته شد و برای دسترسی به محتوای ممنوعه، از بلوک‌های شبکه عبور کنند.

در چشم‌اندازی که هوش مصنوعی داده‌ها را می‌بلعد تا مدل‌ها را آموزش دهد و در زمان واقعی پاسخ دهد، تعادل بین نوآوری و احترام به قوانین اکوسیستم وب متشنج می شوداین جنجال، بحث را دوباره داغ می‌کند تراشکاری غیرمجاز و محدودیت‌های فنی و اخلاقی که کسانی که محصولاتی را بر اساس حجم زیادی از اطلاعات آنلاین می‌سازند باید رعایت کنند.

کلودفلر چه چیزی را گزارش می‌دهد و چرا اهمیت دارد

خزش هوش مصنوعی و سیاست‌های وب

شرکت امنیت و عملکرد شبکه می‌گوید که دریافت کرده است quejas de clientes که سایت‌هایشان علی‌رغم [کمک] به [نام شرکت] Perplexity همچنان دسترسی دریافت می‌کردند آن را در robots.txt مسدود کنید و اعمال قوانین مربوط به WAF برای مسدود کردن ردیاب‌های اعلام‌شده‌شان. پس از بررسی، کلودفلر ادعا می‌کند که الگویی از ردیابی مخفیانه با ترجیحات صاحبان وب‌سایت سازگار نیست.

تأمین‌کننده ادعا می‌کند که این رفتار را مشاهده کرده است ده‌ها هزار دامنه و با میلیون‌ها درخواست روزانه، کتابی که به نظر او، شیوه‌های سیستماتیک را نشان می‌دهد نه اتفاقی. در نتیجه، ربات Perplexity را از فهرست ربات‌های تأیید شده خود حذف کرده است. و اکتشافات را فعال کرده و قوانین را مدیریت کرده است مسدود کردن این ردیابی de manera predeterminada.

مسدود کردن صفحات وب از گوگل کروم
مقاله مرتبط:
نحوه مسدود کردن وب‌سایت‌ها از گوگل کروم بدون برنامه‌های خارجی

چگونه سرگشتگی بر موانع غلبه می‌کرد

robots txt

طبق گفته Cloudflare، وقتی شما ردیاب‌های اعلام‌شده (همانطور که توسط نام‌های عامل کاربر Perplexity مشخص شده است) با خرابی مواجه شد، سیستم به جعل هویت مرورگر رایج، خود را طوری نشان می‌دهد که انگار Chrome en macOS برای پنهان کردن هویت خود و اجتناب از تشخیص.

محتوای اختصاصی - اینجا را کلیک کنید  نحوه ارسال یک ویدیوی طولانی

علاوه بر این، دسترسی‌ها از ... حاصل می‌شدند محدوده‌های IP منتشر نشده توسط سرگشتگی و مرتباً چرخانده می‌شودکه فیلتر کردن را دشوار می‌کرد. کلودفلر همچنین ادعا می‌کند که تغییراتی را در ASN (سیستم‌های خودران) منشأ درخواست‌ها، نشانه‌ی دیگری از فرار از بلوک de red.

این تحقیق اشاره می‌کند که رفتار مشاهده‌شده به الگو احترام نمی‌گذارند از خزنده‌های خوبی که در RFC 9309 و در سیاست «ربات‌های تأیید شده» خود: شفافیت هویت (عامل، IPها و مخاطب)، آرام‌سازی ترافیک، یک هدف مشخص و به robots.txt احترام بگذارید محدودیت‌هایی که توسط صاحبان سایت تعیین شده است.

کلودفلر می‌گوید که توانسته است «نشانی از خود به جا گذاشتن» به این ترافیک از طریق ترکیبی از سیگنال‌های شبکه و یادگیری ماشین، اضافه کردن امضاهایی به قوانین مدیریت‌شده‌تان که این فعالیت را شناسایی و مسدود می‌کنند، حتی برای مشتریانِ طرح رایگان.

ابزارهای وب اسکرپینگ-۲
مقاله مرتبط:
بهترین ابزارهای وب اسکرپینگ در سال 2025

آزمایش با دامنه‌های فریبنده و نتایج

برای تأیید سوءظن‌هایشان، تیم ایجاد کرد دامنه‌های جدید و منتشر نشده (ایندکس نشده یا به صورت عمومی لینک نشده است) و سیاستی را برای آنها اعمال کرد ممنوعیت کامل robots.txtو همچنین قوانین خاصی برای مسدود کردن ربات‌های Perplexity. پس از مشورت با هوش مصنوعی برای آن سایت‌ها، Cloudflare ادعا می‌کند که پاسخ‌هایی دریافت کردم با جزئیاتی در مورد محتوای میزبانی شده، چیزی که - اگر صحیح باشد - نشان می‌دهد دسترسی علیرغم موانع.

محتوای اختصاصی - اینجا را کلیک کنید  Como Saber Si Tengo Cita en El Sepe

وقتی این مسدودسازی مؤثر واقع شد، کلودفلر مشاهده کرد که هوش مصنوعی پرپلکسیتی به منابع جایگزین متوسل شد برای ایجاد یک پاسخ، اما menos precisa و بدون ویژگی‌های خاص ماده‌ی اصلی، که نشان می‌دهد محدودیت کارساز بود.

پاسخ رسمی پرپلکسیتی

سرگشتگی و robots.txt

سردرگمی، به نوبه خود، rechaza las acusaciones ردیابی مخفیانه و ادعاهایی که Cloudflare دارد malinterpretado بخشی از فعالیت مورد تجزیه و تحلیل. سخنگویان شرکت این گزارش را به عنوان یک «قطعه تجاری» و آنها ادعا می‌کنند که برخی شواهد آنها دسترسی‌های واقعی را آزمایش نمی‌کردند یا حتی مطابقت داشته باشد ربات‌های دیگران.

این استارتاپ همچنین موضع خود را در مورد publicaciones en Xجایی که او ظرفیت [...] را زیر سوال می‌برد sistemas de detección para diferenciar entre دستیاران هوش مصنوعی قانونی، ردیاب‌های شخص ثالث و ترافیک مخرب. علاوه بر این، استدلال می‌کند که نماینده‌ای که به دنبال اطلاعات به موقع است برای پاسخ به یک پرسش یکسان کار نمی‌کند نسبت به یک خزنده سنتی که به صورت گسترده در وب می‌خزد.

اقدامات، شیوه‌های خوب و نقش سایر بازیگران

کلودفلر به عنوان بخشی از استراتژی خود، ... از فهرست پربلکسیتی حذف شد از فهرست ربات‌های مورد اعتماد خود حذف کرده و اضافه کرده است قوانین مسدود کردن ردیابی پنهان ادعایی آن. این شرکت توصیه می‌کند که مدیران فعال شوند سیاست‌های ضد ربات, aplicar چالش‌ها وقتی یک بلوک کامل مورد نظر نیست و از قوانین مدیریت‌شده خاص علیه آن استفاده می‌شود خراش دادن با هوش مصنوعی.

محتوای اختصاصی - اینجا را کلیک کنید  ¿Cómo cancelar suscripciones en OnlyFans?

کلودفلر در استدلال خود، این مورد را با موارد زیر مقایسه می‌کند: نمونه‌هایی از انطباق از بهترین شیوه‌ها، با استناد به بازیگرانی که به robots.txt احترام بگذارید، نمایندگان خود را مستندسازی کرده و استانداردهای نوظهور مانند احراز هویت وب باتدر آزمایش‌های مقایسه‌ای، ادعا می‌شود که ربات‌های دیگر آنها متوقف شدند هنگام مواجهه با ممنوعیت یا مسدود شدن شبکه، بدون تلاش مجدد پنهان.

فهرست وب‌سایت‌های مسدود شده در اسپانیا
مقاله مرتبط:
دولت فهرست رسمی وب‌سایت‌های مسدود شده در اسپانیا را منتشر کرد: نحوه عملکرد سیستم و دامنه‌های موجود.

تضادی که مسیر اکوسیستم را مشخص می‌کند

وب سایت های Perplexity را می خزد

تأمین‌کننده پیش‌بینی می‌کند evolución constante از تاکتیک‌های اپراتورهای ربات و راهکارهای دفاعی مورد استفاده برای مهار آنها. به موازات آن، او در همکاری با متخصصان و سازمان‌هایی مانند IETF para impulsar افزونه‌های robots.txt و اصول قابل اندازه‌گیری که ردیاب‌های خوش‌نیت باید به آنها پایبند باشند.

فراتر از نبض خاص، این پرونده موارد زیر را مطرح می‌کند: بحران اعتماد بین تولیدکنندگان محتوا، پلتفرم‌ها و شرکت‌های هوش مصنوعی: چه کسی می‌تواند دسترسی به چه چیزیتحت چه شرایطی و چگونه شفاف سازی کنید بدون اینکه مدل‌های کسب‌وکار را بشکند یا نوآوری را کند کند. همه چیز به این مکالمه اشاره دارد. باز خواهد ماند در حالی که عوامل هوش مصنوعی اهمیت پیدا می‌کنند و وب قوانین همزیستی خود را تنظیم می‌کند.

این قسمت یک پیام واضح دارد: ردیابی هوش مصنوعی تحت بررسی است، و Cloudflare تاکتیک‌های استتار منتسب به Perplexity و استارتاپ را محکوم کرد قاطعانه تکذیب می‌کنددر وسط، صاحبان سایت به موارد زیر دسترسی دارند ابزارهای جدید برای کنترل دسترسی و مجموعه‌ای از buenas prácticas در دست ساخت است که در ماه‌های آینده زمینه‌ساز این بازی خواهد بود.