
کلودفلر هوش مصنوعی را علیه خود با هزارتوی بیپایان حقایق نامربوط به کار میگیرد
تاریخ انتشار:
معرفی ویژگی جدید کلودفلر
روز چهارشنبه، ارائهدهنده زیرساخت وب کلودفلر از ویژگی جدیدی به نام "هزارتوی هوش مصنوعی" رونمایی کرد که هدف آن مبارزه با جمعآوری دادههای غیرمجاز توسط هوش مصنوعی است. این ابزار سعی دارد با ارائه محتوای جعلی تولیدشده توسط هوش مصنوعی به رباتها، از جمعآوری دادههای آموزشی برای مدلهای زبان بزرگ که دستیاران هوش مصنوعی مانند ChatGPT را قدرت میدهند، جلوگیری کند.
تاریخچه کلودفلر
کلودفلر که در سال 2009 تأسیس شد، احتمالاً به عنوان شرکتی که خدمات زیرساخت و امنیت برای وبسایتها را ارائه میدهد، شناخته شده است، به ویژه در زمینه حفاظت در برابر حملات انکار سرویس توزیعشده (DDoS) و ترافیک مخرب دیگر.
استراتژی جدید کلودفلر
به جای مسدود کردن ساده رباتها، سیستم جدید کلودفلر آنها را به یک "هزارتو" از صفحات واقعی اما نامربوط جذب میکند و منابع محاسباتی خزندهها را هدر میدهد. این رویکرد تغییر قابل توجهی از استراتژی استاندارد مسدود کردن و دفاع است که توسط اکثر خدمات حفاظت از وبسایتها استفاده میشود. کلودفلر میگوید که مسدود کردن رباتها گاهی به ضرر خود میانجامد زیرا به اپراتورهای خزنده اطلاع میدهد که شناسایی شدهاند.
چگونه هزارتوی هوش مصنوعی کار میکند؟
کلودفلر مینویسد: "هنگامی که ما خزیدن غیرمجاز را شناسایی میکنیم، به جای مسدود کردن درخواست، به یک سری صفحات تولیدشده توسط هوش مصنوعی لینک میدهیم که به اندازه کافی قانعکننده هستند تا خزنده را به عبور از آنها ترغیب کنند." او ادامه میدهد: "اما در حالی که این محتوا واقعی به نظر میرسد، در واقع محتوای سایت مورد حفاظتی نیست که ما از آن محافظت میکنیم، بنابراین خزنده زمان و منابع خود را هدر میدهد."
محتوای نامربوط و علمی
این شرکت میگوید محتوایی که به رباتها ارائه میشود عمدتاً نامربوط به وبسایت مورد خزیدن است، اما به دقت از حقایق علمی واقعی مانند اطلاعات خنثی درباره زیستشناسی، فیزیک یا ریاضیات تهیه یا تولید میشود تا از انتشار اطلاعات نادرست جلوگیری کند. (با این حال، هنوز مشخص نیست که آیا این رویکرد به طور مؤثر از انتشار اطلاعات نادرست جلوگیری میکند یا خیر). کلودفلر این محتوا را با استفاده از خدمات هوش مصنوعی Workers خود، یک پلتفرم تجاری که وظایف هوش مصنوعی را اجرا میکند، ایجاد میکند.
طراحی صفحات تله
کلودفلر صفحات و لینکهای تله را به گونهای طراحی کرده است که برای بازدیدکنندگان عادی نامرئی و غیرقابل دسترسی باشند، بنابراین افرادی که در وب مرور میکنند به طور تصادفی با آنها برخورد نکنند.
تله هوشمندتر
هزارتوی هوش مصنوعی به عنوان آنچه کلودفلر "تله نسل بعدی" مینامد عمل میکند. تلههای سنتی لینکهای نامرئی هستند که بازدیدکنندگان انسانی نمیتوانند آنها را ببینند اما رباتهایی که کد HTML را تجزیه و تحلیل میکنند ممکن است دنبال کنند. اما کلودفلر میگوید که رباتهای مدرن به خوبی این تلههای ساده را شناسایی کردهاند و نیاز به فریبهای پیچیدهتر دارند. لینکهای جعلی حاوی دستورالعملهای متا مناسب برای جلوگیری از ایندکس شدن در موتورهای جستجو هستند در حالی که برای رباتهای جمعآوری داده جذاب باقی میمانند.

شناسایی رباتهای بد
کلودفلر توضیح میدهد: "هیچ انسان واقعی چهار لینک عمیق در یک هزارتوی بیمعنی تولیدشده توسط هوش مصنوعی نخواهد رفت. هر بازدیدکنندهای که این کار را انجام دهد احتمالاً یک ربات است، بنابراین این به ما ابزاری جدید برای شناسایی و شناسایی رباتهای بد میدهد."
بازخورد یادگیری ماشین
این شناسایی به یک چرخه بازخورد یادگیری ماشین تغذیه میشود - دادههای جمعآوریشده از هزارتوی هوش مصنوعی برای بهبود مستمر شناسایی رباتها در شبکه کلودفلر استفاده میشود و حفاظت از مشتریان را در طول زمان بهبود میبخشد. مشتریان در هر طرح کلودفلر - حتی سطح رایگان - میتوانند این ویژگی را با یک تغییر ساده در تنظیمات داشبورد خود فعال کنند.
مشکل رو به رشد
هزارتوی هوش مصنوعی کلودفلر به یک میدان رو به رشد از ابزارهای طراحیشده برای مقابله با خزیدن وب هوش مصنوعی تهاجمی میپیوندد. در ژانویه، ما در مورد "نپنتس"، نرمافزاری که به طور مشابه رباتهای هوش مصنوعی را به هزارتوهای محتوای جعلی جذب میکند، گزارش دادیم. هر دو رویکرد مفهوم اصلی هدر دادن منابع خزندهها به جای مسدود کردن آنها را به اشتراک میگذارند. با این حال، در حالی که خالق ناشناس نپنتس آن را به عنوان "بدافزار تهاجمی" توصیف کرده است که برای به دام انداختن رباتها به مدت چند ماه طراحی شده، کلودفلر ابزار خود را به عنوان یک ویژگی امنیتی مشروع که به آسانی در خدمات تجاری آن فعال میشود، معرفی میکند.
مقیاس خزیدن هوش مصنوعی
به گفته دادههای کلودفلر که با گزارشهای غیررسمی که از منابع شنیدهایم همخوانی دارد، مقیاس خزیدن هوش مصنوعی در وب قابل توجه به نظر میرسد. این شرکت میگوید که رباتهای هوش مصنوعی روزانه بیش از 50 میلیارد درخواست به شبکه آنها ارسال میکنند که تقریباً 1 درصد از کل ترافیک وبی است که آنها پردازش میکنند. بسیاری از این خزندهها دادههای وبسایتها را بدون اجازه از مالکان سایت جمعآوری میکنند، عملی که منجر به شکایات متعدد از سوی تولیدکنندگان محتوا و ناشران شده است.
کاربرد دفاعی هوش مصنوعی
این تکنیک نمایانگر یک کاربرد دفاعی جالب از هوش مصنوعی است که از مالکان و تولیدکنندگان وبسایتها محافظت میکند و نه اینکه به دارایی معنوی آنها تهدید کند. با این حال، هنوز مشخص نیست که رباتهای هوش مصنوعی چقدر سریع ممکن است برای شناسایی و اجتناب از چنین تلههایی سازگار شوند، که ممکن است کلودفلر را مجبور کند تا پیچیدگی تکنیکهای فریب خود را افزایش دهد. همچنین، هدر دادن منابع شرکتهای هوش مصنوعی ممکن است موجب نارضایتی افرادی شود که نسبت به هزینههای انرژی و زیستمحیطی اجرای مدلهای هوش مصنوعی انتقاد دارند.
نسخههای آینده
کلودفلر این را تنها "نسخه اول" استفاده از هوش مصنوعی به طور دفاعی در برابر رباتها توصیف میکند. برنامههای آینده شامل سختتر کردن شناسایی محتوای جعلی و ادغام صفحات جعلی به طور یکپارچهتر در ساختار وبسایتها است. بازی موش و گربه بین وبسایتها و جمعآورندگان داده ادامه دارد، با این حال اکنون هوش مصنوعی در هر دو طرف این نبرد به کار گرفته میشود.