Image by Marco Verch, from Ccnull

AI Лабиринт: Новият инструмент на Cloudflare заблуждава AI търсачките с фалшиви уеб страници

Време за четене: 3 мин.

Последно обновени: Mar 25, 2025

Написано от Киара Фабри Мултимедиен журналист
Превод от Екипът за локализация и преводи Услуги за локализация и преводи

Cloudflare обяви „AI Labyrinth“, инструмент, създаден за борба с уеб скрейпъри, управлявани от изкуствен интелект, които извличат данни от уебсайтове без разрешение.

Нямате време? Ето основните факти:

Инструментът генерира реалистично, но безполезно съдържание, създадено от AI, с цел да отнеме времето на скреперите.
AI Labyrinth насочва ботове, които игнорират robots.txt, включително тези от Anthropic и Perplexity AI.
Функционира като следващо поколение ханипот, открива и отпечатва неоторизирани роботи за събиране на информация.

Вместо да блокира директно тези ботове, AI Labyrinth ги заблуждава в безкрайния лабиринт от изкуствено генерирани страници, използвайки тяхното време и компютърна мощ.

„Когато установим неоторизирано сканиране, вместо да блокираме заявката, ще предоставим връзка към поредица от страници, генерирани от изкуствен интелект, които са достатъчно убедителни, за да привлекат сканиращата програма да ги премине,“ обясни Cloudflare в блог публикация.

„Но въпреки че изглеждат реални, това съдържание не е действително съдържанието на сайта, който защитаваме, така че сканиращата програма изразходва време и ресурси,“ добави Cloudflare.

ArsTechnica отбелязва, че AI скрейпърите са проблем, тъй като те събират огромни количества данни от уебсайтове, често без разрешение, за да обучават AI модели. Това създава няколко проблема: може да наруши правата на интелектуална собственост, заобикаляйки контролите, които собствениците на уебсайтове използват за регулиране на достъпа.

Освен това, скрейпингът може да доведе до злоупотреба с чувствителни или фирмено-специфични данни. Обемът на скрейпинга се е увеличил драматично, като Cloudflare отчита над 50 милиарда заявки от скрейпъри ежедневно.

Този мащабен процес на извличане на данни изчерпва ресурсите на уебсайтовете, което влияе на тяхната производителност и поверителност, допринасяйки за нарастващите опасения относно експлоатацията на данни в развитието на изкуствен интелект.

Докато собствениците на уебсайтове традиционно разчитат на файла robots.txt за да указват на ботовете какво могат и не могат да достъпват, много компании за изкуствен интелект – включително големи играчи като Anthropic и Perplexity AI – са обвинени, че игнорират тези директиви, както е докладвано от The Verge.

AI Лабиринтът на Cloudflare предлага по-агресивен подход за справяне с тези нежелани ботове. Инструментът функционира като „следващо поколение хънипот“, привличайки ботовете дълбоко в изкуствена мрежа от съдържание, което изглежда реално, но е напълно безполезно за обучението на AI.

За разлика от традиционните хънипоти, които ботовете са научили да идентифицират, AI Лабиринтът създава реалистично изглеждаща, но все пак безсъдържателна информация, използвайки AI платформата на Cloudflare’s Workers.

„Никой истински човек не би се забъркал четири връзки дълбоко в лабиринт от изкуствено генерирана глупост“, отбеляза Cloudflare. „Всеки посетител, който го прави, със сигурност е бот, така че това ни дава нов инструмент за идентифициране и отпечатъци на лоши ботове.“

Създаденото от изкуствен интелект съдържание е предназначено да бъде научно точно, но без никаква връзка със защитавания уебсайт.

Това гарантира, че инструментът не допринася за дезинформацията, като в същото време обърква AI скреперите. Заблуждаващите страници са невидими за човешките посетители и не влияят на класациите на търсачките.

AI Лабиринтът е наличен като безплатна функция, за която може да се избере от всички потребители на Cloudflare. Администраторите на уебсайтове могат да го активират чрез тяхната Cloudflare информационна панел под настройките за управление на ботове.

Компанията определя това като само началото на AI-управлявани противомерки, с бъдещи планове за правене на фалшивите страници още по-заблуждаващи.

Котка-мишка играта между уебсайтовете и AI скреперите продължава, като Cloudflare прилага иновативен подход за защита на онлайн съдържанието. Въпреки това, все още съществуват въпроси относно това колко бързо AI компаниите ще се адаптират към тези капани и дали тази стратегия може да доведе до ескалация в битката за уеб данни.

AI Лабиринт: Новият инструмент на Cloudflare заблуждава AI търсачките с фалшиви уеб страници

Радваме се, че работата ни Ви хареса!

Оставете коментар