
Image by Oberon Copeland, from Unsplash
AI Ботовете Претоварват Сървърите на Уикипедия
Фондацията „Уикимедия“ изрази тревога от нарастващото натоварване на своите сървъри в резултат на автоматизирани ботове, които сканират информация за обучение на модели на изкуствен интелект.
Нямате много време? Ето най-важните факти:
- AI ботове сканират съдържанието на Wikimedia на рекордни нива.
- Ботовете доведоха до 50% увеличение в употребата на мултимедийна информация.
- 65% от трафика с висока стойност вече идва от ботове.
Фондацията съобщи в скорошна публикация, че машинно-генерираното трафик продължава да нараства с несравнима скорост, докато хората съставляват само малка част от този трафик.
„От януари 2024 г., наблюдаваме увеличение на ширината на лентата, използвана за сваляне на мултимедийно съдържание, с 50%,“ според публикацията.
„Това нарастване не идва от хората, които четат, а основно от автоматизирани програми, които сканират каталога на Wikimedia Commons за свободно лицензирани изображения, за да хранят изкуствени интелекти с изображения,“ допълва публикацията.
Ботовете, известни като роботи за индексиране, крадат големи количества данни от проектите на Уикимедия, включително Уикипедия и Уикимедия Комънс, без правилно признание или официални инструменти за достъп. Процесът затруднява новите потребители да открият Уикимедия и създава прекомерно натоварване на техническите им системи.
Например, в публикацията се отбелязва, че страницата на Джими Картър в Уикипедия получи повече от 2.8 милиона прегледа през деня, в който почина през декември 2024 г. Видеото от дебата през 1980 г. причини значително увеличение на трафика на уебсайта. Видеоклипът от неговия дебат през 1980 г. също предизвика внезапен ръст на трафика. Уикимедия се справи – но току-що. Истинският проблем според инженерите е постоянният поток от бот трафик.
„65% от най-скъпия ни трафик идва от ботове,“ написа Фондацията. Ботовете „масово четат“ съдържание, особено по-малко популярни страници, което задейства скъпи заявки към основните данни на центровете на Wikimedia.
Въпреки че съдържанието на Wikimedia е безплатно за използване, сървърите му не са. „Съдържанието ни е безплатно, инфраструктурата ни не е,“ каза Фондацията. Екипът продължава да разработва методи за насърчаване на „отговорна употреба на инфраструктурата“, като призовава разработчиците да използват API, вместо да сканират целия сайт.
Проблемът засяга Wikimedia, както и множество други уебсайтове и издатели. Но за най-голямата в света платформа за отворено знание, той застрашава стабилността на услуги, на които разчитат милиони хора.
Оставете коментар
Прекрати