Събирането на данни за изкуствения интелект понякога е кошмарно за

Общността на отворения код на война с AI ботовете

Събирането на данни за изкуствения разсъдък от време на време е кошмарно за уеб сайтове и разработчици

Всеки уеб страница през днешния ден може да бъде нападнат безмилостно от уеб робот, който събира данни за потребностите на изкуствения разсъдък (снимка: CC0 Public Domain)

Ботовете, които всеобщо събират данни от уеб страници, с цел да образоват и зареждат AI модели, се трансформират във все по-сериозен проблем за притежателите на уеб страници. И освен за тях. Разработчиците на отворен код оповестиха партизанска война на колекторите на данни за изкуствения разсъдък. Някои се борят с тях по истински способи, които може да наподобяват наивни или иронични, само че в доста случаи работят.

Днес всеки уеб страница може да бъде нападнат от уеб робот. Понякога уебсайтовете даже губят функционалност, само че разработчиците на програмен продукт с отворен код страдат най-вече: уебсайтовете за отворени планове разгласяват материали за евакуиране, само че AI ботовете пренебрегват директивите на файла robot.txt, които указват секции, неразрешени за сканиране.

През януари разработчикът с отворен код Се Ясо разгласява „ зов за помощ ” в своя блог, описвайки неприятното държание на AmazonBot. Този бот безмилостно удря Git сървъра на разработчика, причинявайки същински DDoS офанзиви. Той подценява директивите на robot.txt, трансформира IP адресите, заменя стойностите на низовете на потребителския сътрудник и прибягва до други трикове.

В последна сметка Си Ясо създаде стратегия, наречена Anubis, която ревизира клиентите, свързващи се към Git сървър – блокира ботове, само че разрешава на браузърите, употребявани от хората, да преминат през нея. Проектът Anubis беше оповестен в GitHub на 19 март и единствено за няколко дни натрупа 2000 звезди, 20 сътрудници и 39 разклонения.

Успехът на програмата подсказва, че казусът на Ясо не е неповторим: агресивното държание на ботовете с изкуствен интелект беше коментирано и от Дрю ДеВалт, създател и основен изпълнителен шеф на платформата SourceHut, който прекарва сред 20% и 100% от работното си време в отбрана против уеб роботи.

Администраторът на плана Linux Fedora Кевин Фенци в един миг трябваше да блокира напълно Бразилия, а разработчикът на KDE Plasma Николо Венеранди блокира краткотрайно всички китайски IP адреси.

През януари неизвестен разработчик на име Аарон пусна решение, наречено Nepenthes на името на насекомоядно растение. Системата примамва AI ботове в „ лабиринт ” от неефикасно наличие, принуждавайки ги да сканират за нелепости.

Подобно решение неотдавна показа Cloudflare с по-очевидното име AI Labyrinth. Тази система се задейства, когато ботовете не съумеят да съблюдават директивата „ без обхождане ”, което ги кара да губят време и запаси.

Дрю ДеУолт прикани за протест на всички нови AI принадлежности, в това число огромни езикови модели, генератори на изображения и GitHub Copilot. Това е малко евентуално да се случи в реалност, тъй че разработчиците с отворен код би трябвало да бъдат изобретателни в борбата с AI ботовете.
Kyocera Cloud Information Manager – цифровата промяна на бизнес документооборота
Оптимизация, сигурност и еластичност в ръководството на информация »»»
предишна обява: Администрацията вкарва напълно електронен документооборот следваща обява:
графа: Новини, Топ вести | етикети: AI ботове, ботове, изкуствен интелект, отворен код
Коментар

ИМЕ *