Reddit ще съди Perplexity за незаконен скрапинг на данни за ИИ
Платформата Reddit заведе дело против Perplexity и трима снабдители на услуги за уеб-скрайпинг – SerpApi, Oxylabs и AWMProxy – обвинявайки ги в всеобщо, неоторизирано събиране на чувствителни данни от уеб страницата на обществената медия за образование на изкуствен интелект (ИИ). В делото се твърди, че Perplexity, разработчикът на ИИ-търсачката, употребява данни, получени посредством тези медиатори, вместо да подписа непосредствено съглашение с Reddit, както са създали някои други AI-компании.
Според желае, както научи The Verge, през май 2024 година Reddit е изпратил на Perplexity публично искане за преустановяване и прекратяване на извличането на наличие, на което компанията е дала отговор, че не употребява данни от Reddit за образование на своите AI-модели и съблюдава разпоредбите, посочени във файла robots.txt. Въпреки това, малко по-късно броят на цитиранията на Reddit в отговорите на Perplexity се е нараснал, съгласно ищеца.
Reddit акцентира, че генерираните от потребителите милиони изявления обезпечават забележителна стойност за образованието на изкуствения разсъдък и даже компанията е сключила съглашения с OpenAI и Гугъл, а също е въвела заплатен API през 2023 година, в опит да получи отплата за потреблението на своите данни.
Бен Лий, основен юрист на Reddit, съобщи, че „ ИИ-компаниите са влезнали в конкуренция във въоръжаването за висококачествено генерирано от индивида наличие и този напън е подхранил стопанската система за пране на данни в промишлен мащаб “. Той е посочил и литовския скрепер Oxylabs UAB, ботнета AWM Proxy и SerpAI, които намерено популяризират способи за заобикаляне на ограниченията за сигурност, като типични образци за такава противозаконна активност. Той твърди, че тези компании (ответници по делото), без пряк достъп до Reddit, прикриват своите скриптове и местонахождение, с цел да крадат наличие посредством резултатите от търсенето в Гугъл, и че Perplexity умишлено придобива тези откраднати данни, заобикаляйки правно съдействие.
Джеси Дуайър, началник на връзките в Perplexity, съобщи пред The Verge, че компанията към момента не е получила иск, само че има намерение пламенно да пази правото на потребителите на свободен и обективен достъп до социална информация. Той акцентира, че Perplexity остава кардинална и виновна и няма да толерира закани за откритостта и публичния интерес.
Reddit преди този момент съди Anthropic по сходни аргументи, потвърждавайки, че ботовете на Anthropic са получили достъп до платформата Reddit, даже откакто Anthropic съобщи, че не прави това.
Спомнете си, че Reddit реши да замрази проектите си за монетизация на събредитите и че има намерение да се трансформира в търсачка. Така, с изключение на монетизацията на скъпото наличие на платформата посредством разнообразни контракти с обособени ИИ-компании, като търсачка компанията ще построи още едно перо за доходи.




