Доброволческите проекти за информационни и снимкови банки в интернет се

...
Доброволческите проекти за информационни и снимкови банки в интернет се
Коментари Харесай

Надига се движение срещу фалшивото AI съдържание


Доброволческите планове за осведомителни и снимкови банки в интернет се оправят по-добре с прочистването от лъжливо наличие, генерирано от AI логаритми, в сравнение с огромните уеб-платформи
(графика: CC0 Public Domain)

Библиотеките с гратис и свободно налично наличие в мрежата се употребяват от милиони хора, само че напоследък все по-голяма част от него е генерирана от AI логаритми. Все повече създатели и създатели недоволстват против наклонността. Те упорстват за пречистване на онлайн-ресурсите от „ боклука ”, генериран от AI.

Група редактори на Wikipedia сътвориха WikiProject AI Cleanup – самодейност за „ битка с възходящия проблем със зле написано наличие, генерирано от AI, в Wikipedia ”. Целта на групата е да отбрани едно от най-големите складове на информация в света от подвеждащата информация, генерирана от AI, която „ цапа ” резултатите в търсачките, онлайн-книгите, университетските списания, фотографските банки.

„ Мнозина от нас видяха разпространяването на наличие, в което е особено едно неестествено изложение, показващо ясни признаци, че е генерирано от AI. Ние успяхме да копираме сходни „ стилове ” благодарение на ChatGPT ”, споделя Иля Лебльо, член-основател на WikiProject AI Cleanup. „ Откриването на някои постоянно срещани „ крилати изречения ”, типични за AI, ни разреши бързо да видим някои от най-фрапиращите образци за публикации, генерирани от логаритми ”.

Инициативата значително прилича ограниченията, поискани от фотографи, предлагащи своите фотоси в свободни онлайн-банки за изображения. Някои от създателите издействаха въвеждането на ново предписание, съгласно което изображения, генерирани от AI, следва да бъдат маркирани като такива. За множеството фотографи изображенията, основани от логаритми, подкопават качеството на банките за образни материали, или казано с други думи – пълнят архивите с „ отпадък ”.

В доста случаи WikiProject AI Cleanup намира AI наличието в Wikipedia посредством същите способи, които други експерти са употребявали за намиране на AI-съдържание в научни списания – а точно посредством търсене на изречения, постоянно употребявани от ChatGPT. Един впечатляващ образец е появяването на изрази от вида на „ към последната актуализация на знанията ми към януари 2022 година ”, отнасяща се до последния път, когато огромният езиков модел е обновен.

Други случаи са по-трудни за разкриване. Лебльо и сътрудниците му дават за образец случая със публикация за османската цитадела Амберлисихар в Wikipedia. “Крепостта Амберлихисар е издигната през 1466 година от Мехмед Завоевателя в Трабзон, Турция. Крепостта е проектирана от арменския проектант Остад Крикор Багсараджан.[7] Строежът на крепостта е приключен благодарение на композиция от камък и тухлени материали, като за работата по плана са привлечени майстори и строители от Румелия. Дървесината за крепостта е добивана от горите по крайбрежието на Черно море. Продължителността на строителството не е ясна, само че се знае, че крепостта е приключена през 1466 година Вероятно строителството е лишило няколко години.[7] ”.

Статията с дължина над 2000 думи е изпълнена с безапелационни абзаци като тези нагоре, разграничени на секции по отношение на нейното име, структура, разнообразни интервали на блокада и даже старания за възобновяване, откакто крепостта претърпяла „ обилни вреди вследствие на бомбардировка от съветските сили ” по време Първата международна война ”. Но дали може да се има вяра на това?

„ Една дребна детайлност: сходна цитадела в никакъв случай не е съществувала ”, споделя Лебльо. Освен няколко незначителни обстоятелството, упоменати в публикацията, като това, че Мехмед Завоевателя или Мехмед II е бил действителна персона, всичко останало в публикацията е подправено. „ Цялото наличие е машинация, генерирана от AI, с добре форматирани цитати, препращащи към изцяло несъществуващи творби. ”

Фалшивите цитати са „ гибелен ” проблем, тъй като могат да останат незабелязани с месеци. Това погрешно наличие може да залегне в наборите от данни, употребявани за образование на LLM модели. Тогава лъжливата информация се мултиплицира и още веднъж остава мъчно откриваема, тъй като генерираният текст може да звучи добре, с вярно завършени цитати с препратки към действителни източници.

Усложнението става още по-голямо, в случай че подправеното наличие се превежда от или на непознати езици. За преводачите може да се окаже мъчно да виждат, че нещо не е наред в наличието.

Драмата не завършва дотук. Понякога AI наличие, появяващо се в Wikipedia, може да включва и образна машинация. Като образец от WikiProject AI Cleanup показват публикация за Дарул Улум Девобан – същинска ислямска школа в Индия. Към текста е показано изображение, което – сходно на доста публикации в Уикипедия – наподобява като картина, типична за интервала и обвързвана с тематиката на публикацията. При по-внимателно разглеждане обаче набитото око може да забележи несъвършенствата, типични за изображения, генерирани от AI – издайнически индикации като изкривени ръце и крайник със седем пръста.

В последна сметка към този момент наподобява, че онлайн-ресурсите, които се построяват и поддържат на доброволчески начала, се оправят по-добре с прочистването от AI наличие, в сравнение с други огромни интернет услуги. Енергията и концентрацията на стотиците и хилядите запалянковци съумява да поддържа хигиената на наличието по-качествено от огромните уеб-платформи, които също имат модератори, само че те не смогват толкоз добре да се оправят с големите размери отчети и с инспекцията за подвеждащо наличие, генерирано от AI.
Източник: technews.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР