Данните, с които системите за изкуствен интелект се обучават, включват

Какви заплахи за сигурността крие изкуственият интелект

Данните, с които системите за изкуствен интелект се образоват, включват големи количества фотоси и текстове от интернет. В този огромен информативен масив се съдържат и персоналните данни на доста хора. АРД разгласява следствие на немски публицисти, което разкрива, че този развой съставлява проблем за отбраната на персоналните данни.

Германската обществено-правна телевизия дава за образец проблем с гола фотография на холандец, която може да се открие в интернет. Описанието ѝ съдържа името и семейството на индивида, както и географските координати на мястото, където тя е била направена. Ако някой потърси с тази информация въпросния човек в интернет, той доста бързо може да бъде открит.

И това не е изолиран случай, акцентира АРД. При разбор на евентуално най-голямата в света база данни за образование на изкуствен интелект, генериращ изображения, публицисти от " Байеришер Рундфунк " са разкрили голямо количество информация, с която могат да бъдат разпознати съответни хора.

Базата данни включва изображения на лица и имена, географски координати или имейли и даже номера на банкови сметки. LAION5B, акроним от " Large-scale Artificial Intelligence Open Network " (от англ.: огромна отворена мрежа на неестествен интелект), се състои от 5 милиарда интернет връзки към изображения и техните описания. Това е единствената сходна база данни, употребена за образование на системи, употребяващи изкуствен интелект, която е обществено налична.

Проблемните персонални данни към този момент са в масивите за образование

Данните, употребявани за образование на изкуствения разсъдък, осигуряват суровия метериал за системите, които на собствен ред след това би трябвало да генерират нови текстове и изображения. Милиони хора по света ги употребяват сега - това са така наречен генератори на изображения като Stable Diffusion, Midjourney, Dall-e от OpenAI и други. Потребителите разказват с къси текстове какъв претекст желаят да участва в поръчаното от тях изображение. След това стратегиите употребяват данните, с които са били подготвени, с цел да основат новото изображение.

В края на юни тази година анонимна група подаде в Съединени американски щати правосъден иск против компанията OpenAI, чийто артикул е и чатботът ChatGPT, показва АРД. Ищците упрекват компанията в всеобщи нарушавания на неприкосновеността на персоналния живот, наред с други обвинявания към нея.

Рисковете, свързани с EXIF данните

Т.нар. EXIF (Exchangeable Image File Format - от англ. " обменяем файлов формат на изображения) метаданни отбелязват информацията, събирана във файловета на изображенията. Записват се времето, в което е била направена фотографията, модела камера, а от време на време и точното местонахождение.

Анализът на немскоезичната секция въз основата данни LAION е разчел сполучливо точната локация на 310 000 изображения. Освен при липса на основателни причини за противоположното, сходни данни постоянно би трябвало да се отстраняват при шерване на файловете, счита Германската федерална работа за осведомителна сигурност.

Експерт по отбрана на данните: " Силно проблематично "

Според Айке Клайнфелд, който работи за комисаря по отбрана на персоналните данните в Хамбург, всеобщото разпространяване на информация за местоположението посредством метаданните съставлява проблем, в случай че е сензитивна информация, която разрешава да се вършат изводи за съответни физически лица.

Съоснователят на LAION Кристоф Шуман споделя, че в този момент схващат за казуса. LAION съставлява доброволческо съдружие на хора от Европа и Северна Америка, които се борят за демократизация на изкуствения разсъдък. Шуман споделя какви са аргументите за основаването на организацията: " Основахме LAION от възторг към изкуствения разсъдък и от предпочитание да го забележим демократизиран. А не в последна сметка да останат единствено 2 или 3 огромни компании. "

Радикалната бистрота отличава LAION от съперници като Microsoft, Гугъл, Midjourney и OpenAI. Четирите компании не са дали отговор на въпроси на АРД за метода, по който събират и употребяват данните за образованието на изкуствените интелекти, които създават. Ако публицисти и учени желаят да проучат по какъв начин действат известни генератори на изображения, употребяващи изкуствен интелект, сега инструментите на LAION са единствената опция за това.

Европейското законодателство и масивите за образование

Брюксел планува да вкара в идното си законодателство за изкуствения разсъдък по-голяма бистрота за осведомителните масиви, които са били употребявани при образование на системите. Все още обаче не е ясно по какъв начин ще наподобяват бъдещите регулации на Европейски Съюз.

Преговорите по тематиката не престават, осведоми АРД. Правилата би трябвало да бъдат признати до края на годината и да влязат в действие през 2025 година.

***

Припомнете си и това видео от нашия списък: