Технологията обещава лесно разкриване и доказване на кражбите на изходен

...
Технологията обещава лесно разкриване и доказване на кражбите на изходен
Коментари Харесай

Изкуствен интелект разпознава почерка на програмиста

Технологията дава обещание елементарно откриване и доказване на кражбите на първоначален код, както и на киберпрестъпниците, само че са вероятни и нездравословни последици

Изкуственият разсъдък разпознава по-лесно по почерка опитните разработчици, в сравнение с начинаещите

Американски учени са създали логаритъм, кадърен да разпознава създателите на програмен код, като употребява познания от региона на стилометрията. Новата технология евентуално може да помогне в решение на необятен набор от проблеми – от засичане на плагиатството до битката с киберпрестъпността.

Рейчъл Грийнстад, професор университета Дрексел, Пенсилвания и Айлин Калискан, доцент в университета Джордж Вашингтон, са основали система за машинно образование, която е в положение да разпознае програмистите, като проучва изходния код, написан от тях, или компилирани двоични файлове. Изследването е оповестено в документ на симпозиума по сигурност Usenix този месец във Вашингтон.

За да тестват логаритъма, откривателите употребявали примерни стратегии, написани в границите на Гугъл Code Jam – годишен интернационален конкурс по програмиране, който се организира под егидата на интернет колоса. Изкуственият разсъдък съумял вярно да разпознава създателите в 96% от случаите, като анализирал осем примерни кода, написани от 100 разнообразни програмисти.

Увеличаването на броя на участниците до 600 леко понижило успеваемостта на логаритъма – 83% от създателите са били вярно разпознати от системата. Но и този резултат е изумително висок.

Цифров „ пръстов отпечатък ” на програмиста

В хода на проучванията Грийнстад и Калискан откриват няколко любопитни модела на държание на програмистите. Така да вземем за пример, става известно, че по-опитните разработчици са по-лесни за идентифициране по програмния код, в сравнение с начинаещите. Както означават създателите, това може да се дължи на обстоятелството, че начинаещите програмисти постоянно прибягват до заимстване на непознат код, разполагаем в тематичните уеб запаси.

Установена е също по този начин връзка сред сложността на решаваната задача и простотата на идентифициране на създателя на кода. При разбор на изходния код при решение на релативно елементарни проблеми, логаритъмът вярно дефинира авторството в 90% от случаите. При решение на по-сложни проблеми, ефикасността на AI се е нараснала до 95%.

Как работи системата

Системата с изкуствен интелект работи въз основата на познания в региона на стилометрията, която се свежда до статистически разбор на езиковия жанр. Известно е, че стилът на писане на всеки субект е неповторим – с избран набор от думи, употребявани от създателя, и особености в синтаксиса и граматиката. Всичко това основава неповторим стилистичен „ отпечатък ”, който разрешава да бъде разпознат тъкмо създателят на текста при задоволителен брой работни мостри.

На първия стадий от работата си, логаритъмът дефинира присъщите черти на фрагмента на изходния код. Изследователите са съумели да понижат листата с оценъчни характерности на 50 – единствено тези, които в действителност оказват помощ да се разграничи един програмист от различен. Учените считат за несъществено, да вземем за пример, това по какъв начин е форматиран изходният код.

Въз основа на събраните данни се конструира така наречен „ нереално синтактическо дърво ”, което отразява цялостната конструкция на кода, а не на случайни съставни елементи. Важно е да се означи, че за вярното действие на метода са нужни няколко мостри на код от еднакъв създател.

Приложение и вероятни последствия

Учените имат вяра, че резултатите от тяхната работа могат да бъдат употребявани за идентифициране на случаите на безскрупулни обири на код. Например, преподавателите в механически университети ще могат да проучват кода, възложен от студентите-програмисти и с огромна сигурност да открият дали кодът е писан независимо или е взет наготово.

Софтуерните компании пък ще могат да следят спазването от програмистите на договорните клаузи за отбягване на случаи, при които някогашни чиновници употребяват разработки, които са благосъстоятелност на компанията, за задачите на други планове.
още по тематиката
AI логаритъмът ще помогне и на фирмите за осведомителна сигурност, които ще могат по-лесно да разпознават създателите на злоумишлен програмен продукт. Но в това време, въоръжени с подобен инструмент, властническите режими ще създадат доста по-труден живота на разработчици на решения, които заобикалят държавната цензура в интернет.

Разработчиците, които постоянно способстват за развиването на свободния програмен продукт, също могат да пострадат, губейки опцията да останат анонимни. Според Грийнстад, умишленото комплициране на изходния код не оказва помощ за опазване на анонимността – даже и след тази обработка, кодът съдържа неповторимия авторски почерк.

„ Хората би трябвало да схванат, че при сходни обстановки няма обезпечен метод да се скрие самоличността ”, сподели Грийнстад. Но в друго проучване, с създател е Луси Симко – сътрудник на Калискан, се показва, че програмистите към момента могат да трансформират личните си код, тъй че да заблудят логаритъма, без да имат специфични умения за това.
Източник: technews.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР