Главният изпълнителен директор на MIcrosoft Сатя Надела. © Sergio Perez

...
Главният изпълнителен директор на MIcrosoft Сатя Надела. © Sergio Perez
Коментари Харесай

Microsoft тихомълком изтри базата си данни от 10 млн. снимки на лица

Главният изпълнителен шеф на MIcrosoft Сатя Надела.

© Sergio Perez Хората, чиито фотоси са употребявани, не са питани дали са съгласни компанията да разполага и разпорстранява фотосите. Американският софтуерен колос Microsoft тихомълком изтри от интернет пространството своята база данни MS Celeb, съдържаща информация за 10 млн. лица. Според самата компания това е най-голямата налична обществена мрежа за лицево различаване, защото разполага с 10 млн. фотоси на близо 100 хиляди души. Проблемът обаче е, че MS Celeb е била употребена от разнообразни системи за различаване по целия свят, в това число за потребностите на военните разследващи служби и китайски компании като SenseTime и Megvil.

За университетски цели?

Абонирайте се за Капитал Получавате цялостен достъп до всички публикации и целия списък Хората, чиито фотоси са употребявани, не са питани дали са съгласни компанията да разполага и разпорстранява фотосите. Файловете са взимани от интернет посредством търсачки и видеа, които попадат под лиценза за отбрана на авторските права Creative Commons. Той обаче дава опция за повторното им потребление, само че единствено за университетски цели.

Microsoft, която смъкна данните си няколко дни откакто Financial Times заяви за използването им от други компании, разяснява, че предназначението им е било точно с такава цел. " Базата се е управлявала от чиновник, отхвърлен от Microsoft след премахването ѝ ", споделят от компанията.

Два други масива данни също са били изтрити, в това число тези от наблюдаване Duke MTMC, направени от откриватели от университета Дюк, както и такива, направени от университета в Станфорд - Brainwash.

Brainwash е съдържала фотоси на клиенти от кафе, носещо същото име, в един от кварталите на Сан Франциско, като ги взима от камера, предаваща онлайн. От университета Дюк отхвърлят коментар пред FT, а от Станфорд изясняват, че се премахнали данните по молба на един от създателите на изследването, за което са употребявани.

В ръцете на другите

Общо трите масива данни са били разследвани от берлинския откривател Адам Харви. Неговият план Megapixels документира елементи по отношение на няколко масива данни и метода, по който се употребяват. MS Celeb на Microsoft да вземем за пример е от изгода на няколко търговски организации, излиза наяве от данни на софтуерни компании като IBM, Panasonic, Alibaba, Nvidia, Hitachi, Sensetime и Megvii.

От тях Sensetime и Megvii са китайски компании, които доставят съоръжение за чиновници в провинцията Синдзян, където най-вече мюсюлмански малцинства като уйгури се наблюдават с камери и други софтуерни устройства. После огромна част от тях са пращани в лагери.

Китайската връзка

Megvii неотдавна притегли 750 млн. $ финансиране, а нейното приложение за лицево различаване е Face ++. То е посочено в отчет на организацията Human Rights Watch като снабдител на интегрираната взаимна операционна платформа IJOP в Китай, написа Gizmodo. Тя се употребява от полицията в Синдзян, с цел да следи локалното население - това става най-много посредством камери и смарт телефон приложение, което дава данни за всяко лице в района и образува задачи за сътрудниците при засечено съмнително държание.
След промени в отчета обаче групата е показала, че в действителност Face +++ в никакъв случай не е било употребявано.

Самата Microsoft употребява данните, с цел да тренира логаритми за лицево различаване, излиза наяве от изследването на Харви. Името им Celeb цели да подскаже, че фокусът е върху фотоси на известни персони.

Законно ли е?

" Microsoft употребява думата celebrity (англ. знаменитост), тъй като включва хора, които най-вече работят онлайн и имат цифрова еднаквост ", споделя Харви. " Много хора от таргет групата са критици на самата технология, която Microsoft употребява ", прибавя той.

Преди изследването на FT да излезе обаче, те не са знаели, че техните лица вземат участие в базата данни. " В никакъв случай не мога да се нарека обществена персона, по тази причина няма да се откажа от правото си на персонална цялост ", твърди Адам Грийнфилд, който е софтуерен публицист и урбанист, включен в масива.

Според софтуерни специалисти Microsoft е в нарушаване на регламента за отбрана на персоналните данни GDPR, защото продължава да доставя данните от MS Celeb, откакто ограниченията вляза в действие предходната година.

Въпреки че базата данни е изтрита от Microsoft, тя към момента е налична за откриватели и компании, които преди този момент са я изтеглили. Харви съобщи, че отвореният ѝ код още е разполагаем на някои уеб уеб сайтове.

Вднъж налични, вечно налични

" Не можете да изтриете база данни. След като сте я разгласили един път и хората са я изтеглили, към този момент я има на разнообразни твърди дискове по целия свят, " изяснява той. " Сега тя е самостоятелна от лицензите, разпоредбите или контрола, който преди Microsoft упражняваше, а това значи, че хората към този момент могат да я публикувате в уеб сайтове като GitHub, като съхраняват файловете в Dropbox и Baidu Cloud, тъй че няма метод да ги спрете да продължат да я разгласяват и да го употребяват за свои лични цели ", обобщава той.
Източник: capital.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР