Алгоритмите са толкова напреднали, че вече разпознават безпогрешно хората(снимка: CC0

...
Алгоритмите са толкова напреднали, че вече разпознават безпогрешно хората(снимка: CC0
Коментари Харесай

Да се облечем като за ерата на повсеместното видеонаблюдение


Алгоритмите са толкоз напреднали, че към този момент разпознават безпогрешно хората
(снимка: CC0 Public Domain)

Том Голдщайн, доцент по компютърни науки в Университета на Мериленд, взема своето „ наметало-невидимка ” от купчина облекла на един стол в кабинета си и го навлича върху главата си. На неговия посетител Джон Сийброк дрехата наподобява като необятен суичър, направен от бляскав полиестер, щампован с с обилни цветове в безформени шарки, които ни минимум не вършат Голдщайн незабележим. Даже в противен случай, с тази дреха е невероятно да не бъде видян. Но за камерите за видеонаблюдение наметалото може и да е невидимо, в действителност.

Гостът е дошъл за срещата отдалеко с трен. На ЖП гарата, от досада или нещо друго, той взема решение да брои камерите за видеонаблюдение. Оказват се тъкмо 26. За хората, живеещи в дребни градчета, където всички се познават, анонимността на огромния град е едно от огромните удоволствия на градския живот. Но тя става все по-илюзорна. Камерите са на от ден на ден места и виждат всекиго и всичко.

Епидемията от ковид, от която страда целият свят през последната година, потвърди, че лицевото различаване работи, макар носенето на „ хирургически ” маски. Има много мощни логаритми, които разпознават безпогрешно хората с на половина скрито лице. Но наметалото на Голдщайн е друго нещо.

Обработката на образни сигнали

Всеки от нас познава тези обстановки – гледаш по какъв начин дърветата „ прехвърчат ” край прозореца на рейса, поглеждаш другите хора в трамвая, четеш книга.

В това време в главата на индивида се прави необикновено комплицирана изчислителна работа – графична обработка. Фоторецепторите в нашите ретини улавят изображенията, трансформирайки светлината в електрически сигнали, които се движат по оптичния нерв. Първичната зрителна кора в тилната част на главата изпраща тези сигнали – а те предават неща като ръбове, цветове и придвижване. Сигналите минават през поредност от йерархични церебрални пластове. Накрая мозъкът ги сглобява още веднъж в обекти, които от своя страна се съединяват в комплицирани подиуми. И най-после, системата за образна памет в префронталната кора ги разпознава като дървета, хора или книга. Всичко това за към двеста милисекунди.

Да накараш машините да могат да обработват и разпознават изображения толкоз тъкмо, колкото е човек, да научиш машините да четат, приказват и пишат на нашия език – това е свещеният Граал на проучванията на изкуствения разсъдък от началото на шейсетте години. Тези машини не виждат холистично – те виждат в пиксели – дребните зрънца светлина, които сформират фотографското изображение. В зората на ИИ инженерите се опитваха да „ обучат ” компютърните стратегии да извличат потребната информация от пикселите, което да алармира на машината какъв обект гледа камерата. Това постоянно се реализира посредством добиване на информация за ориентацията на ръбовете в изображението, защото ръбовете наподобяват идентични при разнообразни условия на осветяване. Програмистите се опитваха да обобщят наличието на изображението, да дефинират „ характерности ”, да разказват ориентацията на ръбовете, както и текстури, цветове и форми.

Но пионерите скоро се сблъскаха с проблем. Човешкият мозък има забележителна дарба, когато обработва съставените елементи на даден обект, да резервира потребното наличие, като в същото време изхвърля „ неприятни променливи ”, като осветяване, сенки и позиция. ИИ откривателите не биха могли да опишат тъкмо това, което прави котката разпознаваема като котка, камо ли да кодират това в математическа формула, която да не е наранена от безпределно променливите условия и подиуми, в които може да се появи котка. Невъзможно е да се кодира когнитивният скок, който мозъкът ни прави, когато обобщаваме. По някакъв метод ние знаем, че това е котка, даже когато я зърнем единствено отчасти или я забележим в подигравка.

Изследователи от целия свят, в това число тези от Университета в Мериленд, прекарват десетилетия в образование на машини, с цел да виждат котки, наред с други неща, само че до 2010 година компютърното зрение (CV) към момента има % на неточности от към тридесет %, което е прекалено много.
още по тематиката
След 11 септември доста се говореше за „ интелигентни ” камери за видеонаблюдение, които могат да разпознават лица, само че се оказа, че технологията работи единствено когато изображенията са с паспортно качество. Тя не се справяше с лица „ в дивата природа ” – т.е., в действителния свят. Считаше се, че разпознаването на обекти на човешко равнище е недостижим проблем, някъде оттатък научния небосвод.

Но ето, че и това се промени. В рамките на няколко години машините стигнаха до такава степен да могат да правят различаване на обекти с освен човешко, само че и свръхчовешка акуратност, с помощта на „ дълбокото самообразование ”, в този момент повсеместния метод към AI, в който логаритмите, които обработват входните данни, се учат посредством голям брой цикли на проби и неточности. В основаното на „ надълбоко самообразование ” компютърно зрение извличането на характерности и картографирането се правят от невронна мрежа, съзвездие от изкуствени неврони. Чрез образование на невронна мрежа с огромна база данни от изображения на обекти или лица, логаритъмът ще се научи да разпознава вярно обекти или лица, които след това среща. Само през последните години са създадени задоволително цифровизирани набори от данни и големи изчислителни запаси, основани на облака, с цел да може този метод, жаден за данни и сила, да работи. Милиарди цикли на проби и неточности се извъртат, с цел да може логаритъмът да разбере освен по какъв начин наподобява котката, само че и каква е котката.

„ Проблемите с компютърното зрение, които съгласно учените нямаше да бъдат преодолени приживе, бяха решени след няколко години ”, твърди Голдщайн, представен в обява по тематиката на. „ Причината, заради която научната общественост е толкоз шокирана от тези резултати, е, че имаме инструмент, който реализира „ човешки ” резултати, каквито никой в никакъв случай не е предполагал, че ще имаме. И внезапно освен го имаме, само че и той прави неща, които са по-щурави, в сравнение с бихме могли да си представим. Това е нещо умопомрачително ”.

Днес компютрите към този момент могат да търсят отклонения в изображение от компютърна томография и да виждат проблемите най-малко толкоз дейно, колкото и най-хубавите рентгенолози. Подводното сканиране може самостоятелно да следи цели риболовни популации – задача, която хората вършат по-малко надеждно и по-бавно. Heineken употребява неестествен разсъдък да инспектира осемдесет хиляди бутилки на час, създадени от нейното оборудване във Франция – извънредно скучна задача за надзор на качеството, изпълнявана преди този момент от хората.

В частност, принос за триумфа има технология за наблюдаване, наречена YOLO.Изображението минава през детектор на обекти (YOLO – ще рече „ поглеждате ме единствено един път ”), което е система за компютърно зрение, необятно употребена в роботите за видеонаблюдение.

За YOLO човешкият облик е просто сбирка от пиксели. Системата картографира онлайн цифровото изображение, измервайки яркостта на всеки пиксел. Тогава пикселите минават през стотици пластове, известни като конволюции, направени от изкуствени неврони – развой, който групира прилежащите пиксели дружно в ръбове, по-късно ръбовете във форми и по този начин нататък, до момента в който в последна сметка получи… човек. Досадните променливи се отстраняват по пътя, защото пикселите се „ дестилират ” посредством функционалности, в които е кодирано човешкото наличие. Всичко това се случва за почти същото време, колкото е належащо на мозъка да разпознае обект. Накрая на екрана се появява червен червен силует, наименуван „ ограничаваща кутия ”, и в него написа „ мъж ” или „ жена ” и вероятно число – хипотетична възраст.

Забелязан си

Напредъкът в компютърното зрение се случи толкоз бързо, че локалните и национални политики за дискретност изостават надалеч зад софтуерните благоприятни условия на ИИ. Това оставя обществото уязвимо за актуалния „ паноптикон ” – общество на цялостно видеоследене и контрол.

Крис Месерол, външнополитически помощник в Института Брукингс, който учи потреблението на лицево различаване в Китай, както и други технологии за наблюдаване – необятно употребявани като част от устрема на Си Дзинпин за „ поддържане на стабилността ” – споделя, че политиците на Запад не са основали управнически структури за отбрана на жителите. И, прибавя той, „ в Съединени американски щати държавното управление към момента не се е сетило да го употребява по метода, по който го прави Китай ”. Някои деятели считат, че към този момент нямаме никакво време.

„ Отровни ” знаци

Сред деятелите е жена на име Кейт Берташ, която живее в Лос Анджелис. Определя сее си като част от „ съпротивата ”. Обичайно върви с облекла, по които има надписи – сходни на регистрационните номера на колите.

Надписите по облеклото не са инцидентни. В Съединени американски щати мрежите на системите за автоматизирани различаване на регистрационните табели и базите данни, които съществуват в цялата страна, се употребяват интензивно. За първи път създадени в Обединеното кралство в края на седемдесетте години, АРРТ стартират да се появяват в американските градове при започване на 2000-те. Четците употребяват оптично различаване на знаци, което улавя номерата на регистрационните табелки. Информацията се съхранява дружно с местоположението, датата и часа на записа. По-новите системи могат също да дефинират къде е най-вероятно да бъде открит автомобил въз основа на моделите на пътешестване.

АРРТ камери има инсталирани по стълбовете на уличното осветяване, надлези за автомагистрали, изходи за автомагистрала, кабинки за таксуване, цифрови знаци за ограничение на скоростта. Те автоматизирано записват всички номера на регистрационните табели, които попадат в полезрението им, със скорост от хиляди в минута. В по-новите системи дори има „ горещи описи ” на „ значими табели ”, принадлежащи на обвинени в закононарушения. Когато някоя табела бъде видяна някъде, чиновниците на полицията биват предизвестени за местоположението.

Има прекомерно малко ограничавания за поверителността на тези данни. Обработката всекидневно е дело на частни компании. Полицейските ръководства получават данни и ги споделят между тях. Според The Atlantic, Vigilant Solutions, водачът в промишлеността, разполага с база данни с минимум два милиарда неповторими локации за регистрационни номера. Неотдавнашен одит на полицейския отдел в Лос Анджелис и три други правоприлагащи организации в Калифорния е открил, че все още, в който са били регистрирани, 99,9% от всички триста и двадесет милиона изображения на табели в базата данни на отдела не са свързани с участници в наказателни следствия. Всичко това стои зад мотивацията на Берташ да прави това, което прави

Като работеща на ненапълно работно време, дамата проектира и продава облекла и възглавнички за деца с приятни и занимателни щампи, което й дава концепцията да стартира да създава макети на облекла с подправени регистрационни табели. Тя даже ги тества с приложение с отворен код, работещо сходно на системите за видеонаблюдение и различаване. В последна сметка тя е съумяла да предиздвикала своите мостри си да биват виждани като същински регистрационни табели от системите АРРТ.

Дрехгите на Берташ срещу видеонаблюдение тя назовава „ отровни ” офанзиви. Те имат за цел да „ замърсят ” базите данни, тъй че системата като цяло да е по-малко надеждна. „ Отровните ” офанзиви се основават на групови дейности. Няколко души, украсени с регистрационни номера, не могат да реализират огромна разлика. Ала в случай че са доста хората, които носят такива облекла, биха могли да създадат смяна. За да се случи това, дизайнерите би трябвало да създадат облекла срещу наблюдаване, които хората биха желали да облекат.

Мантия-невидимка

Когато Сийброк споделя на децата си, и двамата почитатели на „ Хари Потър ”, че ще пътува, с цел да види мантия-невидимка, младежите са разчувствани. За наметалото на Голдщайн Сийброк е научил от научна публикация, която професорът и неговите възпитаници са изготвили за своята работа. Но когато Сийброк вижда Голдщайн в суичъра му – пъстър, пъстър, с размазани органични форми в оранжево, като каша от извънредно смачкани зеленчуци, с тъмни, неразбираемо човешки форми от горната страна – той не може да си показа каква магия ще произтече от това. Единствената разпознаваема форма му се коства е фигура, изглеждаща като светофар, тъкмо под деколтето. Разглеждан по-артистично, моделът доброволно извиква асоциации с модернистично изкуство, неразбираемо за мнозина.

Но тогава Голдщайн пристъпва пред камерата и детекторът YOLO го снима. Детекторът не вижда индивида. Вижда стола откъм гърба, появява се надписче „ стол ” в ограничаващата кутия, само че не и високия 36-годишен годишен мъж, който стои тъкмо пред него – Голдщайн. Звучи магично, нали?

Шарката на суичъра е „ изкривяващо изображение ” – тип оптична заблуда, която заблуждава логаритъма и той не вижда индивида, който носи дрехата. За разлика от „ отровните ” офанзиви, които се стремят да подкопаят системите за наблюдаване с неприятни данни, изкривяващите офанзиви са изображения, които са основани, с цел да се възползват от минусите в метода, по който компютрите „ виждат ”. Те са като хакове, само че за изкуствения разсъдък. Уязвимостите в сигурността на операционните системи и компютърните мрежи са необятно известни, само че дълбокото образование на системите с неестествен разсъдък са към момента нови и толкоз комплицирани, че учените към момента не схващат изцяло типовете хакове, на които са уязвими.

Феноменът на „ изкривяващите ” изображения е открит почти инцидентно през 2011 година от Кристиан Сегеди от Гугъл Research. Сегеди образова невронна мрежа, с цел да реши казуса какъв брой тъкмо може да промени изображението на транспортен съд, преди системата да прекласифицира изображението като аероплан. Той открива, че единствено с минимална трансформация на пикселите системата го е прекласифицирала с висока степен на убеденост, макар че за човешкото око към момента е явно транспортен съд, а не аероплан.

Студенти от M.I.T. пък отпечатват тримерен модел на костенурка с текстурирана черупка, която заблуждава логаритъма за разкриване на обекти на Гугъл, с цел да класифицира влечугото като пушка. В отчет от 2018 година „ Надеждни физически офанзиви в света върху образната подредба на дълбокото образование ” откривателите разказват опит, в който „ смущават ” пътен знак STOP благодарение на няколко дребни ваденки, които на човек наподобяват като графити, само че това прави класификатора на обектите да вижда осмоъгълният червен знак като правоъгълен черно-бял знак, на който написа „ Ограничение на скоростта 45 ”. Не е мъчно да си представим какъв безпорядък може да провокира едно от тези разтърсвания в бъдещия свят на самостоятелните коли.

Изследванията на Голдщайн в последна сметка са ориентирани към схващане на тези уязвимости и основаване на ИИ системи, които да са по-сигурни. Той изяснява, че той и неговият възпитаник Зуксуан Ву са съумели да основат модел, който обърква ИИ-камерата, употребявайки същите способи за проба и неточност, употребявани при образованието на самата невронна мрежа. „ Ако просто опитате случайни модели, в никакъв случай няма да намерите изкривяващ образец ”, сподели той. „ Но в случай че имате достъп до системата, можете да намерите модел, който да я употребява ”. За да създадат суичъра, те почнали с модел, който изглеждал като случаен неподвижен десен. Заредили изображение на хора, покрили дребна част от изображението с модела и посочили резултата на невронна мрежа. Използвали логаритъм за актуализиране на модела, с цел да създадат невронната мрежа по-малко уверена, че вижда хора.

„ Не мога да ви кажа за какво този модел работи ”, сподели Голдщайн. Изследователите не могат да схванат по какъв начин тъкмо вижда машината. „ Това са доста комплицирани системи ”, сподели той. „ Те имат недостатъци, които се появяват при взаимоотношението сред наличните карти и изкуствените неврони. В тези невронни мрежи има странни и използваеми пътища, които евентуално не би трябвало да бъдат там ”.

Изкривяващите образци демонстрират, че основаното на надълбоко самообразование умни системи за видеонаблдение са толкоз положителни, колкото са положителни техните данни за образование. Въпреки напредъка в продуктивността на този жанр системи, ние към момента не разбираме и не направляваме по какъв начин CV системите взимат решения. „ Вие обучавате невронна мрежа на база входящи данни, които показват света по избран метод ”, сподели Голдщайн. „ Но един ден се появява нещо друго – положение на осветяване, което системата не е очаквала, или облекло, което не е очаквала. Важно е тези системи да са здрави и да не се провалят, когато се натъкнат на нещо, за което не са подготвени ”.

Самият Сийброк също облича суичер с шарки, сходни на този на Голщайн. Формата е малко по-различна. Пред камерата Сийброк също остава неусетен.

Самоетикирането

Входящите данни имат също толкоз огромно значение и, когато ИИ системите се учат да разпознават лицата. Всичко, което има две очи и вежди, нос, уста се рзпознава като лице. После тези облици се пресяват през по-рафинирана невронна мрежа с 68 значими точки, посредством които се разгадават даже страстта и погледът.

И, за разлика от пръстовия читател и шофьорската брошура, които са неповторими и се употребяват за различаване, лицето може да бъде снимано отдалеко и сканирано, а по-късно разпознато – без знанието и единодушието на индивида, дори без въобще да подозира. Може да се „ изкопаят ” данни и за възраст, пол, страст, а в случай че някъде сте се тагвали някъде – даже за различаване на идентичността.

Когато изискванията на снимане са „ сложни ” – с неприятна светлина, отражения и други – разпознаването е по-трудно. Но когато хората са разгласили качествени свои фотоси по уеб страници и обществени мрежи, разпознаването е доста елементарно.

Но това не е всичко. Ако държавното управление желае фотоси на жителите си в разнообразни пози, на разнообразни фонове, на закрито и навън, какъв брой хора биха подготвени да спомагат? Истината е, че ние към този момент сме построили голяма база данни за себе си, селфи по селфи. Онлайн изображенията на нас, нашите деца и наши другари, постоянно комфортно етикирани с имената ни, които сме разгласили на уеб сайтове за шерване на фотоси като Flickr, в обществените мрежи като Фейсбук и къде ли още не – са попаднали в набори от данни, употребявани за образование на системи за различаване на лица. И даже когато сякаш нашите изображения са предпазени в уеб сайтове като въпросните, то какъв брой тъкмо предпазени са те?

Грим и облекла за непрозрачност

Докъде може да стигне всичко това? Както и в други области, очевидци сме на неофициална конкуренция. Властите вкарват системи за видеонаблюдение под предлог, че се борят с престъпността и се грижата за сигурността на мирните жители.

В магазините системите за видеонаблюдение стават все по-популярни – за предотвратяване от обири. В огромните хипермаркети стартират да се появяват камери, предопределени за маркетингови цели. Те наблюдават какво пазари даден жител, с цел да му предложат артикули, които биха могли също да съставляват интерес. Много от тези системи се стремят даже наблюдават погледа на евентуалния покупател.

В някои елементи на света видеонаблюдението към този момент е навсякъде. В Китай, да вземем за пример, хората към този момент са привикнали с мисълта, че където и да се намират, някое изкуствено „ око ” ги следи. На това се базира и неотдавна въведената система за обществен рейтинг в страната.

От своя страна „ съпротивата също пораства. Различни дизайнери на облекла от разнообразни краища на света вършат облекла, чиито шарки да подвеждат системите за видеонаблюдение. Има и един гримьор, прочул се с опитите си да заблуждава камерите посредством елементарен, всекидневен грим. Наред с тях се развиват и „ сродните ” разработки. Сред тях са очила, които отблъскват IR лъчението на охранителните камери. По този метод системите за видеонаблюдение не могат да обхванат оттатък черните очила на хората. По този метод записите от камерите са сложни за разчитане, а личностите – сложни за различаване.

Разработват се и специфични калъфи за мобилни телефони, които имат за цел да блокират опциите за установяване на местонахождението на устройствата.

Съвсем неотдавна пък канадска компания се прочу със собствен „ стелт ” филм, който може да се употребява за. Материалът пречупва светлината по този начин, че забележими остават единствено обекти, които са доста близо или доста надалеч от окото – било то човешко или изкуствено.

И дизайнерите на облекла, и гримьорът от ден на ден премълчават какви са „ тайните ” на сполучливото мамене на камерите. Казват, че всеки собствен опит, който опишат обществено – да вземем за пример в уебсайт или блог – ще бъде употребен от инженерите, разработващи интелигентни системи за различаване, за възстановяване на логаритмите. Затова създателите са все по-лаконични за своите опити и „ формулата ” за заблуждаване на камерите. За сметка на това броят на експериментиращите пораства, пораства.
Източник: technews.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР