38 годишната Чела Робълс трудно може да разбере кога баща

...
38 годишната Чела Робълс трудно може да разбере кога баща
Коментари Харесай

AI може да промени начина, по който слепите хора „виждат“ света

38 годишната Чела Робълс мъчно може да разбере по кое време татко ѝ се майтапи, и по кое време е сериозен. И в двата случая той приказва с един звук и тъй като тя не вижда, няма по какъв начин да разчете дали се майтапи по изражението на лицето му.     Слепотата, споделя тя за Wired, ви лишава от дребни елементи, които оказват помощ на хората да се свържат между тях. “Ако една картина може да каже 1000 думи, представете си какъв брой думи може да каже едно изражение на лицето “, прибавя Чела, която губи зрението си преди 10 години.    Преди три месеца тя се записва за експериментален интервал за Ask Envision, AI помощник, употребяващ технологията на GPT-4 на OpenAI, който може да приема изображения и текст и да генерира гласови отговори. Системата е един от няколкото помощни продукта за хората с повредено зрение, обещаваща да даде на потребителите доста повече образни детайлности за света към тях и доста повече самостоятелност.   Envision започва като приложение за смарт телефон за оптично различаване на знаци (OCR) през 2018 година, а при започване на 2021 година продуктът е интегриран в Гугъл Glass.    По-рано тази година компанията стартира да тества всекидневен модел с отворен код, който може да отговори на съществени въпроси. Тогава Envision включва GPT-4 на OpenAI за описания от изображение към текст.     Be My Eyes, 12-годишно приложение, което оказва помощ на потребителите да разпознават обекти към тях, интегрира GPT-4 през март. Microsoft – който е главен вложител в OpenAI – стартира проби за консолидиране на GPT-4 за своята услуга SeeingAI, която предлага сходни функционалности, съгласно виновния началник на Microsoft AI Сара Бърд.   В най-новата си версия Ask Envision към този момент може да вземем за пример да чете меню и да дава отговор на въпроси, свързани с цени, диетични индикатори и варианти за десерти, показва Wired.   Ричард Биърдсли, който също е тествал Ask Envision по-рано, споделя, че е употребявал услугата, с цел да получи информация за съставките, написани върху опаковка на храна да вземем за пример. Наличието на хендсфри алтернатива посредством Гугъл Glass значи, че той може да употребява приложението, до момента в който държи каишката на своето куче лидер и бастуна си.      Интегрирането на AI в продуктите за незрящи може да има надълбоко влияние върху потребителите, споделя Сина Бахрам, също незрящ. Той се занимава с компютърни науки и управлява консултантска компания, която поучава музеи, тематични паркове и софтуерни компании като Гугъл и Microsoft по отношение на достъпността и включването на хора с повредено зрение.   Бахрам употребява Be My Eyes с GPT-4 и споделя, че огромният езиков модел усъвършенства технологиите за хора като него, тъй като продуктите могат да се употребяват без изпитание и не изискват механически умения. Преди две седмици, споделя той, по време на разходка по улица в Ню Йорк бизнес сътрудникът му спрял, с цел да прегледа нещо по-отблизо. Бахрам употребявал Be My Eyes с GPT-4, с цел да научи, че това е сбирка от стикери, някои карикатури, плюс малко текст и графити.   Това равнище на информация е „ нещо, което не съществуваше преди година отвън лабораторията “, споделя той. „ Просто не беше допустимо. “     Дана Гурари, помощник професор по компютърни науки в Университета на Колорадо в Боулдър, провежда годишния семинар Viz Wiz, с цел да събира на едно място компании като Envision с откриватели на AI и незрящи консуматори на технологии. Когато Viz Wiz започва през 2018 година, единствено четири екипа вземат участие в семинара. Тази година са се записали над 50.   Целта на Гурари е AI инструментите да бъдат правилно внедрени в продуктите за незрящи и да е ясно, че те към момента не са съвършени.    При ранно тестване на някои модели за превръщане на изображение в текст Гурари открива, че AI инструментите могат да си измислят информация или да „ халюцинират “. „ Повечето от това, на което можете да се доверите, са единствено обектите от високо равнище, като „ Виждам кола, виждам човек, виждам дърво “, споделя тя. Според нея потребителят мъчно може да се довери на по-сложен вид желана информация, да вземем за пример какво има в сандвича му.   „ Наистина е фантастично незрящи хора да получават потребна информация. Проблемът е, когато вземат решения въз основа на подправена информация, която може да остави неприятен усет в устата им “, споделя тя.   Може да има и животозастрашаващи последствия, в случай че изкуствен интелект разпознава обещано лекарство неправилно.     Използването на обещаващи, само че не и усъвършенствани огромни езикови модели, които да оказват помощ на слепите хора да „ виждат “ света, също по този начин може да ги изложи на отрицателната наклонност AI да разпознава неправилно възрастта, расата и пола на хората. Известно е, че наборите от данни, употребявани за образование на AI, са изкривени и пристрастни, закодирали предубеждения и неточности.    Бахрам признава, че това са опасности и предлага системите да дават на потребителите оценка на доверието, тъй че те да могат да вземат по-информирани решения по отношение на това, което AI счита, че вижда.    Технологиите не могат да дадат на слепите главните умения за напредване, от които се нуждаят, с цел да бъдат самостоятелни, само че хората, тествали Ask Envision, са впечатлени от досегашните функционалности на системата. Има ограничавания, несъмнено. Чела Робълс, която свири на тромпет, би желала инструментът да може да чете музика, както и да дава повече тримерен подтекст - къде е човек или обект в стаята, както и повече елементи.   „ Би било в действителност ужасно да знам с какво е облечен даден човек да вземем за пример. Всеки дребен подробност оказва помощ да получиш по-добро изложение за света към себе си. “
Източник: profit.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР