Невронна мрежа пресъздава лицето на човек по гласа му
Пълен и прецизен портрет от дребен звуков запис към момента не е вероятен
Полът на човек се дефинира елементарно по гласа му (фото: CCO Public Domain)
Изследователи от Лабораторията по изкуствен интелект на Масачузетския софтуерен институт оповестяват за забавен опит. Те са обучили невронна мрежа да пресъздаде образа на лицето на човек от дребен звуков запис на речта му, излиза наяве от обява в arxiv.org.
още по тематиката
Полът на индивида се дефинира елементарно от гласа му. По-трудно, само че въпреки всичко допустимо е определянето на възрастта по гласа. Акцент в говора пък свидетелства за националността.
Останалите параметри в разбора не дават точни сходства и синтезираният „ портрет ” в последна сметка ще бъде много конвенционален.
Целта на откривателите е била да ревизират какъв брой информация за външния тип на човек може да се получи от характерностите на речта му. За да създадат това, те основали невронна мрежа за синтезиране на лицето от дребен аудио запис. За образование са употребявани видеоклипове на хора, които приказват в YouTube и други уеб запаси.
Оказва се в края на краищата, че компютърът към момента не е в положение да сътвори прецизен портрет на човек по гласа му. Системата вярно познава пола, само че възрастта рядко се дефинира по-точно от 10 години. Системата познава и етническата принадлежност, само че с огромна доза конвенционалност.
Полът на човек се дефинира елементарно по гласа му (фото: CCO Public Domain)
Изследователи от Лабораторията по изкуствен интелект на Масачузетския софтуерен институт оповестяват за забавен опит. Те са обучили невронна мрежа да пресъздаде образа на лицето на човек от дребен звуков запис на речта му, излиза наяве от обява в arxiv.org.
още по тематиката
Полът на индивида се дефинира елементарно от гласа му. По-трудно, само че въпреки всичко допустимо е определянето на възрастта по гласа. Акцент в говора пък свидетелства за националността.
Останалите параметри в разбора не дават точни сходства и синтезираният „ портрет ” в последна сметка ще бъде много конвенционален.
Целта на откривателите е била да ревизират какъв брой информация за външния тип на човек може да се получи от характерностите на речта му. За да създадат това, те основали невронна мрежа за синтезиране на лицето от дребен аудио запис. За образование са употребявани видеоклипове на хора, които приказват в YouTube и други уеб запаси.
Оказва се в края на краищата, че компютърът към момента не е в положение да сътвори прецизен портрет на човек по гласа му. Системата вярно познава пола, само че възрастта рядко се дефинира по-точно от 10 години. Системата познава и етническата принадлежност, само че с огромна доза конвенционалност.
Източник: technews.bg
КОМЕНТАРИ