Невронните мрежи са способни да чуят дори нечуваемата реч на

...
Невронните мрежи са способни да чуят дори нечуваемата реч на
Коментари Харесай

Невронна мрежа „чува” какво говорят хората „на себе си”


Невронните мрежи са способни да чуят даже „ нечуваемата ” тирада на индивида
(снимка: arxiv.org/University of California, Berkeley)

Американски учени създадоха система, която разпознава тихата тирада и я трансформира в звукова, употребявайки невронна мрежа. В бъдеще системата може да се употребява за основаване на слушалки, които разрешават на хората да приказват по телефона, без да издават никакви звуци.
още по тематиката
Въпреки че, когато приказваме на „ себе си ”, не изричаме и не издаваме никакви звуци, мозъкът въпреки всичко принуждава мускулите на гласовия тракт да се движат, въпреки и доста по-малко, в сравнение с при „ естествена ” тирада – този развой се назовава субвокализация. Инженерите могат да разчитат мускулните контракции по разнообразни способи – основно благодарение на електромиография (EMI), която записва електрическата интензивност на мускулите благодарение на електроди, сложени на врата и лицето.

Съществуващите интерфейси за различаване на субвокализации могат да преобразуват безмълвна тирада единствено в текст, само че учените от Калифорнийския университет в Бъркли са логаритъм, който е кадърен да „ озвучава ” мускулни контракции. Той е подготвен на три типа данни – записи на звукова тирада и мускулна интензивност по време на звукова и нечуваема тирада.

Алгоритъмът регистрира три сигнала – две електромиограми и звукова тирада. На първия стадий той намира оптимално сходство сред два сигнала – звукова и нечуваема тирада, а на втория, употребявайки получените данни, основава аудиозапис на тирада от електромиограма, т.е. нечуваема тирада от аудиозапис на звукова тирада. Такъв логаритъм е нужен за, която прави същото, като приема не три типа сигнали като вход, а единствено един – електромиограма на нечуваема тирада.

Учените са употребявали невронна мрежа с краткосрочна памет, като получените данни от нея са излъчени на невронна мрежа, която ги декодира в аудио запис на човешки глас. За образование е употребен 20 часа запис на звукова и нечуваема тирада, показан под формата на три типа данни. След образованието разработчиците проверявали разбираемостта на.

Като метрика учените са употребявали общоприетата възможност за неточност – сумата от изменени, изчезнали и спомагателни думи, разграничена на общата дължина на текста. За елементарни изречения като дати и други цифри вероятността за неточност на пълноценна невронна мрежа е 3,6, а за такава, която се образова единствено в звукова тирада, е 88,8. За комплицирани изречения като фрагменти от книги разликата не е толкоз огромна: 74,8 до 95,1 при инспекция от човек и 68 до 91,2 при инспекция от системата за различаване на тирада.
Източник: technews.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР