Mozilla анонсира новата система за синтез на човешка реч LPCNet.

...
Mozilla анонсира новата система за синтез на човешка реч LPCNet.
Коментари Харесай

Mozilla представи системата за синтез на човешка реч LPCNet

Mozilla анонсира новата система за синтез на човешка тирада LPCNet . Тя обезпечава доста по-ефективен синтез на речта с помощта на удачното съчетание на обичайните способи за цифрова обработка на сигналите (DSP) с логаритми за машинно образование. Сорс кодовете на LPCNet се популяризират под BSD лиценза.

Въпреки че актуалните модели за синтез на речта с невронни мрежи, като да вземем за пример WaveNet, показват великолепно качество на синтез, тяхната реализация е прекомерно комплицирана и изисква огромна изчислителна мощ. Тази специфичност затруднява потреблението на сходни системи за синтез на човешка тирада в мобилните устройства, като да вземем за пример смарт телефоните.



Главната специфичност на LPCNet е, че вместо всичко да минава през невронната мрежа, се прави почти прогнозиране на идващия тон, още веднъж посредством невронна мрежа. По този метод доста се понижават размерът на невронната мрежа и нужните за нейната работа запаси. При този метод невронната мрежа не се занимава с моделирането на вокалния тракт а единствено поправя проблемите при прогнозирането.

LPCNet може да се употребява и в други области, в които е належащо повишение качеството на гласовия сигнал. LPCNet е доста подобаваща за основаването на нови технологии за компресия на речта, като съответният кодек към този момент се създава.

Сорс кодът на LPCNet е написан на C с потреблението на Keras – известният фреймуърк за невронни мрежи.
Източник: kaldata.com


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР