Microsoft създава AI, който без много усилия превръща текст в реч
Процесът на превръщане на текст в тирада става все по-точен и пълностоен, само че продължава да има един главен проблем - към момента се постанова изкуственият разсъдък (AI) да бъде подлаган на дълго образование, което коства и доста запаси, с цел да може той да възпроизведе натурален тон. Сега обаче, Microsoft и екип китайски откриватели оповестиха, че са достигнали до доста по-ефективен способ - текстово-разговорен AI, който може да генерира реалистична тирада, употребявайки единствено 200 гласови проби с обща дълготрайност към 20 минути и съответните транскрипции.

Системата разчита отчасти на така наречен “трансформатори”, дълбоки невронни мрежи, които жестоко емулират невроните в човешкия мозък. Трансформаторите мерят всеки вход и излаз в придвижване като синаптични връзки, като способстват за ефикасната обработката даже на дълги последователности от знаци - да речем, комплицирани фрази. Тази технология е комбинирана с съставен елемент за унищожаване на шума, което придава усъвършенствана функционалност на AI.
Очаквано, все още резултатите не са съвършени, защото звукът несъмнено е роботизиран, само че за сметка на това системата е извънредно точна в разбирането на думите - 99,84%. По-важното е, че тя може да направи процеса по превръщане на текста в тирада по-достъпен. Не е нужно да полагате доста старания, с цел да получите реалистични гласове, а това дава опция дребните компании, а даже и дилетанти да търсят нови провокации в сферата, от които да получат добавена стойност при своята работа.
Системата разчита отчасти на така наречен “трансформатори”, дълбоки невронни мрежи, които жестоко емулират невроните в човешкия мозък. Трансформаторите мерят всеки вход и излаз в придвижване като синаптични връзки, като способстват за ефикасната обработката даже на дълги последователности от знаци - да речем, комплицирани фрази. Тази технология е комбинирана с съставен елемент за унищожаване на шума, което придава усъвършенствана функционалност на AI.
Очаквано, все още резултатите не са съвършени, защото звукът несъмнено е роботизиран, само че за сметка на това системата е извънредно точна в разбирането на думите - 99,84%. По-важното е, че тя може да направи процеса по превръщане на текста в тирада по-достъпен. Не е нужно да полагате доста старания, с цел да получите реалистични гласове, а това дава опция дребните компании, а даже и дилетанти да търсят нови провокации в сферата, от които да получат добавена стойност при своята работа.
Източник: computerworld.bg
КОМЕНТАРИ




