Meta пусна отворения модел с изкуствен интелект Massively Multilingual Speech

...
Meta пусна отворения модел с изкуствен интелект Massively Multilingual Speech
Коментари Харесай

Meta създаде отворен AI-модел с поддръжка на 4000 езика

Meta пусна отворения модел с изкуствен интелект Massively Multilingual Speech (MMS), който разпознава разговорна тирада на 4000 езика и ги възпроизвежда, т.е. преобразува текста в тирада на повече от 1100 езика.

Моделите за различаване на тирада и преобразуването на текст в тирада нормално включват образование за няколко хиляди часа аудиозаписи с текстова транскрипция. Но задачата става доста по-сложна за езиците, които не се употребяват в индустриалния свят – за тях изходните данни в обичайния формат просто не съществуват, споделят от Meta. Затова, компанията подходи изобретателно и се обърна към религиозните текстове – Библията и другите основополагащи книги са преведени на огромен брой езици и има доста обществено налични аудиозаписи, в които се четат тези текстове. Обучението на модела беше затруднено от обстоятелството, че аудиозаписите нямаха тъкмо текстово различаване, само че вследствие на това броят на поддържаните езици надвиши 4000.

Авторите на плана акцентират, че макар наличието на обучителните материали, моделът, подготвен върху тези текстове, няма пристрастия към набожен мироглед; няма пристрастия във връзка с пола, макар че по-голямата част от определените аудио-записи са прочетени от мъже. Проблемът с неналичието на текстово различаване в аудиозаписите беше преодолян от wav2vec 2.0 – още един Meta AI-модел, предопределен за „ образование на показаната тирада със самоконтрол “. Компанията предизвести, че резултатът може да не е съвършен – съществува риск моделът за превръщане на речта в текст да пояснява неправилно някои думи и изречения, а в други случаи подтекста на сходни неточности от време на време е афектиран. Но на процедура, споделят разработчиците, MMS демонстрира на половина по-малко неточности от съществуващите аналози, в това число и при модела OpenAI Whisper, и поддържа 11 пъти повече езици.

На процедура, планът ще даде на говорещите редки езици достъп до информация и софтуерни артикули – множеството от услугите на актуалните софтуерни колоси са лимитирани до набор от 100 езика и това положение на нещата се смята за недопустимо от Meta.

Източник: kaldata.com

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР