Най-мощният публично достъпен AI езиков модел за разпознаване и генериране

...
Най-мощният публично достъпен AI езиков модел за разпознаване и генериране
Коментари Харесай

Компанията на Зукърбърг пусна AI, който разпознава и говори на хиляди езици

Най-мощният обществено наличен AI езиков модел за различаване и генериране на тирада идва от компанията майка на Фейсбук. Meta оповестиха, че вършат обществено наличен кодът и авансово тренираните бази на плана Massively Multilingual Speech (MMS).

Характеристиките му са впечатляващи: трансформира тирада на над 4000 езика в текст, а написаното на други над 1000 може да изговори.
 IBM заменя 7800 чиновници с изкуствен интелект (AI)
Технологичният колос, който заменя хиляди чиновници с изкуствен интелект

Компанията ще приключи краткотрайно наемането на нови чиновници

Контекст : В момента множеството AI платформи поддържат не повече от 100 от най-популярните езици по света. За по-слабо употребяваните по-трудно се систематизира масив от данни, върху който да се " обучат " логаритмите. Затова и да вземем за пример качеството на компютърната тирада на британски звучи релативно правдоподобно, до момента в който тази на български в най-хубавия случай е със мощен акцент и съществени неточности в произношението.

В свят, в който въпреки и постепенно настъпват VR/AR технологиите това не е задоволително.
 Развитието на изкуствения разсъдък може да остави 300 милиона души без работа: ето кои специалности са застрашени
Развитието на изкуствения разсъдък може да остави 300 милиона души без работа: ето кои специалности са застрашени

Прогнозата е от нов отчет на Goldman Sachs

Детайли : За да получат сходна изходна информация на голям брой езици, от Meta се обръщат към нетрадиционен на пръв взор източник - религиозните текстове. Библията е преведена на голямата част от езиците по света, като наличието е сходно. Това прави Светото писание изключително подобаващ инструмент в AI проучванията.

" В рамките на плана MMS направихме масив с Новия Завет, прочетен на над 1100 езика, което прави приблизително по 32 часа аудио за всеки език ", изясняват от изследователския екип на компанията.
 Кои компании ще завоюват (или загубят) от въвеждането на изкуствен интелект?
Кои компании ще завоюват (или загубят) от въвеждането на изкуствен интелект?

А какво е ситуацията при снабдители на " облачни " AI услуги

С прибавянето на други християнски текстове и немаркирани данни реализират идентификацията на над 4000 говорими езика - 40 пъти повече спрямо предходните разработки. Една от приятните изненади е, че, въпреки текстовете да са четени най-вече от мъже, изкуственият разсъдък се оправя също толкоз добре и с женските гласове.

Още нещо : MMS към този момент премери сили с Whisper на компанията OpenAI, като резултатите са доста положителни - на половина по-малко неточности, освен това с 11 пъти повече поддържани езици.
 FTC: Meta не трябва да печели от данните на децата
FTC: Империята на Зукърбърг не трябва да печели от данните на децата

Компанията към този момент заплати 5 милиарда $ поради злоупотреби с персоналната информация

Какво следва : От Meta ще продължат да работят по MMS, като новата им цел е да прибавят и разнообразни диалекти.

Ако желаете да тествате модела, можете да свалите нужното от GitHub, само че са нужни немалки механически знания (и мощен хардуер), с цел да го накарате да проработи.
Източник: money.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР