Meta пусна AI, който превежда текст на сто езика
Meta пусна модела с изкуствен интелект SeamlessM4T, кадърен да превежда от 101 езика. Проектът е стъпка към основаването на повсеместен преводач в действително време, който може да обработва говоримия език, до момента в който споделяме.
Традиционните AI модели за превод работят по многоетапен метод: първо говоримият език се преобразува в текст, след което се превежда на различен език и текстът на новия език се преобразува назад в говорима тирада. Този способ не постоянно е задоволително ефикасен, защото на всеки стадий има опция за неточности, които могат да доведат до погрешен резултат от превода. Новият Meta SeamlessM4T превежда непосредствено и се споделя, че е 23% по-точен от най-хубавите настоящи модели. Арсеналът на Гугъл включва модела AudioPaLM, който поддържа 113 езика, само че превежда единствено на английски; SeamlessM4T превежда от 101 езика на 36.
Ключът към триумфа на плана беше процесът на редом събиране на данни: AI записва случаите в сканираните данни на източници в мрежата, които подхождат на аудио или видео със надписи на различен език. В резултат на това моделът се е научил да свързва тези звуци на един език със съответните фрагменти от текст на различен. Авторите на плана обаче признават, че човешкото присъединяване в превода остава значимо: човек е в положение да вземе поради културния подтекст и да подсигурява прехвърлянето на смисъла на изказването от един език на различен. В медицината или правото машинният превод би трябвало да бъде деликатно тестван от човек, в противоположен случай може да зародят недоразумения.
Трябва също по този начин да се вземе поради, че AI моделите може да имат разнообразни количества данни за образование на обособените езици: може да има доста образци за превод от гръцки на британски, само че няма данни за превод от суахили на гръцки. За да решат този проблем, разработчиците на SeamlessM4T авансово са обучили модела на милиони часове аудиозаписи на диалози на разнообразни езици. Това образование е помогнало на AI да разпознае общите модели в езиците, което улеснява обработката на по-рядко срещаните езици, защото моделът към този момент има главните знания за това по какъв начин би трябвало да звучи говоримият език в тях.
Системата е налична като отворен код, което е вярата на разработчиците за поощряване на останалите да надграждат актуалните ѝ благоприятни условия. Някои специалисти към момента се съмняват какъв брой потребен може да бъде SeamlessM4T на процедура и показват, че затвореният модел на Гугъл е доста по-бърз. Meta твърди, че експертите на компанията към този момент са основали по-нова версия на Seamless, която не отстъпва по скорост на хората преводачи.




