В момента по света се говорят около 6500-7000 различни езици.

...
В момента по света се говорят около 6500-7000 различни езици.
Коментари Харесай

Изкуствен интелект на MIT и Google превежда текстове от отдавна изгубени езици

В момента по света се приказват към 6500-7000 разнообразни езици. Това е по-малко то ¼ от всички езици, които хората са употребявали в историята. Общият им брой е към 31 000 езика, съгласно някои лингвистични калкулации.

Всеки път, когато даден език се изгуби, с него си отива част от метода на мислене, част от културата, връзките сред хората, поезията на този език и прочие. Какво ще се случи, в случай че можем да четем тези мъртви езици? Изследователи от MIT и Гугъл Brain са основали система, основана на изкуствен интелект, която може да го реализира.

Макар и езиците да се трансформират, доста от знаците, метода на класификация на думите и буквите, остават във времето. Благодарение на това, можем да опитаме да декодираме загубен език, в случай че установим връзка сред него и някой прочут език от предишното.
Това е линията, която Jiaming Luo, Regina Barzilay (MIT) и Yuan Cao (Google) следват
Посредством машинно образование пробват да дешифрират старогръцкия език Linear B и Угаритския клинопис.

Linear B е писмеността на микенския език (ранен старогръцки) и се употребява в интервала към 13 век пр.н.е. Предхожда гръцката писменост с няколко века и най-вероятно изчезва със залеза на микенската цивилизация. Сходна е с Linear A писмеността, която се употребява от минойците.

Угаритската книжовност поражда към 15 век.пр.н.е в Угарит. Появата на клинописа се обуславя на дейната търговия, с която се занимават локалните, с помощта на значимото си местонахождение.

През 1953 година, човек на име Michael Ventris съумява да разгадае Linear B, само че за първи път машина съумява да го направи чак в този момент.

Изследователите се концентрират върху 4 съществени фактора в подтекста и подредбата на знаците – сходство при систематизиране, монотонно картографиране на знаците, структурна оскъдица и доста подобие при припокриване.
Изкуственият разсъдък се образова да употребява тези свойства и съумява да преведе 67.3% от думите в Linear B, които имат подобен генезис, на гръцки.
Какво следва? Предимството на AI е, че може да прави неща, които са прекомерно изтощителни за хората. Например да вземе знаците, които желае да преведе от чужд език, и да ги тества по отношение на знаци от разнообразни езици. Ще минава от език на език, до момента в който не прегледа вероятната връзка с всичко, което човечеството познава до този миг.
Следващата стъпка за учените ще е да опитат дешифрирането на Linear A – древногръцкият език, който никой не е съумял да разгадае.
Повече информация за сегашния план може да откриете в оповестения труд „Neural Decipherment via Minimum-Cost Flow: from Ugaritic to Linear B“ като натиснете ТУК.
Източник: kaldata.com

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР