Африка е дом на повече от една четвърт от езиците

...
Африка е дом на повече от една четвърт от езиците
Коментари Харесай

Изгубени в превода: Африка срещу езиковата бариера на изкуствения интелект

Африка е дом на повече от една четвърт от езиците в света, само че множеството от тях отсъстват в развиването на изкуствения разсъдък. Причините за това са ясни – липса на вложения и налични данни.

Инструментите за изкуствен интелект, които през днешния ден използваме, в това число и най-популярните модели като ChatGPT, се образоват основно върху британски, европейски и китайски езици – поради преимуществото на големи масиви от текстове, които могат да бъдат открити онлайн. Африканските езици обаче най-вече се популяризират устно, а неналичието на писмен корпус автоматизирано значи, че милиони хора остават отвън цифровата гражданска война.

„ Ние мислим на нашите лични езици, сънуваме на тях и посредством тях разбираме света. Ако технологиите не го отразяват, цели групи от хора рискуват да останат в изолираност от софтуерната гражданска война “, споделя проф. Вукоси Маривате от Университета в Претория, който работи по разрешаването на този проблем, пред BBC.

Наскоро екип от откриватели показа най-големия досега набор от данни на африкански езици. Проектът носи името Africa Next Voices и е финансиран с 2,2 млн. $ от фондация Gates. Той сплоти лингвисти и компютърни учени, с цел да сътвори AI-бази на 18 африкански езика.

В рамките на две години са записани 9 000 часа тирада в Кения, Нигерия и Южна Африка, в действителни обстановки, свързани със земеделие, здраве и обучение.

Сред включените езици са кикуйо и дхолуо в Кения, хауса и йоруба в Нигерия, както и зулу и тшивенда в Южна Африка – някои от тях се приказват от милиони хора. „ Това е основа, върху която може да се надгражда, и хората да прибавят свои нововъведения “, изяснява проф. Маривате, управлявал проучването в Южна Африка.

Кенийската лингвистка Лилиан Уанзаре акцентира, че задачата е била данните да отразяват действителния метод, по който хората приказват и живеят.

„ Събрахме гласове от разнообразни райони, възрасти и обществени среди, с цел да бъде допустимо най-обширно. Големите софтуерни компании не постоянно виждат тези проблеми по метода, по който ние ги виждаме “, споделя тя.

Данните ще бъдат с отворен достъп, което ще разреши на разработчиците да построяват принадлежности за превод, транскрипция и взаимоотношение на африкански езици.

Пример за изгодите към този момент съществува. Южноафриканската фермерка Келебогиле Мосиме ръководи 21 хектара зеленчуци в Рюстенбург и употребява приложението AI-Farmer, което разпознава локални езици като сесото, зулу и африкаанс.

„ Като човек, който занапред се учи да бъде фермер, се сблъсквам с голям брой провокации. Всеки ден виждам изгодата от това да употребявам родния си език сетсвана в приложението. Когато имам проблеми, запитвам и получавам потребни отговори – от информация за това по какъв начин да управлявам вредители до диагностика на заболели растения “, споделя тя.

Южноафриканският стартъп Lelapa AI също създава решения за банки и телекоми.

„ Английският е езикът на опциите. За доста южноафриканци, които не го приказват, това е доста повече от стеснение, тъй като значи пропуски в достъпа до здравни услуги, банкиране или даже поддръжка от страната “, споделя изпълнителният шеф Пелономи Мойлоа. „ Езикът може да бъде голяма преграда. Ние споделяме, че не би трябвало да се случва по този метод. “

За проф. Маривате самодейностите надалеч надвишават бизнеса и удобството: „ Езикът е достъп до въображение. Това не са просто думи – тук става въпрос за история, просвета, познания. Ако локалните езици не са включени, губим доста повече от данни – губим способи да виждаме и разбираме света. “
Източник: profit.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР