Да накараш още един милиард души да са онлайн звучи

...
Да накараш още един милиард души да са онлайн звучи
Коментари Харесай

Цифровата пропаст всъщност е… езикова

Да накараш още един милиард души да са онлайн звучи като огромна работа, само че когато те се записват за първи път в мрежата, ще открият, че интернет няма какво да им предложи на родния език

Приблизително 5% от хората по света приказват британски у дома, само че към 50% от наличието в интернет е на британски (илюстрация: CCO Public Domain)

Около половината от популацията на света към момента няма достъп до интернет. Компании като Фейсбук, SpaceX и Amazon желаят да трансформират това. Те работят по стартирането на съзвездия от спътници в неб ето, които да излъчват интернет до всяка точка на Земята. Но даже и тези планове да са сполучливи, казусът с достъпа до интернет може би е не толкоз софтуерен. Има друга, по-съществена спънка пред превъзмогването на цифровото разделяне: езикът.

Хиляди разнообразни езици се приказват по света. Ала по-голямата част от наличието в мрежата е налична единствено на няколко определени езика, главно британски. Повече от 10% от Wikipedia е написана на британски език и съвсем половината от публикациите на уеб страницата са на европейски речи. Да накараш още един милиард души да са онлайн звучи като огромна работа, само че дано си представим какво ще стане, когато тези консуматори се записват за първи път – те ще открият, че интернет няма какво да им предложи на техния език.
още по тематиката
„ Приблизително 5% от хората по света приказват британски у дома ”, споделя Хуан Ортис Фроулър, член на Фондация „ Световна мрежа ”, представен от Wired. Въпреки това към 50% от наличието в интернет е на британски.

Проблемът с цифровата бездна не е в технологиите, споделя Кристен Чернешоф, шеф на организация Wikitongues, която предизвиква езиковото разнообразие. Корпорациите и държавните управления рядко дават ресурсите и поддръжката, нужни за $качването ” на по-малките езици онлайн.

За сходна обстановка има исторически аргументи. Повечето от най-големите онлайн платформи са основани в Съединени американски щати, в Силициевата котловина – и са развити най-вече като англоезични потребителски бази. Тъй като те се популяризират по света и на разнообразни езици, то другите езици постоянно са догонващи.

Но това догонване не е нищожно. Фейсбук, да вземем за пример, е обект на остри рецензии, че не употребява задоволително локални админи, с цел да следи наличието в страни, където има милиони консуматори. В Мианмар компанията от години има единствено шепа модератори, макар че така наречен тирада на омразата се разпространяваше бързо. По-късно Фейсбук призна, че не е направила задоволително, с цел да предотврати потреблението на платформата си за подбудителство към принуждение в страната.

Друга част от казуса произтича от обстоятелството, че на „ дребни ” езици са основани относително малко „ набори от данни ”, които да са подобаващи за образование на принадлежности за изкуствен интелект. Например, езикът синхала, който се приказва от към 17 милиона души в Шри Ланка и може да се написа по четири разнообразни метода, е предизвикателство. Алгоритмите на Фейсбук, подготвени най-вече на британски и редица европейски езици, не го „ картографират ” добре. Това прави мъчно ръководството на платформи под този език.

Ала езиковото разнообразие е освен това от деловитост, когато става дума за изложение, споделя Чернешоф. Шегите, страстите и изкуството постоянно са сложни, в случай че не и невъзможни за превеждане на различен език.

До някаква степен отговорът на казуса е в „ отворения код ”, наподобява. Mozilla е организация, работеща за натрупването на голям брой набори от езикови данни, които да могат да се употребяват от всеки разработчик гратис – като Common Voice, който – съгласно организацията – е „ най-разнообразният набор от гласови данни в света ”. Проектът е предопределен да даде на инженерите инструментите, от които се нуждаят, с цел да изградят неща като стратегии за преобразяване на говора в текст на разнообразни езици.

Марк Сурман, изпълнителен шеф на Mozilla Foundation, счита, че масивите от данни с отворен код като Common Voice са измежду дребното жизнеспособни способи за обезпечаване на повече езиково разнообразие в нововъзникващите софтуерни системи. В организациите с комерсиална цел – т.е. във компаниите – този проблем „ пада доста ниско в икономическата стълбица ”, споделя Сурман.

Привличането на повече езици онлайн може в последна сметка да се окаже „ упражнение по опазване на културата ”, а освен въпрос на ползваемост. И с цел да се реализира това, насърчаването на езиковото многообразие в интернет е нужно и ще изисква съгласувани старания от хора по целия свят.
Източник: technews.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР