© Надежда Чипева Интернет, подобно на Вселената, постоянно се разширява,

...
© Надежда Чипева Интернет, подобно на Вселената, постоянно се разширява,
Коментари Харесай

Интернет, какво ми казваш?

© Надежда Чипева Интернет, сходно на Вселената, непрекъснато се уголемява, освен това все по-бързо. От обществени мрежи до обичайни медии, през днешния ден всичко е ориентирано към към този момент клиширания израз " основаване на наличие ". Освен основаването му обаче все по-ключови стават разглеждането, структурирането и извличането на най-важното от него. И с огромният интерес разумно идват и опциите той да бъде претворен в просвета (data science) и в бизнес. Тук на сцената излизат компании като българската Identrics. Тя употребява изкуствен интелект, с цел да извлича познания от неструктуриран текст и казано най-накратко, да каже на бизнесите какво тъкмо споделя за тях интернет – или най-малко потребителите му.

" Ние събираме информация от обществени конгреси, тъй че да разберем какво се приказва за нашите клиенти в естествена среда ", споделя Владимир Петков, изпълнителен шеф на Identrics. " Интересът ни е към органичните диалози, а не към платени постове или акции, които явно не биха били представителни. За да схванат нашите клиенти какво се приказва за тях, би трябвало да бъдат прочетени милиони на брой документи. Ние автоматизираме този развой. "

Абонирайте се за Капитал Четете безкрайно и подкрепяте напъните ни да пишем по значимите тематики За 2018 година сдружението " Айдентрикс " има доходи от 267 хиляди лева и 43 хиляди лева облага. Потенциалът за напредък в бранша обаче е, меко казано, голям точно поради непрекъснато увеличаващото се количество информация, както и желанието на от ден на ден бизнеси да схванат какво в действителност се приказва за тях в мрежата.

Слуша интернет

Владимир Петков евентуално е по-известен като един от двамата водещи на подкаста " Говори интернет ", само че като изпълнителен шеф на Identrics той е по-заинтересован не да приказва, а да слуша какво се случва в интернет. Управляваната от него компания най-често работи за три вида клиенти: снабдители на бизнес информация, компании за медийно разузнаване и такива за бизнес разузнаване, които употребяват услугите на компании за разбор на огромни данни, с цел да схванат, когато има подозрения за измами като пране на пари или други бизнес опасности. Съответно Identrics постоянно работи за клиенти на клиенти.

" Задачите пред нас постоянно са относително тривиални: да вземем за пример да намериш нещо съответно в три милиона документа, което в действителност е дребен набор от информация. От тези милиони документи или изявления ние посредством изкуствен интелект откриваме какъв брой % са по една тематика, какъв брой по друга, в какъв брой % се загатва обещано име или артикул ", споделя Петков.

В момента в компанията работят малко над 10 души, само че даже и този брой не е елементарен за намиране в този бранш в България. " Над половината хора, които работят за нас, са приключили в чужбина и са се върнали в страната. Стажантите, които сме имали до момента, пък са напълно приключили отвън България ", споделя Васил Шивачев, действен шеф в компанията. " Потенциалът обаче е огромен, тъй като експертите в страната са на доста високо равнище, а този вид бизнес дава опция да се печелят клиенти отвред по света. "

Основно от чужбина идват и клиентите на компанията. Това е елементарно обяснимо: българската част на интернет просто не създава толкоз доста информация дневно, с цел да се постанова потреблението на сходен вид услуги от страна на българските компании и марки. " Обикновено компании, които имат проблем с автоматизацията на събиране на данни, са огромни като размер и имат цели екипи, които се занимават с този вид провокации ", споделя Петков. Заради естеството на работа, въпреки да става дума за добиване на информация от обществени конгреси и уеб сайтове, клиентите на компанията избират да са анонимни.

Кога си заслужава да учиш машината

Компаниите като Identrics, казано най-общо, образоват машини, тъй че те да могат да " виждат " и да вземат решения, основани на неструктуриран текст, което в интернет се равнява на натурален диалог. Алгоритмите на Identrics да вземем за пример работят с най-простата канара – положително, отрицателно и неутрално. " Ако се наложи, има и канара със 7 степени ", споделя Петков. " Въпросът е къде има смисъл изобщо да се употребява машина. Наскоро при нас да вземем за пример пристигна клиент с 18 хиляди документа, на който казахме, че е по-добре да не се образова машина с толкоз дребен набор от информация. "

Едно от най-големите провокации, освен пред Identrics, само че и пред целият световен теоретичен и бизнес бранш, обвързван с науката за данни, е по какъв начин една машина да бъде подготвена по този начин, че да може да пресъздаде един текст не като папагал, а с действителен разсъдък. " Въпросът е по какъв начин да дадем на една машина книга, която тя по-късно да обобщи. Това е и казусът с максимален капацитет за бизнес напредък ", споделя Петков. Подобно решение да вземем за пример може да се употребява от медии, които вършат свои бюлетини и се пробват да не нарушават авторски права, до момента в който го вършат.

" Тази задача е сложна, тъй като значи да бъде основан изкуствен интелект, който мисли като човек, посредством аналогии. Има доста опити в тази сфера, само че казусът остава неуреден. Ние влагаме в тази посока ", прибавя Петков. Друга тенденция, в която влага Identrics, е разпознаването на избрани именувани обекти и хора в неструктуриран текст. " Ако става дума за съответен човек, логаритъмът да може да го открие в текст и да свърже името му с Wikipedia да вземем за пример. "

Целта обаче е постижима. Вече съществуват научни писания, които потвърждават, че сходно равнище на изкуствен интелект е допустимо в обозримото бъдеще. Проблемът обаче не е единствено в това да се доближи до задоволително огромен брой данни, както и да се напише задоволително добър код, а и в това решението да бъде задоволително бързо и стопански дейно. Такъв няма да бъде казусът да вземем за пример, в случай че за сходно решение се изисква силата на суперкомпютър, тъй като то ще доближава до мощно стеснен брой бизнеси и хора.

Данните в бъдеще

Identrics има познати проблеми в българската IT промишленост и най-общо казано, пазар на труда - неналичието на хора. " В България сигурно няма задоволително добър източник на гении, когато става дума за науката на данни. Хората, които работят това в България, най-често го вършат в научни центрове като Българска академия на науките, споделя Шивачев. Затова се постанова да залагаме доста на развиването на хората в самата компания. Много постоянно се постанова да вземем човек, който в допълнение да бъде подготвен, само че това има и плюс, тъй като притегля хората и ги задържа при нас. "

Въпросът по какъв начин би трябвало да наподобява и къде би трябвало да бъде Identrics даже след три години е сложен за Петков и Шивачев. " След три години Identrics би трябвало да бъде най-малко 10 пъти по-голяма като оборот, или най-малко за това работя аз като изпълнителен шеф, споделя Петков. Ако ние решим огромните проблеми пред нас и промишлеността, ще успеем да го създадем. "

Петков обаче не харесва сходни погледи в бъдещето, тъй като до момента опитът му постоянно е показвал, че изключително във връзка с технологиите, те доста рядко се оказват правилни. Или, казано в резюме и на езика на науката за данни, сега няма задоволително информация, с цел да бъде направена точна прогноза.

Изцяло ваша ли е технологията?

ВП: Ние постоянно стъпваме върху раменете на колоси. Това са научни центрове, които са създали пробив и са го популяризирали като свободен програмен продукт, или огромни корпорации, които правят проучвания в тази област. Много постоянно техните платформи за невронни мрежи се популяризират под свободен лиценз. В подобен смисъл ние сме и компания, която взема решение и казуса да интегрира решения от разнообразни снабдители – университети и компании да вземем за пример – тъй че да обучим машините да вземат решения.

Колко е огромно търсенето на вашите решения?

Висша школа („Георги Димитров" 1952-1969 г.): Хоризонтът пред Identrics е малко или доста необхватен. Голяма част от фирмите имат потребност от сходни услуги. Друга огромна част от бизнеса скоро ще осъзнае, че също има потребност от такива услуги, тъй като информацията в интернет става все по-ценна и нараства във всеки един миг.
Източник: capital.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР