Изкуствен интелект, роботи и други напреднали технологии гастролираха на форум

...
Изкуствен интелект, роботи и други напреднали технологии гастролираха на форум
Коментари Харесай

Как Fujitsu вдигна летвата при частните GPT


Изкуствен разсъдък, роботи и други напреднали технологии гастролираха на конгрес на Fugitsu в София, част от европейско роудшоу на компанията (снимка: Мария Малцева / TechNews.bg)

Fujitsu фрапантно подвигна равнището на предизвикването при създаване на частни GPT решения, предлагайки новаторски модел, който заобикаля така наречен „ халюцинации “ и персонализира отговорите си според от това с кого „ си приказва “. Технологията извежда на ново равнище развиването на вътрешнофирмените езикови модели, като в същото време покачва и критериите за сигурност в организацията, стана ясно по време на Fujitsu Forum 2024 в София, част от едноименното европейско роудшоу на компанията.

Частните езикови модели съставляват по-малък „ брат “ на известните езикови модели като ChatGPT, Gemini и Claude, които се внедряват инсталационно в дадена организация, с цел да обслужват нейните клиенти или да оказват помощ на личните й чиновници в ежедневната им работа с потребителите. Традиционно частният GPT се образова върху лични данни на самата компания-ползвател. Това може да са наръчници, продуктови описания, сервизни случаи (т. нар. „ билети “), история на компанията и други

Едно от преимуществата на метода е основаването на „ персонализиран “ GPT на компанията. Той се „ специализира “ в нейната сфера на активност, личните ѝ артикули и услуги, характерна терминология, списъки и други Друг фактор е намаляването на риска от „ приключване “ на фирмена информация към световното осведомително море.

Fujitsu е създала лична система за създаване на частни GPT, прекомерно друга от всичко познато на пазара. Както и при други сходни оферти, системата се оформя като вътрешно-инсталационно решение в организацията (on-premise). Платформата обаче надскача обичайните недостатъци и ограничавания на типичния „ вътрешен “ езиков модел. Тя преодолява казуса с „ халюцинациите “ и защищава от хакерски атаки.

Сигурност от корпоративен клас

Преравяйки вътрешната документи на организацията, с която е захранен, този GPT формулира лични отговори, напълно „ със свои думи “, без да следва схемите на статистически най-вероятната поредност от думи. В края на всеки собствен отговор чатботът цитира своите източници: документи и онлайн запаси.

Fujitsu GPT може да се свързва с Active Directory или LDAP услуга, употребена в организацията, и на тази база да „ персонализира “ отговора си според от това кой е отправил запитването и какви права има той да узнае дадена информация. По този метод логаритъмът „ се преценява “ със събеседника си. Всеки запитващ ще получи отговор, който не разкрива повече, в сравнение с е разрешено да узнае съгласно осведомителната политика на организацията.

Наред с тези достижения езиковият модел е направен по този начин, че да може да разпознава фишинг-адреси и да ги отстрани в връзката си с индивида. Това доста покачва равнището на сигурност и за организацията-потребител, и за нейните клиенти. Разпознаването на фишинг-адреси цели повишение на надеждността на „ разговорните “ AI модели.

Удо Вюрц, основен шеф по данните във Fujitsu, показа разработка на компанията за създаване на частни GPT, които заобикалят така наречен “халюцинации ”
(снимка: Мария Малцева / TechNews.bg)

Технологията е разработка на „ лабораторията “ на Fujitsu в университета Бен Гурион в Израел. Системата разпоззнава URL адреси към фишинг-сайтове, които може да са „ вградени “ диалозите за офанзива вид „ отравяне на данните “ т.е. инжектиране на подправена информация в основополагащия набор данни.

Без повече халюцинации

Едно от най-големите достижения на Fujitsu GPT е това, че преодолява казуса с така наречен халюцинации. Става дума за феномена, при който езиковият модел отговоря с безапелационен и убеден звук, поднасяйки изцяло погрешна информация.

„ Избягването на халюцинациите е мъчно. Обичайно генеративният AI се стреми непременно да ви даде отговор “, сподели Удо Вюрц, основен шеф по данните във Fujitsu. „ Ако ChatGPT ви даде верен отговор на въпрос, само че вие го контрирате, че изказванието му не е правилно, най-вероятно той ще ви се извини и отсега нататък ще ви дава отговора, който вие му посочите за правилен – даже да е неверен по своята същина ”.

„ Това, което ние вършим, е да направляваме размера на токените, които сътворяваме при образованието на езиковия модел, и резултата, който получаваме. Така е, тъй като установихме, че в тъкмо избран миг, когато е налице характерен размер информация, обезпечена от AI, отговорът се оказва илюзия “, добави Вюрц.

Този метод, съгласно него, има и своята „ противоположна страна на монетата “. „ Може да се окаже проблем, че някои отговори не са задоволително дълги: не включват всичкото належащо наличие. Трябва да се балансира сред това какъв брой дълъг отговор следва да даде системата и кой да е той, в случай че няма задоволително информация “, изясни Вюрц.

„ Ако няма задоволително информация, нашият GPT не дава информация. Какво значи това? Ако зададете въпрос на бота, само че данните са незадоволителни, то системата ще ви отвърне нещо като „ Имам концепция, само че не разполагам с задоволително информация, с цел да ви дам правилен отговор, по тази причина апелирам да предоставите повече информация, върху която да се обуча “, раказа специалистът по данни.

Рафиниране на данните през преобучаване

Важна специфичност на Fujitsu GPT е и, че от неговия информативен „ списък “ могат да се изтриват документи – източници на данните, на които чатботът базира отговорите си – без това да постанова ново образование и трениране на езиковия модел. От компанията са създали смяната по този начин, че премахването на документ от „ мозъка “ на езиковия модел да става с един клик.

За задачата Fujitsu базира своя всекидневен AI на векторна база данни. „ Ако би трябвало да изтриете нещо, върху което GPT е подготвен, вие първо ще видите лист с всички документи и други типове източници. Ще изберете ненужния и ще го изтриете. Тогава системата ще изтрие всички съответни редове във векторната база данни. Няма потребност от наново трениране на логаритъма. И всичко става за секунди, “ сподели Удо Вюрц.

Освен да приказва посредством текст, чатботът на Fujtitsu може да „ гледа “ изображения и да схваща какво е изобразено на тях. Така той обогатява базата от източници, на които разчита. За организацията-потребител това значи, че тя може да образова своя GPT със свои графики и да зарежда неговата база данни със познание от сканирани изображения.

Тестването – в затворена среда

За организациите, които биха желали да тестват опциите на този нов GPT, Fujitsu е подготвила тестово оборудване, конфигурирано за потребителите от района на Европейски Съюз – поради условията на европейските правила за цялост на данните. Локалните сътрудници на компанията дават достъп до системата, с стремежи брой консуматори и независима „ инстанция “.

„ Тя е единствено за вас. Можете да си „ играете “ с нея, да качите документи, за питате и да изпробвате по какъв начин ще дава отговор, да триете “, изясни Вюрц. „ Данните са изолирани от тези на другите консуматори. Това не е облачно решение, сходно на ASW или Azure. То е напълно затворена, изолирана среда единствено за нашите консуматори “.
Източник: technews.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР