Изкуствен интелект на LG разбира и описва обекти или сцени(снимка:

...
Изкуствен интелект на LG разбира и описва обекти или сцени(снимка:
Коментари Харесай

Невронна мрежа на LG създава текстови описания на изображения


Изкуствен разсъдък на LG „ схваща ” и разказва обекти или подиуми
(снимка: CC0 Public Domain)

Подразделение на LG създаде система с генеративен изкуствен интелект Captioning AI, която може да разпознава детайли от изображения и да основава описания и основни думи за тях. Подобна технология ще е потребна при образуване на бази данни с изображения на огромни компании.

Представители на LG AI Research разкриха новата система по време на най-голямата в света конференция за компютърно зрение – „ Computer Vision and Pattern Recognition 2023 ”, извършена в неделя във Ванкувър, Канада. Решението се базира на технологията Zero-shot Image Captioning, създадена от изследователския екип на LG, която разрешава на изкуствения разсъдък да „ схваща ” и разказва обекти или подиуми.

Невронната мрежа на LG прави оценка за първи път дадени обекти без спомагателни подкани, въз основа на своя предходен опит – тъкмо като хората. Компанията изясни, че технологията е друга от AI услуги като Midjourney, в които всичко се случва тъкмо противоположното – потребителите вкарват текст или качват картина, въз основата на която AI генерира лично създание.

Създаването на „ надписи ” за фотоси може да наподобява много елементарно, защото концепцията не е нова. AI технологията обаче доближи последващо равнище. Например, изкуственият разсъдък в действителност може да направи заключения и да опише това, което в никакъв случай преди не е „ виждал ” – като гледа пейзаж или човек и схваща кое е мястото.
още по темата
Технологията на LG разрешава на невронната мрежа да разпознае фона, героите и даже интензивността в изображението и да опишете взаимоотношение на детайлите.

AI може да генерира текстови описания и основни думи за 10 000 изображения за по-малко от два дни, което на доктрина ще усъвършенства успеваемостта и продуктивността за фирмите при ръководство на огромни масиви от изображения. Средно системата може да генерира 5 предложения и 10 основни думи за 10 секунди.

Услугата е създадена в съдействие с Shutterstock, една от най-големите платформи за издание на образно наличие – от изображения до видеоклипове. LG AI Research си сътрудничи с тази американска компания в предишното и има намерение да разшири партньорствата си.
Източник: technews.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР