Изкуствен интелект на LG разбира и описва обекти или сцени(снимка:

Невронна мрежа на LG създава текстови описания на изображения

Изкуствен разсъдък на LG „ схваща ” и разказва обекти или подиуми
(снимка: CC0 Public Domain)

Подразделение на LG създаде система с генеративен изкуствен интелект Captioning AI, която може да разпознава детайли от изображения и да основава описания и основни думи за тях. Подобна технология ще е потребна при образуване на бази данни с изображения на огромни компании.

Представители на LG AI Research разкриха новата система по време на най-голямата в света конференция за компютърно зрение – „ Computer Vision and Pattern Recognition 2023 ”, извършена в неделя във Ванкувър, Канада. Решението се базира на технологията Zero-shot Image Captioning, създадена от изследователския екип на LG, която разрешава на изкуствения разсъдък да „ схваща ” и разказва обекти или подиуми.

Невронната мрежа на LG прави оценка за първи път дадени обекти без спомагателни подкани, въз основа на своя предходен опит – тъкмо като хората. Компанията изясни, че технологията е друга от AI услуги като Midjourney, в които всичко се случва тъкмо противоположното – потребителите вкарват текст или качват картина, въз основата на която AI генерира лично създание.

Създаването на „ надписи ” за фотоси може да наподобява много елементарно, защото концепцията не е нова. AI технологията обаче доближи последващо равнище. Например, изкуственият разсъдък в действителност може да направи заключения и да опише това, което в никакъв случай преди не е „ виждал ” – като гледа пейзаж или човек и схваща кое е мястото.
още по темата
Технологията на LG разрешава на невронната мрежа да разпознае фона, героите и даже интензивността в изображението и да опишете взаимоотношение на детайлите.

AI може да генерира текстови описания и основни думи за 10 000 изображения за по-малко от два дни, което на доктрина ще усъвършенства успеваемостта и продуктивността за фирмите при ръководство на огромни масиви от изображения. Средно системата може да генерира 5 предложения и 10 основни думи за 10 секунди.

Услугата е създадена в съдействие с Shutterstock, една от най-големите платформи за издание на образно наличие – от изображения до видеоклипове. LG AI Research си сътрудничи с тази американска компания в предишното и има намерение да разшири партньорствата си.

Невронна мрежа на LG създава текстови описания на изображения

невронна мрежа

мрежа създава

създава текстови

текстови описания

описания изображения

невронна

мрежа

създава

текстови

описания

изображения