Невронната мрежа Flamingo на Google се научи да пише описания за видеоклиповете в YouTube Shorts
Съвместният екип на Гугъл DeepMind приказва за новия си план – образният езиков модел Flamingo, който написа описания за късите видеоклипове в секцията YouTube Shorts. Тези записи се разгласяват за минути и постоянно им липсват описания и смислени заглавия, което ги прави сложни за намиране. Flamingo има за цел да реши този проблем.
Визуалният езиков модел написа описанията на късите видеоклипове, като проучва техните начални фрагменти и предлага пояснения за протичащото се, да вземем за пример: „ куче държи купчина бисквити на главата си “. Текстовите описания, генерирани от AI, се съхраняват във формат на метаданни, който ще помогне за „ по-добро категоризиране на видеоклиповете и сравнение на резултатите от търсенето с потребителските поръчки “. AI взема решение проблем, присъщ за секцията Shorts в YouTube: създателите постоянно подценяват метаданните за видеоклиповете, а самите материали се гледат най-вече в общата емисия и вследствие на това не могат да бъдат намирани посредством търсенето.
Описанията, генерирани от Flamingo, не се демонстрират на феновете или даже на създателите на видеоклипа, сподели Тод Шърман (Todd Sherman), шеф за ръководство на продуктите YouTube Shorts. Въпреки това, текстът на тези описания е в сходство с етичните стандарти на продуктите на Гугъл, макар че е малко евентуално AI да се опита незаслужено да показа видеоклипа в неприятна светлина. Flamingo към този момент е пуснат в YouTube и прибавя своите описания към всички нови видеоклипове в секцията Shorts – забележителна част от към този момент оповестените материали, изключително най-популярните, също са минали през процедурата.
Администрацията на платформата също по този начин не изключва опцията AI-моделът да стартира да работи и с пълнометражните дълги видеоклипове в YouTube, макар че нуждата от това не е толкоз огромна: хората прекарват часове, дни, седмици и даже месеци, снимайки и редактирайки тези материали, тъй че прибавянето на метаданни към тях е единствено дребна част от процеса на основаване на видео. И защото феновете избират дългите видеоклипове въз основа на мини-изображението и заглавието, има натурален тласък за основателите на тези изявления да попълнят вярно метаданните.




