Google демонстрира работата на пространствено-времевия дифузионен модел Lumiere. Новият инструмент

...
Google демонстрира работата на пространствено-времевия дифузионен модел Lumiere. Новият инструмент
Коментари Харесай

Google представи Lumiere – усъвършенстван изкуствен интелект за създаване на видеоклипове

Гугъл показва работата на пространствено-времевия дифузионен модел Lumiere. Новият инструмент за изкуствен интелект може да основава необикновено реалистични видеоклипове с дълготрайност до пет секунди. Невронната мрежа анимира неподвижни изображения или единствено елементи от тях в отговор на текстови подсказки на натурален език. За разлика от своите прародители Lumiere построява цялата дължина на видеоклипа едновременно, вместо да генерира първия и последния кадър, пробвайки се да отгатне какво се случва сред тях. Разработката е в границите на проучвателен план и към момента не е известно дали ще бъде налична за необятна приложимост.

Lumiere може да копира стила на изображението и по-късно да употребява този жанр за основаване на поредност от видеоклипове на други тематики. Невронната мрежа може да вземе истинския видеоклип на потребителя и да трансформира всичко в Лего, оригами или цветя.

Съдейки по демонстрациите, Lumiere разполага с най-усъвършенстваните благоприятни условия за изобразяване. Можете да покриете част от изображението и Lumiere автоматизирано ще запълни тази област – толкоз безпроблемно, че намесата на изкуствения разсъдък ще бъде незабележима.

Изследователският екип твърди, че пространствено-времевата архитектура на U-net построява цялата дължина на видеоклипа едновременно, с един пас. Това отличава невронната мрежа от предходните модели, които постоянно генерират начален и краен кадър и по-късно се пробват да предвиждат какво ще се случи сред тях.

На този стадий това е единствено проучвателен план. Така че не е наложително Гугъл да нападателно да ограничи системата, с цел да съблюдава авторските права. Както и неприкосновеността на персоналния живот и сигурността, както и да предотврати речта на омразата и голотата. Този развой непроменяемо води до по-ниско качество на резултатите при генеративните модели.

Източник: kaldata.com

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР