Краят на нямото ИИ видео: Google представи Veo 3 – първият видеогенератор със звук
На конференцията I/O 2025 Гугъл показа най-новия ИИ модел за генериране на видео по текстови описания Veo 3, който основава освен картина, само че и звуков акомпанимент. За разлика от своите аналози, логаритъмът схваща наличието на фрагментите и основава тон без спомагателни подсказки. А с цел да се предпазят от имитации, всички видеоклипове ще бъдат маркирани с незабележим воден знак.
Алгоритъмът е в положение да основава звукови резултати, фонов звук и даже разговори, като ги синхронизира с изображението. Според Демис Хасабис, началник на подразделението DeepMind на Гугъл, потребителите могат да задават описания на героите, средата и даже да показват по какъв начин да звучат репликите. Компанията не разкрива върху какви данни е бил подготвен Veo 3, само че е евентуално, както написа TechCrunch, да е употребявано наличие от YouTube, защото Гугъл, която е притежател на платформата, към този момент удостовери, че нейното наличие „ може “ да се употребява за образование на ИИ моделите.
cooking up something tasty for tomorrow… pic.twitter.com/wyIRMsXkFG
— Demis Hassabis (@demishassabis) May 19, 2025
Пазарът на генеративни видеоклипове към този момент е пренаситен, защото Runway, OpenAI, Alibaba и десетки стартъпи основават сходни модели. Гугъл обаче направи още една стъпка напред, като вкара пълноценно аудио. DeepMind към този момент създаде технология за превръщане на видео в аудио, която евентуално е в основата на новата система, която проучва видеопикселите и автоматизирано избира подобаващото аудио. За да се противодейства на разпространяването на дезинформация и имитации, всички клипове на Veo 3 са маркирани с невидимия вграден воден знак SynthID.
В същото време доста художници и карикатуристи показват угриженост за протичащото се. Според изследване, поръчано от Гилдията на холивудските аниматори (Animation Guild), до 2026 година към 100 хиляди работни места във филмовата, телевизионната и анимационната промишленост в Съединени американски щати може да бъдат изгубени заради изкуствения разсъдък.
Експертите настояват, че Veo 3 може да се трансформира в сериозен съперник на претрупания пазар на генеративни видеоклипове – при изискване че Гугъл съблюдава обещанията си за качеството на звука. Моделът към този момент е наличен в приложението Gemini за клиентите на проекта AI Ultra, който коства $249 на месец.




