Само допреди 2 години бе абсурдно дори да си помислим,

Sora - изкуственият интелект, който ще промени света на видеото и анимацията

Само допреди 2 години бе неуместно даже да си помислим, че машина може да „ рисува ”, през днешния ден към този момент и „ снима с камера ”

Само две години минаха, откогато станахме очевидци на гражданска война в изкуствения разсъдък във връзка с генериране на картинки. Няколко абсурда, един сериозен митинг от страна на дизайнери и актьори, и 24 месеца по-късно тази технология не стопира да се развива. Към момента да вземем за пример midjourney, за което писахме няколко пъти в процеса му на развиване, към този момент е в шеста версия и генерира картинки, които са на процедура неразличими от действителността по подобен метод, че е мъчно да се разбере дали творението е дело на машина, или на надарен художник или фотограф.

Платформата работи по относително елементарен метод - пишете текст за това, което желаете да видите, а изкуственият разсъдък ви схваща и основава образното наличие по развой, наименуван stable diffusion. Той работи доста сходно на това, което вършат и човешките художници и това не би трябвало да е изненада - първо обрисува контур и съществени цветове, след това прибавя елементи и най-после завърши изображението.

Самото то пък е основано на голяма база от данни, комфортно за задачите на образованието на машината категоризирани по тагове или основни думи, които дават както спомагателна тенденция на „ интелекта ”, по този начин и разрешават той по-добре да разпознава написаното от потребителя, с цел да извади най-близката до пожеланото картинка. Разбира се има проблем - в случай че пуснете еднакъв текст няколко следващи пъти, резултатите, които ще извади ИИ, ще са радикално разнообразни - нито една от картинките няма да наподобява по нищо на миналата. Това значи, че този вид технология е мощно стеснен до основаването на стационарни изображения.

Видеото съставлява серия от такива, които се сменят по един или различен метод всеки момент. Така да вземем за пример стандарта в кинто и досега е 24 фрагмента в секунда, въпреки цифровото видео да разрешава доста по-високи честоти, наречени framerate. От всеки магазин за техника можете да си закупите видеокамера, която да снима минимум в 60 или 120 фрагмента в секунда, което ще ви даде освен „ по-плавна ” и добре изглеждаща картина, само че и да забавяте видяното - да гледате на каданс. Обикновените мобилни телефони в наши дни също са способни на това.

По-малко от две години в развиването на изкуствения разсъдък докара до тези резултати във връзка с фотосите. Може ли да имаме напредък и в други посоки със същите темпове? По-скоро да. Използваният текст за тази поредност е: " beautiful female model portrait of a fashion photoshoot focusing on the face and eyes with stylish make up and long blond hair "
Тоест с други думи - с цел да имате видео, е належащо да имате камера, която прави десетки изображения всяка секунда, и да имате индивид, който не се трансформира с времето. За да е задоволително безапелационен обликът, той би трябвало да е реален за човешкото око дотам, че да няма „ артефакти ”, които да го създадат съмнително. В този смисъл изкуственият разсъдък не може да генерира видео. Нали? Нали?!

Грешен отговор. Реалността още веднъж се промени и този път смяната е водена от различен колос - същата компания, която създаде и сътвори другият поразителен инструмент - ChatGPT, с който за секунди можете да генерирате текст или да получите информация, или да си напишете домашната работа. Новата платформа се споделя “Sora ” и въпреки още да не е обществено налична, както ChatGPT и даже MidJourney, демонстрираното от нея е повече от потресаващо.

Да, Sora генерира видеа, неразличими от действителността, като просто употребява ваш текст, като задание. Нито едно от видеата долу не е снимано от човек и за основаването му не е употребена камера. Не е и основано от умел в областта на триизмерното моделиране актьор. Всичко е генерирано от Sora само и единствено благодарение на текст, който да „ изиска ” от машината да сътвори видеото. Не единствено това, за генерирането не се изисква дълго време - нормално няколко минути за 40-50 секунден клип. Нещо повече - не е наложително клипът да следва единствено един индивид и да е „ сниман ” от един ъгъл. Sora може да основава и филмови откъси на филми и цели подиуми, и композиции. Привидно неразличими от такива, които биха били снимани по обичайния способ.

От реалистични фрагменти на хора, които се движат, през нереални футуристични подиуми, та чак до анимация в стила на „ Дисни ” или „ Пиксар ” - всичко това, е генерирано безпроблемно от новия модел на OpenAI. И предстоящо светът още веднъж е разграничен.

От една страна стоят оптимистите, които се неспокойствие чакат всеки пробив на тази технология, тъй като подозират, че посредством нея светът ще стане доста по-лесен за навигация. И може би по-свободен.

От друга, несъмнено, са тези, които знаят, че тази технология може и сигурно ще бъде употребена с неприятни планове.

Съвсем скоро, след може би по-малко от година, ще станем очевидци на първите фактически подправени вести във връзка с международни събития. Генериран от този или различен изкуствен интелект клип ще влезе в новините и ще бъде показан за действителност. И тогава ще би трябвало да си зададете въпроса способни ли сте да различавате същинско от подправено? И евентуално отговорът ще е негативен - за положително или за неприятно.