OpenAI, следвайки стъпките на стартъпи като Runway и технологични гиганти

...
OpenAI, следвайки стъпките на стартъпи като Runway и технологични гиганти
Коментари Харесай

Най-новият модел на OpenAI - Sora - генерира реалистични видеоклипове

OpenAI, следвайки стъпките на стартъпи като Runway и софтуерни колоси като Гугъл и Meta, навлиза в генерирането на видео.

Компанията показа Sora - генеративен модел на изкуствен интелект, който основава видео от текст.

При малко или в детайли изложение, както и при използване на фотография Sora може да генерира подиуми, сходни на филми, с голям брой герои, разнообразни типове придвижване и фонови елементи.

Моделът може също по този начин да " уголемява " съществуващи видеоклипове, като прави всичко допустимо да попълни изчезналите детайли.

OpenAI пусна къси клипове, представящи ярки, видимо реалистични видеоклипове, измежду които мамути, преминаващи през заснежено поле, океански талази, разбиващи се в брега на канара, и хора, правещи ежедневни неща като четене на книга.

" Sora има задълбочено схващане на езика, което ѝ разрешава тъкмо да интерпретира поръчките и да генерира безапелационни герои, които показват ярки страсти ", написа компанията в блога си.

" Моделът схваща освен какво е изискал потребителят, само че и по какъв начин тези неща съществуват във физическия свят. "

В страницата на OpenAI за Sora има доста обещаващи изявления - образец за това е горното изказване.

Но подбраните от модела извадки наподобяват много впечатляващо, най-малко спрямо други технологии за превръщане на текст във видео, които сме виждали, показва TechCrunch.

Sora може да генерира видеоклипове в разнообразни стилове (например фотореалистични, анимирани, черно-бели) с дължина до една минута - доста повече от други модели за превръщане на текст във видео.

И тези филми поддържат рационална кохерентност в смисъл, че не постоянно се поддават на " странностите на изкуствения разсъдък ", като да вземем за пример обекти, движещи се във физически невъзможни направления.

OpenAI - при всичките си суперлативи - признава, че моделът не е идеален. Компанията написа:

" Sora може да се затрудни с точното преструване при детайлна сцена и може да не схваща съответни случаи на причина и разследване. Например, човек може да отхапе бисквита, само че по-късно върху нея да няма следи от отхапване. Моделът може също по този начин да обърка заканите за пространствени елементи, да вземем за пример да обърка ляво и дясно, и да се затрудни с точните описания на събития, които се случват във времето. "

OpenAI нарежда Sora като изследователска визуализация, като разкрива малко за това какви данни са употребявани за образованието на модела.

Основанието за това е капацитетът за корист – компанията показва, че злонамерени консуматори биха могли да употребяват подобен модел по безчет способи.

От OpenAI настояват, че работят с специалисти, с цел да изследват технологията за уязвимости и да основат принадлежности за разкриване на това дали обещано видео е генерирано от модела им.

Компанията също по този начин споделя, че в случай че реши да вгради модела в обществен артикул, ще подсигурява, че метаданните за произхода са включени в генерираните резултати.

" Ще се ангажираме с политици, преподаватели и актьори от целия свят, с цел да разберем техните опасения и да идентифицираме позитивни случаи на потребление на тази нова технология ", написа OpenAI.

" Въпреки обширните проучвания и проби не можем да предвидим всички способи, по които хората ще употребяват нашата технология, нито всички способи, по които хората ще злоупотребяват с нея. Ето за какво имаме вяра, че ученето от действителната приложимост е сериозен съставен елемент за основаването и стартирането на все по-безопасни системи с изкуствен интелект с течение на времето. "
Източник: profit.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР