ChatGPT вече отговаря на видео в реално време
OpenAI пусна новия модел с изкуствен интелект GPT-4o, който поддържа видео-разговори и може да действа като образован гласов помощник, написа New Voice.
Обновеният модел, съгласно OpenAI, е доста по-бърз от предходния и има усъвършенствани благоприятни условия за обработка на текст, изображения и аудио. Потребителите на GPT-4o ще могат да употребяват образните данни по разнообразни способи: освен могат да качват документи или да споделят изображения с чатбота, само че и да пишат онлайн с ChatGPT посредством видео, употребявайки камерата на устройството си. В този случай приложението може да работи като образован гласов помощник, отговаряйки на вашите запитвания в действително време и наблюдавайки света към вас. Този модел ще бъде безвъзмезден за всички консуматори, само че притежателите на абонамент ще имат по-висок предел за взаимоотношение.
Новият модел може да разпознава страстите на потребителя (демонстрирано посредством молба на чатбота да успокои някого преди обществена реч) и да взаимодейства с потребителите, които го прекъсват, до момента в който дава отговор на поръчка, и доста повече.
OpenAI показва новите благоприятни условия с голям брой видеоклипове, които съгласно компанията не са забързани. По-специално, компанията сподели взаимоотношението на консуматор с куче благодарение на гласовия помощник. Показано е и видео, в което чатботът се досеща, че в стаята се чества рожден ден едвам откакто види избрани атрибути посредством видео-разговор. В допълнение, видеата демонстрират, че тази версия на ChatGPT може да се употребява като участник във вашия видео-разговор с други хора, да се употребява като преводач в действително време или да служи за проучване на езици, решение на математически задания и така нататък В момента моделът разрешава на ChatGPT да работи с 50 разнообразни езика.
Fast counting with GPT-4o pic.twitter.com/3KfVbaAM6c
— OpenAI (@OpenAI) May 13, 2024
Dog meets GPT-4o pic.twitter.com/5C0hlYq5ws
— OpenAI (@OpenAI) May 13, 2024
Dad jokes with GPT-4o pic.twitter.com/8w1coXBRGH
— OpenAI (@OpenAI) May 13, 2024
Meeting AI with GPT-4o pic.twitter.com/rHkQ316MYj
— OpenAI (@OpenAI) May 13, 2024
Lullabies and whispers with GPT-4o pic.twitter.com/5T7ob0ItuM
— OpenAI (@OpenAI) May 13, 2024
Happy birthday with GPT-4o pic.twitter.com/OuEkfQsap9
— OpenAI (@OpenAI) May 13, 2024
GPT-4o получи доста усъвършенствани разговорни умения. Той има изразителна интонация и може да се смее, да шепне и да пее. OpenAI показва невероятното взаимоотношение сред два изкуствени интелекта, които пеят дружно.
Компанията отбелязва, че аудио-възможностите на GPT-4o вкарват разнообразни нови опасности, тъй че гласовите функционалности ще бъдат внедрявани последователно и с ограничавания.
„ Днес пускаме обществено модел за извеждане на текст и изображения. През идващите седмици и месеци ще работим върху техническата инфраструктура, използваемостта посредством следващо образование и сигурността, нужни за стартирането на други модалности. Например, при стартирането на пазара, аудио изходите ще бъдат лимитирани до селекция от авансово заложени гласове и ще дават отговор на нашите съществуващи инструкции за сигурност “ — сподели компанията в блог обява.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
Two GPT-4os interacting and singing pic.twitter.com/u9VuZoroxm
— OpenAI (@OpenAI) May 13, 2024
Припомняме също, че още преди да бъде публично показан GPT-4o счупи съвсем всички върхове в класацията на chatbot под скрито име.