Моделът за генериране на изображения с изкуствен интелект DALL-E 2

OpenAI представи DALL-E 3 с поддръжка на текст и типография

Моделът за генериране на изображения с изкуствен интелект DALL-E 2 на Open AI към този момент не е авангарден.

Днес компанията разгласи DALL-E 3, най-новия си генератор на изображения.

Показа някои от новите му впечатляващи функционалности, в това число способността да генерира разбираем текст, вграден непосредствено в самите изображения – нещо, което не беше елементарно при DALL-E 2. И което други конкурентни модели за генериране на изображения с изкуствен интелект, като Midjourney, към момента мъчно реализират.

DALL-E 3 дава обилни усъвършенствания спрямо DALL-E 2 при генерирането на текст в границите на изображение и в човешки елементи като ръце.
OpenAI на уебстраницата си, обясняваща новия модел.

Тази функционалност слага OpenAI в директна конкуренция с Ideogram, стартъп на някогашни чиновници на Googlе, който започва предишния месец и също предлага генериране на изображения с вграден текст/типография, употребявайки собствен личен модел на изкуствен интелект.

Освен това OpenAI написа, че DALL-E 3 се оправя доста по-добре с разбирането на пространствените взаимоотношения, които потребителите включват в текста на подкана.

Генерира изображения, които слагат фигурите и обектите там, където потребителят ги е описал, във връзка едни с други.

Това значи, че описателните подсказки към този момент могат да се пресъздават доста по-точно, както се вижда от примерна екранна фотография по-долу.

OpenAI също по този начин заяви, че DALL-E 3 ще се появи в ChatGPT Plus, платеното абонаментно равнище от 20 $ на месец на нейния хитов огромен езиков модел (LLM), и в новите проекти ChatGPT for Enterprise, оповестени предишния месец.

Корпоративните клиенти към този момент ще имат опция да генерират изображения с текст за своите маркетингови или вътрешни материали.

Освен това OpenAI твърди, че ChatGPT може да помогне на потребителите да уточняват автоматизирано своите подкани, с цел да генерират изображения, които по-добре дават отговор на техните планове.

В същото време OpenAI написа, че „ сходно на предходните версии сме подхванали стъпки за ограничение на опцията DALL-E 3 да генерира наличие с принуждение, наличие за възрастни или наличие, пораждащо омраза„.

Съобщението беше приветствано от бранителя на връзките с разработчиците на OpenAI Логан Килпатрик в неговия акаунт в обществената мрежа X (бивш Twitter), който съобщи, че то е „ безусловно необикновено “.