DALL-E 3 разбира хората по-добре, уверяват разработчиците на модела от

...
DALL-E 3 разбира хората по-добре, уверяват разработчиците на модела от
Коментари Харесай

Вграждат в ChatGPT подобрен генератор на изображения

DALL-E 3 схваща хората по-добре, твърдят разработчиците на модела от OpenAI

Това изображение е основано от новия генератор с изкуствен интелект DALL-E 3
(изображение: OpenAI / DALL-E 3)

Нова, усъвършенствана версия на генератора на изображения DALL-E ще бъде интегрирана скоро в ChatGPT, съобщи  разработчикът на известния чатбот с изкуствен интелект – компанията OpenAI.

DALL-E 3 може „ доста по-добре да схваща поръчките “, да проучва комплицирани указания и да генерира „ извънредно подробни и точни изображения “ в съпоставяне със своя предходник DALL-E 2, настояват разработчиците.

„ Съвременните генератори на изображения са склонни да пренебрегват думи или описания, принуждавайки потребителите да се учат на промпт-инженерство. DALL-E 3 съставлява стъпка напред в способността ни да сътворяваме изображения, които тъкмо дават отговор на поръчката ”, споделят от OpenAI в изложение на новия генератор на изображения.

Моделът се оправя по-добре и с дребни елементи, които кардинално са сложни за изкуствения разсъдък, като да вземем за пример човешки ръце. Дори при едни и същи поръчки, резултатите на DALL-E 3 са доста по-добри от тези на DALL-E 2, твърдят разработчиците.
още по темата
DALL-E 3 ще може да покаже тъкмо сцена с съответни обекти и по какъв начин те се свързват един с различен, както е показано на изображенията, генерирани от новия AI.

OpenAI възнамерява да вгради DALL-E 3 в ChatGPT Plus и версията Enterprise на чатбота в близко бъдеще. Комбинирането на езиковите умения на чатбот с генератор на изображения ще разреши на потребителите да основават още по-точни изображения и ще обезпечи още повече благоприятни условия за фина конфигурация на поръчката, в случай че първият получен резултат не е това, което потребителят чака.

„ При поискване ChatGPT автоматизирано ще генерира персонализирани, подробни препоръки за DALL-E 3, от които да създадете изображение. Ако потребителят харесва полученото изображение, само че то не отразява тъкмо поръчката, тогава може да направи промени като добави единствено няколко спомагателни поясняващи думи “, разяснява OpenAI.

В момента DALL-E 3 е във фаза на прелиминарен обзор и се чака да стане наличен за клиентите на ChatGPT Plus и Enterprise през октомври посредством API. Използването на DALL-E 2 е платено, а месечният абонамент за ChatGPT Plus коства $20.

Понастоящем единственият известен AI чатбот, който предлага безвъзмезден вграден генератор на изображения, е Bing Chat AI от Microsoft. Между другото, той работи въз основа на мощния езиков модел GPT-4 от OpenAI.

„ Както при DALL-E 2, изображенията, генерирани благодарение на DALL-E 3, ще бъдат благосъстоятелност на потребителя и няма да изискват позволение за препечатване, продажба или разпространяване “, прецизира OpenAI.

DALL-E 3 включва принадлежности, които лимитират основаването на избрани изображения. Например, генераторът ще отхвърля поръчки с имена на обществени персони или „ нездравословни пристрастия “, с цел да понижи риска от разпространяване на агитация и дезинформация.

Разработчиците също тестват класификатор на произхода – инструмент, който ще дефинира дали изображението е генерирано от невронна мрежа. И най-после, DALL-E няма да генерира изображения в стила на художниците, които творят сега.
Източник: technews.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР