Google обнови своя чатбот Gemini със задвижвана от изкуствения интелект

...
Google обнови своя чатбот Gemini със задвижвана от изкуствения интелект
Коментари Харесай

Google пусна „AI Photoshop“ – в Gemini е вграден модела nano-banana, който може прецизно да редактира изображения

Гугъл обнови своя чатбот Gemini със задвижвана от изкуствения разсъдък функционалност за обработка на изображенията, която разрешава на потребителите да управляват процеса на редактиране на фотосите с точност. Търсачката се стреми да реализира опциите за обработка на изображения на OpenAI и да притегли аудиторията на ChatGPT.

Актуализацията на Gemini 2.5 Flash Image е налична за всички консуматори на приложението Gemini, както и за разработчиците на платформите Gemini API, Гугъл AI Studio и Vertex AI. Новият редактор обработва изображенията с висока акуратност, основани на елементарни поръчки на натурален език. Той резервира консистентността на лицата, животните и другите елементи, което не постоянно е допустимо с конкурентните принадлежности: да вземем за пример, в случай че поискате от ChatGPT или xAI Grok да трансформират цвета на нечия риза на фотография, това може да докара до накриво лице или смяна на фона. Гугъл Gemini 2.5 Flash Image към този момент завоюва утвърждението на потребителите — компанията го направи наличен на платформата LMArena под името „ nano-banana “.

Ляво – истинската фотография, дясно – обработената с nano-banana

Това не е обособен AI-модел, а по-скоро вградена функционалност на съществуващия Gemini 2.5 Flash AI. „ Наистина подобрихме качеството на обработката на изображенията и способността на модела да следва указания. Тази актуализация доста усъвършенства процеса на редактиране, правейки го по-органично, а резултатът от модела подобаващ за всевъзможни цели “  — сподели пред TechCrunch Никол Брихтова, началник на генеративните образни модели в Гугъл DeepMind.

Моделът има задълбочени знания за света и разрешава задаването на голям брой мостри в поръчката — да вземем за пример изображение на диван, хол и цветова палитра могат да бъдат комбинирани в един отговор. „ Искаме да дадем на потребителите креативна независимост, с цел да могат да получат това, което желаят от моделите. Но това не е сходно на нищо друго “ — добави Брихтова. Гугъл предприе някои стъпки за битка с растежа на случаите с дийпфейк, добавяйки образни водни знаци и идентификатори в метаданните към генерираните от изкуствения разсъдък изображения.

Източник: kaldata.com


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР