Google обяви няколко нови функции за своя виртуален асистент Gemini

...
Google обяви няколко нови функции за своя виртуален асистент Gemini
Коментари Харесай

ИИ-асистентът Gemini Live на Google се научи да вижда света през камерата на смартфона – точно и без забавяне

Гугъл разгласи няколко нови функционалности за своя виртуален помощник Gemini Live, с който потребителите могат да взаимодействат посредством гласови команди. В близко бъдеще Gemini Live ще може по-точно да разпознава и маркира обектите, които потребителят му „ демонстрира “ благодарение на камерата на смарт телефона си.

Тази иновация ще бъде потребна в най-различни обстановки. Например, когато потребителят не е сигурен кой инструмент е най-подходящ за избрана задача, той може да попита Gemini Live и да употребява камерата, с цел да помогне на AI-асистента да избере най-хубавия вид. Функцията ще бъде налична на обявените тази седмица смарт телефони Гугъл Pixel 10. Визуалните подсказки ще станат налични и на останалите Android-устройства по-късно този месец, а приложението на асистента за iOS ще се появи през идващите седмици.

https://media2.giphy.com/media/v1.Y2lkPTc5MGI3NjExNzFsZmJtM21sMWg1YzNlcnk0M2xpZHM1ZmJicWxvaXVyYWZqamoycCZlcD12MV9pbnRlcm5hbF9naWZfYnlfaWQmY3Q9Zw/NuHbtOw5rofTbsyTmS/giphy.gif

Същевременно, разработчиците са разширили опциите на Gemini Live във връзка с взаимоотношението с други приложения, в това число Телефон, Съобщения и Часовник. Например, в случай че консуматор разисква маршрут до избрана точка с Gemini Live, само че схваща, че няма да може да стигне в точния момент, в този случай потребителят може да каже на ИИ-асистента, че препоръчаният маршрут му подхожда, само че би трябвало да сформира и изпрати известие до един от контактите, че ще се забави с няколко минути. След това Gemini Live независимо ще генерира и изпрати известие до посочения контакт, като по този метод го предизвести авансово за забавянето.

https://media2.giphy.com/media/v1.Y2lkPTc5MGI3NjExYmU5cTR3MHpnOWw5Z2J2dHJ4YnUxcnU1YjF5cDdkMTlpYTJzdHBmNCZlcD12MV9pbnRlcm5hbF9naWZfYnlfaWQmY3Q9Zw/Vbr9HNHWuClAG94ejb/giphy.gif

Гугъл също по този начин разгласи стартирането на обновен аудио-модел за Gemini Live. Благодарение на това логаритъмът ще разпознава по-добре интонацията, ритъма и височината на гласа на човек. Скоро ИИ-асистентът ще се научи да трансформира интонацията според от това, за което се приказва. Също потребителят ще може да форсира и забавя Gemini Live според от това по какъв начин му е по-удобно да възприема отговорите на AI-асистента. Ако потребителят помоли Gemini Live да преразкаже трагично история от името на съответен воин или историческа персона, логаритъмът ще може да даде „ богат и вълнуващ роман “.

Източник: kaldata.com


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР