Репортаж от Wedoany,Google расширяет функцию Gemini Avatar на большее количество платных подписчиков Gemini, позволяя пользователям создавать искусственный интеллект цифровую версию себя для генерации видео и другого контента в Gemini. Эта функция работает на базе модели Gemini Omni от Google — первой модели генерации видео от Google, которая может комбинировать мультимодальные входные данные в одном запросе. Функция была впервые обнаружена в ходе анализа APK в марте и предназначена для копирования внешности и голоса пользователя.

Пользователи могут получить доступ к функции, перейдя в приложении Gemini по пути «Настройки > Avatar». После активации пользователи могут создать персонализированного AI-аватара, имитирующего их черты лица, голос и манеры, и вызывать его с помощью определённых команд в диалогах Gemini. Процесс настройки относительно прост: первый этап включает тренировку на основе камеры, где пользователь держит телефон на уровне глаз и следует инструкциям на экране, чтобы запечатлеть лицо с разных углов, позволяя Gemini создать детальную модель структуры лица. Второй этап — голосовая тренировка, где Gemini просит пользователя громко прочитать ряд случайных фраз и чисел для анализа его речевых паттернов, интонации, акцента и ритма. После завершения настройки аватар будет привязан к учётной записи Google пользователя и станет доступен в среде Gemini.
Для обеспечения принятия сканирования лица и голоса Google рекомендует пользователям держать телефон на уровне глаз, избегать слишком тёмного или слишком яркого окружения, а также убедиться, что глаза, нос и рот видны. Система допускает очки как часть аватара, но запрещает шляпы, солнцезащитные очки и маски, а также не допускает присутствия других людей или изображений лиц на фоне пользователя.
В связи с потенциальными рисками реалистичных AI-аватаров Google объявил о ряде мер безопасности. Пользователи должны быть не моложе 18 лет для создания аватара, а владелец учётной записи должен лично присутствовать в процессе регистрации. Кроме того, все видео, созданные с помощью Gemini Avatar, содержат водяной знак SynthID от Google — невидимый водяной знак, встроенный непосредственно в сгенерированный контент, который можно обнаружить с помощью инструментов Google, помогая зрителям идентифицировать AI-сгенерированные видео и снижая риск злоупотреблений. На данный момент Google не объявил, будет ли эта функция также доступна бесплатным пользователям Gemini.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









