Репортаж от Wedoany,Google интегрировала возможность управления устройствами непосредственно в модель Gemini 3.5 Flash. Недавно компания запустила функцию «Computer Use» для своей модели ИИ Gemini 3.5 Flash, позволяющую модели напрямую управлять физическими устройствами пользователя и выполнять действия от его имени. Ранее Google уже предоставляла потребителям возможность управлять удалёнными виртуальными компьютерами и браузерами через агента ИИ Gemini Spark, однако новая функция Computer Use расширяет контроль на физические устройства, находящиеся перед пользователем. Ранее Google предлагала отдельную модель Gemini 2.5 Computer Use для управления устройствами, а теперь интегрировала её непосредственно в Gemini 3.5 Flash, позволяя разработчикам вызывать возможности управления устройствами, поиска, работы с картами и другие на одной платформе без переключения на специализированную модель.

Ранее отдельная модель Gemini 2.5 Computer Use была в основном оптимизирована для управления через браузер и имела определённые ограничения. Google заявляет, что обновление обеспечит более чуткое выполнение «долгосрочных задач и задач корпоративной автоматизации». В ответ на возможные опасения по поводу безопасности полного контроля ИИ над устройствами, Google внедрила несколько мер. В настоящее время функция доступна только для разработчиков и корпоративной среды, используется для автоматического тестирования пользовательских интерфейсов, проведения исследований в веб-приложениях или автоматического ввода данных в устаревшее программное обеспечение. Доступ осуществляется через Gemini API или платформу Gemini Enterprise Agent; потребительская версия приложения Gemini не может активировать эту функцию.

На уровне безопасности Gemini 3.5 Flash использует протокол взаимодействия человека и машины, применявшийся в модели Gemini 2.5 Computer Use, гарантируя, что «чувствительные операции», такие как финансовые транзакции, требуют авторизации человека. Обновление добавило две новые функции безопасности. Первая — автоматическое обнаружение векторов атак, например «косвенной инъекции подсказок»: если на веб-странице обнаружен скрытый вредоносный текстовый запрос, выполнение прекращается. Вторая — требование явного подтверждения пользователя перед выполнением чувствительных или необратимых операций. Google отмечает, что эти ключевые меры безопасности являются опциональными, и разработчики обязаны их использовать, принимая на себя все риски, связанные с выполнением операций.
Будучи частью нативной модели Gemini 3.5 Flash, активация функции Computer Use не требует дополнительной платы. Стоимость новой модели составляет 1,50 доллара США за миллион входных токенов, что немного выше, чем 1,25 доллара за модель Gemini 2.5. Однако функция кэширования контекста, предоставляемая новой моделью, позволяет значительно снизить общие затраты, и для разработчиков, работающих с большим количеством повторяющихся задач, выгода, скорее всего, компенсирует небольшое повышение цены за один токен.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









