Репортаж от Wedoany,Google DeepMind официально представил Interactions API, который переводит Gemini от вызова модели к выполнению действий агента. Этот API позволяет одновременно обрабатывать вызовы модели Gemini и выполнение агента на единой конечной точке (Unified Endpoint). Разработчикам достаточно передать идентификатор модели для задач вывода и идентификатор агента для автономных задач.
Ранее после отправки запроса (Prompt) API только вызывал модель и возвращал ответ. Ключевое изменение Interactions API заключается в том, что роль API расширилась от простого вызова модели до управления выполнением задач агента, поддерживая выполнение агента, управление состоянием задач, подключение инструментов и фоновую обработку в рамках одного процесса.

Функция управляемого агента (Managed Agent) помогает разработчикам создавать удалённую Linux-песочницу (Sandbox) с помощью одного вызова API. Агент Gemini может выполнять рассуждения, код, просматривать веб-страницы и управлять файлами в этой песочнице.

VentureBeat считает, что Interactions API — это унифицированный интерфейс, который по замыслу превращает большую языковую модель (LLM) из простого генератора текста в нечто, более напоминающее удалённую операционную систему. Это означает, что модель переходит от инструмента, который только генерирует ответы, к системе, способной вызывать несколько моделей, выполнять повторные вызовы, использовать инструменты и даже запускать серверный код.
Что касается затрат, Interactions API хранит записи диалогов и содержимое задач на серверах Google, поэтому разработчикам не нужно каждый раз повторно отправлять один и тот же длинный контекст. В сервисах агентов, которые часто используют большие объёмы документов или длинные записи диалогов, это позволяет снизить затраты на токены и задержку ответа. Записи задач для клиентов бесплатной версии хранятся один день, а для платных пользователей — до 55 дней. TechCrunch отмечает, что это помогает поддерживать состояние API и снижать цены, но предприятиям, обрабатывающим конфиденциальные данные, необходимо одновременно учитывать вопросы управления данными и их размещения.
Али Чебик (Ali Chebik), менеджер по продуктам группы Google DeepMind, подчеркнул на официальном сайте, что Interactions API разработан на основе отзывов разработчиков, и это направление не изменится после официального запуска.









