Репортаж от Wedoany,AI-стартап Sakana AI выбрал платформу Gemini Enterprise Agent Platform от Google Cloud в качестве инфраструктуры для своей мультиагентной системы Sakana Fugu. Google Cloud Japan 29 июня опубликовал кейс-статью, подробно описывающую сотрудничество сторон.

Sakana Fugu — это мультиагентная система, которая выбирает или комбинирует несколько AI-моделей в зависимости от сложности задачи. Она включает два типа: Fugu, ориентированный на скорость вывода, и высокопроизводительный Fugu Ultra. В некоторых задачах Fugu Ultra, как утверждается, превосходит по производительности AI-модели американской компании Anthropic — Claude Mythos Preview и Claude Fable 5.
В механизме оркестрации нескольких моделей в качестве инфраструктуры был выбран Google Cloud. Sakana AI отмечает, что компания в основном основана инженерами из Google и Google DeepMind, поэтому использование Google Cloud было естественным шагом. Чи Сан (Chi Sun), отвечающий за проектирование инфраструктуры Sakana Fugu, оценил Google Cloud как высококачественную и стабильную инфраструктуру, а также отметил предоставляемые управляемые сервисы, позволяющие координировать работу нескольких моделей.
Чи Сан также упомянул, что Sakana Fugu состоит из трех уровней: фронтального, промежуточного уровня обработки и модельного уровня, и что наличие всех необходимых инструментов для построения каждого уровня также стало одной из причин выбора.
На фронтальном уровне модели защищаются от некорректного ввода или DDoS-атак с помощью функции сетевой безопасности Google Cloud Armor и функции защиты AI-моделей и агентов Model Armor. Аутентификация и защита пользователей, а также управление API-ключами реализуются через платформу разработки веб-приложений Firebase.
Промежуточный уровень обработки отвечает за вызов моделей, обработку логов и кэша, а также за запись данных в хранилище данных BigQuery.
Модельный уровень генерирует ответы, комбинируя несколько моделей на основе входного запроса. Вызов моделей таких компаний, как американская Google, американская OpenAI, Anthropic и других, осуществляется через бессерверную среду выполнения Cloud Run и AI-платформу Gemini Enterprise Agent Platform (ранее Vertex AI).









