Репортаж от Wedoany,15 июня Baidu DuMate объявил о завершении обновления базового ядра. Благодаря движку Harness и ряду инженерных оптимизаций, при сохранении интеллектуальных возможностей Agent и эффективности выполнения задач, потребление токенов в процессе выполнения задач снижено на 75%, а расход пользовательских баллов также сокращён на 75%. Для корпоративных продуктов на основе Agent потребление токенов напрямую влияет на стоимость использования, скорость реакции на задачи и возможность масштабного развёртывания. Это обновление переносит оптимизацию затрат с уровня вызова модели на уровень цепочки выполнения Agent.
DuMate — это универсальный продукт Agent от Baidu для офисных и корпоративных задач, ориентированный на обработку файлов, работу с браузером, совместную работу в Office, поиск информации, декомпозицию задач и выполнение действий между инструментами. По сравнению с обычными моделями вопросов и ответов, затраты на продукты Agent более сконцентрированы на процессе выполнения задач: им необходимо многократно анализировать экран, вызывать инструменты, считывать контекст, генерировать шаги действий, проверять результаты и вносить исправления при неудачах. Сложная задача часто требует не одного вызова модели, а множества циклов планирования, выполнения и проверки. Чем выше потребление токенов, тем больше время ожидания пользователя, затраты платформы на вычисления и расход баллов.
Ключевым элементом обновления базового ядра стал движок Harness. Harness можно рассматривать как инженерный слой, соединяющий модель, инструменты, потоки задач и среду выполнения Agent. Он определяет, как модель декомпозирует задачи, когда вызывать инструменты, как повторно использовать контекст, как сжимать неэффективные шаги и как перепланировать задачи после сбоев. Ранее Baidu упоминал возможности «управления инженерией» в обновлениях продуктов Smart Cloud, подчёркивая повышение успешности выполнения офисных задач и снижение потребления токенов за счёт инженерной оптимизации. Снижение потребления токенов DuMate на 75% показывает, что фокус оптимизации сместился с эффективности отдельных вопросов и ответов на контроль затрат на всём пути выполнения задач Agent.
Такая оптимизация будет более заметна для пользователей. Когда сотрудники предприятий используют Agent для работы с таблицами, документами, поиском в интернете, сортировкой данных, вводом процессов и другими задачами, их действительно волнует, будет ли задача выполнена, приемлемо ли время ожидания и не слишком ли высок расход баллов. Если потребление токенов для одной и той же задачи снижается, расчёт затрат на этапе тестирования и развёртывания для предприятий становится более прозрачным, а индивидуальные пользователи с большей вероятностью будут использовать Agent для частых офисных задач, а не только в редких сложных сценариях. Для продуктов Agent снижение затрат часто приводит к увеличению частоты использования, что, в свою очередь, даёт больше реальной обратной связи по задачам.
Индустрия Agent переходит от этапа «может ли это работать» к этапу «может ли это стабильно работать с низкими затратами». Ранние продукты Agent в основном демонстрировали возможности управления браузером, работы с файлами и многошагового планирования, но в реальном использовании часто сталкивались с проблемами высоких затрат на длинные задачи, избыточности шагов, раздувания контекста и больших затрат на повторные попытки при сбоях. Ценность оптимизации слоя Harness заключается в том, чтобы позволить Agent сократить неэффективное мышление и повторные вызовы, направив возможности модели на ключевые решения, сложные рассуждения и проверку результатов. По мере того как офисные, маркетинговые, сервисные, исследовательские и операционные сценарии продолжают подключаться к Agent, стоимость выполнения станет важным показателем для закупок и постоянного использования предприятиями.
Обновление DuMate также отражает изменение фокуса конкуренции среди универсальных продуктов Agent в Китае. Возможности модели остаются основой, но пользовательский опыт всё больше зависит от инженерных систем, оркестровки инструментов, управления контекстом и контроля затрат. Тот, кто сможет снизить потребление токенов, сохраняя при этом успешность выполнения задач, с большей вероятностью войдёт в корпоративные высокочастотные сценарии. Для Baidu обновление базового ядра DuMate помогает повысить конкурентоспособность продукта на рынке офисных Agent и корпоративных Agent, а также закладывает основу для последующего локального развёртывания, командной работы и расширения отраслевых сценариев с точки зрения затрат.
В дальнейшем необходимо наблюдать за реальной производительностью задач. Снижение потребления токенов на 75% является чётким показателем оптимизации затрат, но корпоративные пользователи также будут обращать внимание на успешность выполнения сложных задач, точность обработки файлов, стабильность вызова инструментов, безопасность и конфиденциальность, контроль доступа и возможности многопользовательской работы. Если DuMate сможет стабильно поддерживать эффективность выполнения в высокочастотных офисных задачах и позволит снижению затрат реально отразиться на пользовательских баллах и корпоративных бюджетах, то это обновление станет не просто корректировкой параметров, а инженерной проверкой способности универсального Agent перейти к масштабному использованию.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









