Китайский Alibaba представил SkillWeaver, снижающий расход токенов агентами более чем на 99%
2026-07-03 10:13
В избр.

Репортаж от Wedoany,Исследователи Alibaba разработали фреймворк под названием SkillWeaver для решения проблемы маршрутизации инструментов AI-агентами в многошаговых задачах. Этот фреймворк снижает расход токенов более чем на 99% за счёт метода комбинированной маршрутизации навыков.

При масштабировании корпоративных AI-систем агентам приходится обрабатывать множество инструментов и навыков. Существующие методы выбора одного навыка не справляются с бизнес-запросами, требующими многошагового выполнения, например «скачать набор данных, преобразовать данные и создать визуальный отчёт». Исследовательская группа определила такие задачи как «комбинированная маршрутизация навыков», требующая от агента одновременного определения того, как разбить задачу, как сопоставить подзадачи с навыками и как объединить их в выполнимый план.

SkillWeaver реализует этот процесс через три этапа: декомпозиция, поиск и комбинирование. На этапе декомпозиции большая языковая модель разбивает запрос пользователя на серию подзадач; на этапе поиска с помощью модели встраивания извлекается короткий список кандидатов инструментов из библиотеки навыков для каждой подзадачи; на этапе комбинирования оценивается совместимость кандидатов и создаётся план выполнения в виде ориентированного ациклического графа. Исследователи также внедрили технику итеративной декомпозиции с учётом навыков (Iterative Skill-Aware Decomposition, SAD), которая с помощью обратной связи позволяет большой языковой модели переписывать декомпозицию на основе предварительно извлечённой информации о навыках, выравнивая детализацию с библиотекой инструментов.

SkillWeaver

Для оценки производительности исследователи создали бенчмарк CompSkillBench, содержащий 300 многошаговых запросов, используя библиотеку из 2 209 навыков из публичной экосистемы MCP, охватывающую 24 функциональные категории, включая облачную инфраструктуру, финансы, базы данных и другие. В качестве основного движка использовалась модель Qwen2.5-7B-Instruct для декомпозиции задач, а для поиска инструментов — семантический поисковый ретривер MiniLM. Эксперименты показали, что в обычной конфигурации без SAD точность декомпозиции модели 7B составила 51,0%, а после активации цикла обратной связи SAD она выросла до 67,7%; более крупная модель Qwen-Max достигла 92%. На сложных задачах, требующих четырёх-пяти навыков, SAD повысил точность на 50%. По сравнению с методом LLM-Direct, который предоставляет все инструменты модели, SkillWeaver с поиском и перенаправлением значительно повысил точность и снизил расход контекстного окна на запрос с примерно 884 000 токенов до примерно 1 160 токенов, то есть на 99,9%.

Результаты SkillWeaver

Исследовательская группа отмечает, что фреймворк построен на готовых компонентах с открытым исходным кодом, включая модель встраивания all-MiniLM-L6-v2 и индекс FAISS, а встраивание и индексация 2 209 навыков занимают всего 15 секунд. Разработчики могут самостоятельно реализовать его с помощью библиотек оркестрации, таких как LangChain и LlamaIndex. В настоящее время этап выполнения SkillWeaver не обладает возможностью восстановления после ошибок: при сбое вызова API на втором шаге цепочка прерывается. Команда рекомендует при производственном развертывании самостоятельно создавать механизмы отката и повторных попыток.

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com
Связанные продукты
Связанные рекомендации
Китайская компания JULIANG ENGINE (Juliang Engine) выпустила рекламную модель управления Mamoda 2.5
2026-07-03
Китайская модель с открытым исходным кодом Kimi K2.7 от компании Moonshot AI интегрирована в GitHub Copilot
2026-07-03
Китайская компания Shenhao Technology планирует закупить серверы на 2 миллиарда юаней для сдачи в аренду вычислительных мощностей
2026-07-03
Китайская компания Digital China выиграла тендер на поставку серверов Huawei для интеллектуальных вычислений в крупный государственный банк на сумму 371 млн юаней
2026-07-03
Китайская компания Contemporary Amperex Technology (CATL) приобрела долю в разработчике технологий человекоподобных роботов Robo Party
2026-07-03
Китайская компания Xihe Technology готовится к выходу на Научно-технический инновационный совет (STAR Market), доля мирового рынка кремниевых фотонных чипов составляет около 13%
2026-07-03
Microsoft вкладывает 2,5 миллиарда долларов в создание команды из 6000 специалистов по внедрению ИИ
2026-07-03
Государственное управление по делам киберпространства Китая вновь опубликовало для общественного обсуждения «Меры по управлению услугами интернет-информации (проект поправок для сбора мнений)»
2026-07-03
Китайский Alibaba Cloud запустил корпоративную версию Qoder с QMind — облачной базой знаний
2026-07-03
Австрийская компания ams OSRAM назначила бывшего руководителя NVIDIA ответственным за оптические межсоединения для центров обработки данных ИИ
2026-07-03
Последние новости
1
Fortuna Metals получила продукт рутила с содержанием оксида титана более 96% на проекте в Малави
2
Kaoko Metals обнаружила новое обнажение медной минерализации на проекте Chalkos в Намибии
3
Lindian Resources завершила первый взрыв на редкоземельном руднике Канганкунде в Малави, начав добычу
4
Китайская компания JULIANG ENGINE (Juliang Engine) выпустила рекламную модель управления Mamoda 2.5
5
Канадская компания Galloper Gold объявила о стратегическом партнерстве с Tripp Marine по транспортировке тяжелого оборудования на баржах
6
Южнокорейская сталелитейная группа POSCO объявила о реструктуризации трех основных направлений бизнеса с планом инвестиций в размере 16,7 трлн вон
7
Китайская модель с открытым исходным кодом Kimi K2.7 от компании Moonshot AI интегрирована в GitHub Copilot
8
Azzuro Resources обнаружила высокосортную медно-золотую минерализацию на участке Red Hill в Монголии: 21,45 метра с содержанием меди 1,70%
9
Австралийская Silver Mines представила отчет об оценке разработки серебряного рудника Боуденс
10
В Мексике открылся Горный форум Гуанахуато 2026, подчеркивающий стратегическую роль горнодобывающей промышленности