Репортаж от Wedoany,Исследователи Alibaba разработали фреймворк под названием SkillWeaver для решения проблемы маршрутизации инструментов AI-агентами в многошаговых задачах. Этот фреймворк снижает расход токенов более чем на 99% за счёт метода комбинированной маршрутизации навыков.
При масштабировании корпоративных AI-систем агентам приходится обрабатывать множество инструментов и навыков. Существующие методы выбора одного навыка не справляются с бизнес-запросами, требующими многошагового выполнения, например «скачать набор данных, преобразовать данные и создать визуальный отчёт». Исследовательская группа определила такие задачи как «комбинированная маршрутизация навыков», требующая от агента одновременного определения того, как разбить задачу, как сопоставить подзадачи с навыками и как объединить их в выполнимый план.
SkillWeaver реализует этот процесс через три этапа: декомпозиция, поиск и комбинирование. На этапе декомпозиции большая языковая модель разбивает запрос пользователя на серию подзадач; на этапе поиска с помощью модели встраивания извлекается короткий список кандидатов инструментов из библиотеки навыков для каждой подзадачи; на этапе комбинирования оценивается совместимость кандидатов и создаётся план выполнения в виде ориентированного ациклического графа. Исследователи также внедрили технику итеративной декомпозиции с учётом навыков (Iterative Skill-Aware Decomposition, SAD), которая с помощью обратной связи позволяет большой языковой модели переписывать декомпозицию на основе предварительно извлечённой информации о навыках, выравнивая детализацию с библиотекой инструментов.

Для оценки производительности исследователи создали бенчмарк CompSkillBench, содержащий 300 многошаговых запросов, используя библиотеку из 2 209 навыков из публичной экосистемы MCP, охватывающую 24 функциональные категории, включая облачную инфраструктуру, финансы, базы данных и другие. В качестве основного движка использовалась модель Qwen2.5-7B-Instruct для декомпозиции задач, а для поиска инструментов — семантический поисковый ретривер MiniLM. Эксперименты показали, что в обычной конфигурации без SAD точность декомпозиции модели 7B составила 51,0%, а после активации цикла обратной связи SAD она выросла до 67,7%; более крупная модель Qwen-Max достигла 92%. На сложных задачах, требующих четырёх-пяти навыков, SAD повысил точность на 50%. По сравнению с методом LLM-Direct, который предоставляет все инструменты модели, SkillWeaver с поиском и перенаправлением значительно повысил точность и снизил расход контекстного окна на запрос с примерно 884 000 токенов до примерно 1 160 токенов, то есть на 99,9%.

Исследовательская группа отмечает, что фреймворк построен на готовых компонентах с открытым исходным кодом, включая модель встраивания all-MiniLM-L6-v2 и индекс FAISS, а встраивание и индексация 2 209 навыков занимают всего 15 секунд. Разработчики могут самостоятельно реализовать его с помощью библиотек оркестрации, таких как LangChain и LlamaIndex. В настоящее время этап выполнения SkillWeaver не обладает возможностью восстановления после ошибок: при сбое вызова API на втором шаге цепочка прерывается. Команда рекомендует при производственном развертывании самостоятельно создавать механизмы отката и повторных попыток.










