Китайская компания Qwen выпустила языковую мировую модель Qwen-AgentWorld
2026-06-24 11:56
В избр.

Репортаж от Wedoany,24 июня китайская компания Qwen официально представила нативную языковую мировую модель Qwen-AgentWorld, а также синхронно запустила бенчмарк AgentWorldBench для оценки языковых мировых моделей, охватывающий семь областей. Модель и бенчмарк уже доступны для открытого доступа на Hugging Face и ModelScope, предназначены для таких сценариев, как моделирование среды ИИ-агентов, обучение задачам и оценка способностей.

Основное позиционирование Qwen-AgentWorld — это «языковая мировая модель», а не обычная диалоговая большая модель. Она моделирует изменения состояния среды, в которой находится агент, с помощью языковой формы, и на основе действий агента и истории взаимодействий предсказывает следующую обратную связь от среды. Для ИИ-агентов такая модель предоставляет виртуальное интерактивное пространство, где можно многократно пробовать и ошибаться, используемое для обучения и оценки способностей агента к планированию, выполнению и исправлению ошибок в сложных задачах.

Выпущенная Qwen-AgentWorld охватывает семь областей взаимодействия агентов, включая вызов инструментов MCP, поиск, терминал, программную инженерию, Android, веб и операционные системы. Эти области включают как текстовые среды, так и графические интерфейсы и среды работы с программным обеспечением, охватывая типичные точки входа для задач современных ИИ-агентов. Модель может использоваться для моделирования результатов выполнения команд в терминале, обратной связи от веб-операций, изменений интерфейса мобильных приложений, прогресса в задачах программной инженерии и реакции среды после вызова инструментов.

Согласно официальной информации, Qwen-AgentWorld-35B-A3B обучена на базе Qwen3.5-35B-A3B-Base, имеет общий объем параметров 35B, активируемых параметров около 3B и поддерживает контекстную длину до 262K. Процесс обучения включает три этапа: непрерывное предварительное обучение, контролируемую тонкую настройку и обучение с подкреплением, причем цель с ранних этапов обучения сосредоточена на моделировании среды, а не на временном добавлении способностей к моделированию к универсальной языковой модели.

Одновременно выпущенный AgentWorldBench используется для оценки качества моделирования языковых мировых моделей в различных интерактивных средах. Этот бенчмарк оценивает предсказанные моделью наблюдения среды по пяти измерениям: формат, фактичность, согласованность, реалистичность и качество, помогая исследователям сравнивать производительность различных моделей в задачах моделирования среды. Страница на Hugging Face показывает, что набор данных AgentWorldBench открыт в виде тестового набора, содержащего около 2170 образцов.

Такие модели имеют прямое значение для разработки ИИ-агентов. В настоящее время обучение агентов сталкивается с реальной проблемой: высокая стоимость вызова реальных сред, сложность состояний задач, а среды API, веб, терминалов и мобильных приложений трудно стабильно воспроизводить в больших масштабах. Если языковая мировая модель сможет достаточно точно моделировать обратную связь от среды, исследователи смогут позволить агенту многократно пробовать и ошибаться в виртуальной среде, а затем переносить полученные стратегии в реальные задачи.

Выпуск Qwen-AgentWorld также показывает, что конкуренция больших моделей смещается от «ответов на вопросы» к «пониманию среды и предсказанию изменений среды». Раньше большие модели в основном соревновались в знаниях, рассуждениях и генеративных способностях, но в эпоху агентов большее значение придается способности оценивать последствия действий в многошаговых взаимодействиях. Ценность мировой модели заключается именно в создании обучаемого, оцениваемого и масштабируемого моста моделирования между действиями и результатами.

Однако языковые мировые модели все еще не могут заменить реальную среду. Веб, операционные системы, мобильные приложения и вызовы инструментов подвержены влиянию версий, разрешений, состояния сети и изменений внешних сервисов, поэтому результаты моделирования должны быть проверены в реальных сценариях. Qwen-AgentWorld больше подходит в качестве инфраструктуры для обучения и оценки агентов, чтобы снизить затраты на пробные ошибки, расширить охват среды и выявить слабые места агентов, а не как прямая замена работе реальной системы.

С синхронным открытием модели и бенчмарка разработчики могут проводить вторичную оценку и тонкую настройку для таких сценариев, как терминал, программная инженерия, мобильные приложения, поиск и вызов инструментов. Чтобы ИИ-агенты перешли от демонстраций к практическому использованию, необходимы более стабильное моделирование среды, воспроизводимые стандарты оценки и замкнутый цикл обучения, ориентированный на реальные задачи. Qwen-AgentWorld восполняет этот пробел, предоставляя новый инструментальный фундамент.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Хорватский CARNET выделил контракты на 2,9 млн евро для повышения кибербезопасности МСП
2026-06-24
Qualcomm объявила список 15 стартапов из Азиатско-Тихоокеанского региона в рамках программы AI Innovators
2026-06-24
Технология коммутатора CXL следующего поколения от Panmnesia принята на ISCA 2026
2026-06-24
Американская компания Mouser Electronics запускает онлайн-центр ресурсов по безопасности в ответ на Закон ЕС о киберустойчивости
2026-06-24
Американская компания Apple завершила пробное производство чипа A21 по 2-нм техпроцессу TSMC
2026-06-24
Apple планирует начать массовое производство первого складного iPhone в июле
2026-06-24
Южнокорейская SK Hynix направит 45,45 трлн вон на строительство заводов через ADR
2026-06-24
Японская SoftBank делает ставку на физический ИИ, Масаёси Сон заявил, что роботы уже вышли на этап серийного производства на заводе
2026-06-24
Уставный капитал китайской компании Star-Net Ruijie увеличен до приблизительно 760 млн юаней
2026-06-24
Китайская платформа Jimeng AI запускает функцию нативного 4K для Seedance 2.0 VIP
2026-06-24
Последние новости
1
Дочерняя компания Saudi RSI получила контракт на электромеханические работы в Diriyah на сумму 94 млн долларов
2
Совместное предприятие Hassan Allam Construction и UCC Saudi получило контракт на $719 млн на строительство отеля Waldorf Astoria в Саудовской Аравии
3
Компания Majid Investment and Urban Development из ОАЭ и египетская Midar подписали соглашение о разработке стоимостью 3,1 миллиарда долларов
4
ICO и Bankinter предоставили Lignum Tech финансирование в размере 11,51 млн евро для расширения мощностей индустриального строительства
5
Британская компания Oakmere планирует построить 110 домов в Ланкастере
6
Великобритания планирует построить шесть заводов по опреснению морской воды на юго-востоке Англии
7
Northtree приобретает Lincoln House в Манчестере, Великобритания, за 55 миллионов фунтов стерлингов
8
Доклад Канадского института климата: к 2100 году адаптация инфраструктуры к климату позволит экономить от 4 до 9 миллиардов канадских долларов в год
9
В Сямэне завершен монтаж первого стального коробчатого пролета судоходного моста Люудань на участке Сямэнь моста Сяцзинь
10
Британский проект We Build Eco обеспечивает точность распила деревянных каркасов до 1,5 мм