Китайская Baidu выпустила модель Wenxin 5.1, стоимость предобучения которой составляет всего 6% от отраслевого уровня
2026-05-11 11:44
В избр.

Репортаж от Wedoany,9 мая 2026 года компания Baidu официально выпустила новое поколение базовой модели Wenxin 5.1. Модель использует технологию «многомерного эластичного предобучения», которая позволила сократить общее количество параметров примерно до одной трети от Wenxin 5.0, а количество активных параметров — примерно до половины. Стоимость предобучения составляет всего около 6% от стоимости моделей аналогичного масштаба в отрасли. На данный момент модель заняла первое место в Китае и четвертое в мире в рейтинге LMArena Search, а также одновременно запущена на платформе Baidu Qianfan Model Square и официальном сайте Wenxin Yiyan.

В отличие от общепринятого в индустрии пути простого наращивания количества параметров, технологический прорыв Wenxin 5.1 сосредоточен на структурных инновациях в области эффективности обучения. Исследовательская команда Baidu впервые предложила концепцию эластичного обучения «Once-for-All» при выпуске Wenxin 5.0. Ее основная логика заключается в одновременной оптимизации большого количества подсетей с разными параметрами в ходе одного процесса предобучения с помощью механизма динамической выборки, что позволяет построить «матрицу подсетей», охватывающую различные масштабы параметров и вычислительные затраты. Wenxin 5.1 извлекает оптимальную архитектуру подсети именно из этой матрицы, полностью наследуя базу знаний Wenxin 5.0 и одновременно достигая скачкообразной оптимизации эффективности параметров и стоимости обучения.

С технической точки зрения, эластичная структура обучения обеспечивает гибкое сжатие и расширение в трех измерениях. В измерении эластичной глубины во время обучения случайным образом пропускаются некоторые слои Transformer, что позволяет подсетям разной глубины совместно использовать веса и адаптивно обучаться балансу между глубинными и поверхностными представлениями. В измерении эластичной ширины часть экспертов в слоях MoE динамически маскируется, заставляя оставшихся экспертов выполнять более разнообразные задачи и повышая эффективность их использования. В измерении эластичной разреженности количество активируемых экспертов гибко регулируется с помощью вариативного механизма Top-k маршрутизации: активация меньшего числа экспертов снижает затраты на инференс, а активация большего числа — усиливает способности модели, обеспечивая динамический баланс между затратами на вывод и производительностью.

Уровень производительности Wenxin 5.1 был подтвержден в ходе ряда авторитетных бенчмарков. В области агентных способностей, в задачах оценки τ³-bench и SpreadsheetBench-Verified, Wenxin 5.1 превзошла DeepSeek-V4-Pro, а ее агентные способности приблизились к ведущим международным закрытым моделям. В области способностей к рассуждению, в тесте AIME26 по математике (с использованием инструментов) модель набрала 99,6 балла, уступив только Gemini 3.1 Pro. В области творческого письма внутренняя оценка показала приближение к уровню Gemini 3.1 Pro. В области мировых знаний и понимания знаний результаты тестов GPQA и MMLU-Pro близки к показателям ведущих закрытых моделей.

Для продвижения эволюции больших моделей в сторону автономных агентов принятия решений Baidu параллельно разработала базовую технологию разделенного полностью асинхронного обучения с подкреплением, целенаправленно решающую проблемы глобальной оптимизации, вызванные расхождением обучения и вывода, низкой утилизацией ресурсов и эффектом «длинного хвоста». Благодаря стратегии масштабного посттренинга агентов и полносвязной координации «среда-эксперт-фьюжн», модель сохраняет стабильную производительность при обработке сложных «длиннохвостых» задач. Что касается поисковых способностей, Wenxin 5.1 может быстро искать, интегрировать и генерировать информацию из множества источников, выдавая более согласованные и надежные ответы, что представляет высокую практическую ценность в таких сложных бизнес-сценариях, как создание контента, интеллектуальные помощники, управление корпоративными знаниями и агентные приложения.

Ранее серия Wenxin 5.0 уже неоднократно входила в текстовый рейтинг и рейтинг визуального понимания LMArena, прочно удерживая позиции в первом эшелоне китайских моделей. 30 апреля предварительная версия Wenxin 5.1 Preview заняла первое место в Китае в текстовом рейтинге LMArena с результатом 1476 баллов, превзойдя такие основные модели, как GPT-5.5 и DeepSeek-V4-Pro, и став единственной китайской моделью, вошедшей в топ-15 рейтинга. Конференция разработчиков Baidu AI Create 2026 пройдет с 13 по 14 мая во втором корпусе Китайского национального конференц-центра в Пекине, где Baidu представит последние достижения в области прорывов ИИ-технологий и их внедрения в индустрию, связанные с моделью Wenxin.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Китайская компания HollySys выпускает промышленную модель мира XWorld
2026-05-11
Китайская группа Hangsheng и Zhuojun Holdings заключили стратегическое партнерство для совместного освоения сферы воплощенной экономики
2026-05-11
Американская компания Genesis AI представила в США базовую модель робота GENE-26.5
2026-05-11
Суринамская Telesur подписала протокол о намерениях по подключению к Карибской подводной кабельной системе EllaLink
2026-05-11
Министерство промышленности и информатизации Китая запустило пилотный план по этической экспертизе и обслуживанию в области искусственного интеллекта, который на первом этапе охватит 10 провинций
2026-05-11
Китайская Baidu выпустила модель Wenxin 5.1, стоимость предобучения которой составляет всего 6% от отраслевого уровня
2026-05-11
China Mobile опубликовала «Технологическую инновационную систему национальной интегрированной вычислительной сети», переходя от «байтового» управления к «токенному» управлению
2026-05-11
Сингапурская Horizon Quantum после листинга представила стратегию мульти-аппаратной интеграции, закладывая основу программного обеспечения для квантовых коммуникаций
2026-05-11
Китайская компания Xiaoyu Intelligent Manufacturing завершила раунд финансирования B+ на сотни миллионов юаней, внедряя промышленный воплощенный интеллект с архитектурой «один мозг — множество форм»
2026-05-11
Британская компания Quantum Motion привлекла 160 миллионов долларов в раунде C для коммерциализации кремниевых квантовых вычислений
2026-05-11
Последние новости
1
Французская компания Veolia представила генератор озона Ozonia S и дисковый фильтр Hydrotech
2
Festo расширяет линейку безштоковых электрических приводов ELGD, добавляя модели с зубчатым ремнем и шарико-винтовой передачей
3
Немецкая компания Kuka представляет сверхмощного робота KR Titan Ultra для повышения стабильности при перемещении крупногабаритных грузов
4
Американская компания GFT Technologies представила систему коллаборативных роботов с ИИ, крупные автопроизводители первыми внедряют её
5
Британская технология контроллера Deva CMM обеспечивает автоматизированный контроль без программирования
6
Компания Jingji Technology из провинции Хубэй (Китай) преодолела рубеж в 10 миллионов поставленных автомобильных откидных механизмов сидений
7
Швейцарская компания Kistler Instrument и американская FimmTech объединяют усилия для расширения применения технологии давления в полости формы
8
Испанское подразделение DHL Supply Chain развернуло 95 автономных мобильных роботов
9
Американская компания Kensington выпустила многопортовые зарядные устройства на основе нитрида галлия и кабель для быстрой зарядки мощностью 240 Вт
10
Совместное исследование немецких вузов позволило совершить прорыв в производительности лазерного синтеза наночастиц