Китайская Baidu выпустила модель Wenxin 5.1, стоимость предобучения которой составляет всего 6% от отраслевого уровня_Глобальные новости

Китайская Baidu выпустила модель Wenxin 5.1, стоимость предобучения которой составляет всего 6% от отраслевого уровня

2026-05-11 11:44

В избр.

Репортаж от Wedoany，9 мая 2026 года компания Baidu официально выпустила новое поколение базовой модели Wenxin 5.1. Модель использует технологию «многомерного эластичного предобучения», которая позволила сократить общее количество параметров примерно до одной трети от Wenxin 5.0, а количество активных параметров — примерно до половины. Стоимость предобучения составляет всего около 6% от стоимости моделей аналогичного масштаба в отрасли. На данный момент модель заняла первое место в Китае и четвертое в мире в рейтинге LMArena Search, а также одновременно запущена на платформе Baidu Qianfan Model Square и официальном сайте Wenxin Yiyan.

В отличие от общепринятого в индустрии пути простого наращивания количества параметров, технологический прорыв Wenxin 5.1 сосредоточен на структурных инновациях в области эффективности обучения. Исследовательская команда Baidu впервые предложила концепцию эластичного обучения «Once-for-All» при выпуске Wenxin 5.0. Ее основная логика заключается в одновременной оптимизации большого количества подсетей с разными параметрами в ходе одного процесса предобучения с помощью механизма динамической выборки, что позволяет построить «матрицу подсетей», охватывающую различные масштабы параметров и вычислительные затраты. Wenxin 5.1 извлекает оптимальную архитектуру подсети именно из этой матрицы, полностью наследуя базу знаний Wenxin 5.0 и одновременно достигая скачкообразной оптимизации эффективности параметров и стоимости обучения.

С технической точки зрения, эластичная структура обучения обеспечивает гибкое сжатие и расширение в трех измерениях. В измерении эластичной глубины во время обучения случайным образом пропускаются некоторые слои Transformer, что позволяет подсетям разной глубины совместно использовать веса и адаптивно обучаться балансу между глубинными и поверхностными представлениями. В измерении эластичной ширины часть экспертов в слоях MoE динамически маскируется, заставляя оставшихся экспертов выполнять более разнообразные задачи и повышая эффективность их использования. В измерении эластичной разреженности количество активируемых экспертов гибко регулируется с помощью вариативного механизма Top-k маршрутизации: активация меньшего числа экспертов снижает затраты на инференс, а активация большего числа — усиливает способности модели, обеспечивая динамический баланс между затратами на вывод и производительностью.

Уровень производительности Wenxin 5.1 был подтвержден в ходе ряда авторитетных бенчмарков. В области агентных способностей, в задачах оценки τ³-bench и SpreadsheetBench-Verified, Wenxin 5.1 превзошла DeepSeek-V4-Pro, а ее агентные способности приблизились к ведущим международным закрытым моделям. В области способностей к рассуждению, в тесте AIME26 по математике (с использованием инструментов) модель набрала 99,6 балла, уступив только Gemini 3.1 Pro. В области творческого письма внутренняя оценка показала приближение к уровню Gemini 3.1 Pro. В области мировых знаний и понимания знаний результаты тестов GPQA и MMLU-Pro близки к показателям ведущих закрытых моделей.

Для продвижения эволюции больших моделей в сторону автономных агентов принятия решений Baidu параллельно разработала базовую технологию разделенного полностью асинхронного обучения с подкреплением, целенаправленно решающую проблемы глобальной оптимизации, вызванные расхождением обучения и вывода, низкой утилизацией ресурсов и эффектом «длинного хвоста». Благодаря стратегии масштабного посттренинга агентов и полносвязной координации «среда-эксперт-фьюжн», модель сохраняет стабильную производительность при обработке сложных «длиннохвостых» задач. Что касается поисковых способностей, Wenxin 5.1 может быстро искать, интегрировать и генерировать информацию из множества источников, выдавая более согласованные и надежные ответы, что представляет высокую практическую ценность в таких сложных бизнес-сценариях, как создание контента, интеллектуальные помощники, управление корпоративными знаниями и агентные приложения.

Ранее серия Wenxin 5.0 уже неоднократно входила в текстовый рейтинг и рейтинг визуального понимания LMArena, прочно удерживая позиции в первом эшелоне китайских моделей. 30 апреля предварительная версия Wenxin 5.1 Preview заняла первое место в Китае в текстовом рейтинге LMArena с результатом 1476 баллов, превзойдя такие основные модели, как GPT-5.5 и DeepSeek-V4-Pro, и став единственной китайской моделью, вошедшей в топ-15 рейтинга. Конференция разработчиков Baidu AI Create 2026 пройдет с 13 по 14 мая во втором корпусе Китайского национального конференц-центра в Пекине, где Baidu представит последние достижения в области прорывов ИИ-технологий и их внедрения в индустрию, связанные с моделью Wenxin.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com