Китайская компания Unisound представила большую модель U2, набравшую 87,9 балла в тесте GPQA Diamond
2026-06-08 13:37
В избр.

Репортаж от Wedoany,Компания Unisound 8 июня 2026 года выпустила свою новую универсальную большую языковую модель U2. Эта модель позиционируется как нативная Agent-модель, предназначенная для частных лиц, разработчиков и организаций. Её технологическая концепция заключается в высокой плотности интеллекта и высокой ценности токенов, без слепого наращивания параметров или длины вывода.

В отличие от традиционных универсальных языковых моделей, ориентированных на однораундовые вопросы и ответы, U2 делает акцент на непрерывном выполнении задач в реальном мире. В таких сценариях, как сложная офисная работа, разработка программного обеспечения, глубокие исследования и многозадачная кооперация, U2 может самостоятельно декомпозировать и выполнять рабочие процессы, состоящие из более чем 100 шагов, объединяя понимание требований, планирование задач, взаимодействие со средой, использование инструментов, коррекцию процесса и проверку результатов в единый исполнительный цикл, переходя от предоставления ответов к выполнению задач.

изображение1

Что касается оценки, U2 набрал 87,9 балла в тесте GPQA Diamond, который измеряет знания и способность к сложным рассуждениям, превзойдя GLM-5.1, Hy3 preview, DeepSeek-V4-Flash (High) и MiniMax M2.7. В тесте SWE-Bench Verified, оценивающем навыки разработки программного обеспечения, модель получила 75 баллов, войдя в число ведущих моделей. В энд-ту-энд оценке автономного агента Claw-Eval (pass@3) результат составил 76,9 балла, также превзойдя Hy3 preview, DeepSeek-V4-Flash (High) и MiniMax M2.7. В тесте GDPval, оценивающем способность выполнять офисные задачи и задачи по передаче знаний, U2 набрал 72,9 балла; этот бенчмарк фокусируется на выполнении типичных офисных задач, таких как анализ документов, написание отчетов, обработка электронных таблиц, создание диаграмм и подготовка слайдов.

Компания Unisound заявила, что дизайн U2 не основан на превосходстве в какой-то одной изолированной способности, а обеспечивает системную производительность в области рассуждений, программирования, выполнения агентских задач и офисной работы. Для достижения целей выполнения задач в U2 внедрен механизм смешанного мышления, который в рамках одного процесса рассуждения динамически переключается между явной цепочкой рассуждений и латентным пространственным мышлением в зависимости от этапа задачи, сложности и неопределенности. На начальном этапе задачи модель выполняет поиск путей, декомпозицию задачи и генерацию кандидатных решений в латентном пространстве; на этапе принятия ключевых решений или обработки ограничений она переключается на явное рассуждение для логической калибровки и сходимости результатов. Благодаря ограниченному латентному выводу и переключению на основе энтропии модель может динамически корректировать режим мышления в зависимости от неопределенности в процессе рассуждения.

В части базы знаний U2 применяет технологии фильтрации и очистки данных с высокой плотностью знаний, отфильтровывая дублирующиеся и низкокачественные данные, а также использует разреженное кодирование знаний и архитектуру дистилляции знаний для сжатия избыточных параметров модели. На уровне выполнения задач внедрена парадигма совместного обучения Agent-Harness, которая объединяет повышение возможностей модели и оптимизацию инструментального конвейера в единый цикл обучения, позволяя высококачественным траекториям выполнения, полученным в реальных задачах, передаваться обратно модели, усиливая её способности в планировании, использовании инструментов, коррекции процесса и приемке результатов.

U2 фокусируется на трех ключевых способностях: рассуждение, программирование и агентские возможности. В области рассуждений акцент делается на выполнении с низким уровнем отклонений и долгосрочной логической стабильности; в программировании — на сквозной инженерной поставке, позволяющей генерировать код из требований на естественном языке и понимать структуру многофайловых проектов; в агентских возможностях — на улучшении многозадачной кооперации, организации длинных процессов и взаимодействия со средой. Эти способности образуют замкнутый цикл выполнения задач: от понимания требований, планирования и выполнения до совместной проверки.

Что касается сценариев применения, U2 может охватывать разработку интерфейсов полного спектра, включая создание адаптивных веб-страниц, мобильных веб-приложений и реализацию дизайн-систем; глубокие исследования и анализ, включая отраслевые и политические исследования, визуализацию данных и подготовку документов в различных форматах; разработку иммерсивных интерактивных игр, таких как классические казуальные игры и физические симуляторы; а также эффективную автоматизацию офисной работы, включая анализ бизнес-отчетов, анализ отраслевой структуры и периодический обзор бизнеса. U2 уже доступен на платформе Token Hub от Unisound для частных лиц, разработчиков и организаций.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Нидерландская Nebius инвестирует 1,7 млрд фунтов стерлингов в расширение облачной инфраструктуры ИИ в Великобритании
2026-06-08
Система AI-интеллектуального патрулирования экзаменационных пунктов вступительных экзаменов в вузы Китая охватывает десятки провинций
2026-06-08
Еженедельный объем вызовов китайских AI-моделей превосходит американский шестую неделю подряд
2026-06-08
Университет Маккуори (Австралия) разработал алгоритм ИИ для выявления контрабандных морских организмов с точностью 92%
2026-06-08
Министерство государственной безопасности Китая опубликовало предупреждение: остерегайтесь рисков утечки данных через «AI-транзитные станции»
2026-06-08
В провинции Ганьсу (Китай) запущено исследование стратегий и технологических путей развития металлургической и горнодобывающей промышленности с использованием искусственного интеллекта
2026-06-08
Исследование IBM в США: две трети технических руководителей сталкиваются с разрывом в контроле над ИИ
2026-06-08
Компания Calterah представила в Шанхае радарные SoC для ADAS и решение UWB
2026-06-08
Тайваньская компания GIGABYTE (Китай) представляет технологии AI-оптимизации для повышения производительности материнских плат
2026-06-08
Китайская компания Unisound представила большую модель U2, набравшую 87,9 балла в тесте GPQA Diamond
2026-06-08
Последние новости
1
В Чили введен в эксплуатацию автоматизированный терминал для медного концентрата TGN с годовой пропускной способностью 4 млн тонн
2
Rhenus Logistics запускает логистические решения для сырьевых товаров в Латинской Америке
3
Администрация Суэцкого канала Египта приняла первое комплексное судно снабжения и обслуживания нефтяных месторождений
4
Казахстан требует ускорить финансирование логистического комплекса «Тобол» на 64 млрд тенге
5
Китайская Longteng Special Steel запустила совместное предприятие в Индонезии по производству износостойких шаров мощностью 200 000 тонн в год
6
Двухтопливный аммиачный двигатель WinGD прошел второй этап заводских приемочных испытаний в Китае
7
В 2026 году в японской Фукусиме запущена установка по производству «зеленого» аммиака мощностью 4 тонны в сутки от компаний JGC и KBR
8
В Австралии началось строительство хаба GEGHA по производству «зеленого» водорода и аммиака: 4500 тонн аммиака и 200 тонн водорода в год
9
Hiab приобретает канадского производителя мусоровозов Labrie за 1,04 млрд долларов
10
Завершена установка ротора 6-го энергоблока третьей очереди проекта Аньцин в провинции Аньхой, Китай