DeepSeek-V4: запуск с контекстом в 1 млн токенов и возможностями AI-агента, сопоставимыми с мировыми топ-закрытыми моделями
2026-04-25 11:05
В избр.

Репортаж от Wedoany,Компания DeepSeek 24 апреля официально выпустила предварительную версию новой серии моделей DeepSeek-V4 и одновременно открыла исходный код весов моделей на платформе Hugging Face и других ресурсах. В официальном объявлении в аккаунте WeChat компания DeepSeek сообщила, что возможность обработки контекста в 1 млн токенов с этой даты станет единым стандартом для всех официальных сервисов DeepSeek, включая API, диалоги на сайте и в мобильном приложении. Впервые серия V4 разделена на две версии: DeepSeek-V4-Pro, позиционируемая как флагманская модель с максимальной производительностью для сложных задач AI-агентов, анализа длинных документов и глубоких рассуждений, и DeepSeek-V4-Flash, ориентированная на экономическую эффективность, с меньшим количеством параметров и низкой задержкой для высокочастотных приложений.

Официально опубликованный технический документ раскрывает ключевые инновации серии V4. В модели используется новый гибридный механизм внимания с обучаемым модулем сжатия на уровне токенов и технологией разреженного внимания DSA для динамического удаления некритичных токенов в длинных последовательностях. Экспериментальные данные показывают, что в режиме контекста в 1 млн токенов число операций с плавающей запятой при выводе одного токена V4-Pro составляет лишь 27% от DeepSeek-V3.2, а потребление памяти KV Cache снижено до 10% от V3.2. Этот прорыв в эффективности впервые делает стоимость вывода с миллионным контекстом практически приемлемой для разработчиков, которым не нужно нести многократные затраты на обновление оборудования для работы с длинными текстами.

Что касается архитектуры модели, DeepSeek-V4-Pro демонстрирует прорывы по нескольким направлениям в кодовых и специализированных тестах для AI-агентов. На эталонном тесте Agentic Coding, оценивающем способности к программированию AI-агентов, V4-Pro достиг самого высокого уровня среди открытых моделей. В сложных внутренних тестовых средах разработки ПО модель стабильно приближается к качеству Claude Opus 4.6 в бездумном режиме и превосходит по плавности использования Claude Sonnet 4.5. Команда разработчиков DeepSeecher также создала частный набор тестов для AI-агентов, включающий следование очень длинным инструкциям, многократные вызовы инструментов и кросс-файловый рефакторинг. В этом наборе V4-Pro занял первое место среди моделей с открытым исходным кодом по двум ключевым показателям: полнота выполнения задач и точность следования инструкциям.

Данные сторонних тестовых центров подтверждают общую производительность V4-Pro. В эталонном тесте по математическому рассуждению AIME 2025 и конкурсном кодовом тесте LiveCodeBench результаты V4-Pro напрямую соответствуют продукции глобально топовых закрытых флагманских моделей, таких как GPT-5.4, значительно опережая другие модели с открытым исходным кодом. В оценках по универсальным знаниям и профессиональным способностям, включающих высокоуровневые вопросы по 12 профессиональным областям в тесте MMLU-Pro, V4-Pro показал улучшение более чем на 8 процентных пунктов по сравнению с предыдущим поколением. В тесте по научным рассуждениям уровня PhD GPQA Diamond он также уверенно опережает следующие открытые модели, уступая лишь самой мощной закрытой модели на данный момент. Эти результаты знаменуют, что отечественные модели большого языка впервые выходят на один уровень с самыми передовыми закрытыми системами по общему когнитивному измерению.

Что касается экологии вычислительных ресурсов, серия DeepSeek-V4 уже получила полную поддержку и адаптацию на продуктах суперузлов серии Ascend от Huawei. Команды обеих компаний реализовали совместную оптимизацию операций на нижнем уровне в процессах обучения и вывода моделей. DeepSeek четко обозначила оборудование Ascend как основного партнера по вычислительным ресурсам. Предприятия могут непосредственно развертывать модели серии V4 через AI-инфраструктуру Huawei, не полагаясь на импортные GPU для полного цикла производства от тонкой настройки до вывода.

Ценообразование на API продолжает традиционную стратегию DeepSeek по обеспечению предельной экономической эффективности. Цена вывода версии Flash составляет 2 юаня за 1 млн токенов, версии Pro — 24 юаня за 1 млн токенов; окно контекста в 1 млн токенов не облагается дополнительной платой. DeepSeek также объявляет, что опыт работы с серией V4 будет продолжает быть бесплатным для всех пользователей на сайте deepseek.com и в мобильном приложении: пользователи могут сразу загружать и взаимодействовать с длинными документами. С точки зрения технологической экосистемы, старые названия интерфейсов моделей deepseek-chat и deepseek-reasoner прекратят работу 24 июля 2026 года. Разработчикам необходимо перенести свои приложения на новые названия интерфейсов deepseek-v4-pro и deepseek-v4-flash до этой даты. В переходный период старые и новые интерфейсы будут работать параллельно для обеспечения непрерывности бизнеса.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Tencent Docs интегрируется с базой знаний WorkBuddy: одна авторизация для доступа ИИ ко всему процессу
2026-04-29
Majestic Labs выпускает ИИ-сервер Prometheus с конфигурацией памяти 128 ТБ в одном корпусе, преодолевая узкое место «стены памяти»
2026-04-29
Американская компания Poolside выпускает открытую модель программирования Laguna XS.2
2026-04-29
Blaize, Nokia и Datacomm развертывают гибридный ИИ в Индонезии
2026-04-29
RFOptic запустила 8-ГГц оптоволоконную линию RFoF с поддержкой 5G и C-диапазона
2026-04-29
u-blox представляет GNSS-модуль ZED-X20P-01B, обеспечивающий дециметровую точность
2026-04-29
SouthernCrossAI присоединяется к Equinix Fabric AI и развёртывает суверенные AI-инференсные узлы на базе SambaNova SN50 в Австралии
2026-04-29
ЕС планирует переориентировать цифровое регулирование на облачные сервисы и ИИ
2026-04-29
JD.com совместно с исследовательскими институтами представила технологию RLSD для снижения затрат на обучение моделей ИИ-рассуждений
2026-04-29
В Хэфэе построена и введена в эксплуатацию первая в Китае демонстрационная станция взаимодействия «автомобиль-сеть» — «5G + квантовое шифрование» обеспечивает обратную разрядку V2G и мегаваттную быструю зарядку
2026-04-29
Последние новости
1
В Жичжао, провинция Шаньдун, Китай, началось строительство автобусного комплекса Ланьшань общей площадью 8915,97 кв. м
2
Granada Cranes заключила многолетний контракт на обслуживание с Airbus UK
3
В Брайтоне построят первый в Европе футбольный стадион для женской команды вместимостью не менее 10 тысяч человек
4
Tencent Docs интегрируется с базой знаний WorkBuddy: одна авторизация для доступа ИИ ко всему процессу
5
CRBC выиграла тендеры на два строительных проекта в Танзании, включая спортивный центр и центр профессионального обучения
6
В Индии завершены фундаментные работы на железнодорожном мосту через реку Сабармати, начинается возведение верхнего строения
7
Majestic Labs выпускает ИИ-сервер Prometheus с конфигурацией памяти 128 ТБ в одном корпусе, преодолевая узкое место «стены памяти»
8
Американская компания Poolside выпускает открытую модель программирования Laguna XS.2
9
Accenture инвестирует в американскую General Robotics для ускорения автономной работы на базе ИИ
10
Китайский самолет C909 начал выполнять рейсы по второму регулярному маршруту в Центральную Азию