Китайская компания StepFun представляет модель рассуждений Step 3.7 Flash
2026-06-15 16:44
В избр.

Репортаж от Wedoany,Nvidia продолжает расширять свой портфель, добавляя несколько моделей, причем крупнейшая из них пока только анонсирована. Тем временем Microsoft на конференции Build в начале июня представила ряд моделей, но, к сожалению, все они с закрытым исходным кодом, что еще больше отдаляет ее от OpenAI.

Шанхайская AI-компания StepFun, успешно запустившая весной модель 3.5, выпустила новую модель рассуждений Step 3.7 Flash. Архитектура модели аналогична предыдущей, но добавлен визуальный энкодер (Vision Encoder), позволяющий ей понимать изображения. Функция рассуждений теперь настраиваема, что позволяет избежать накопления большого количества токенов для простых вопросов и особенно полезна для агентных (agentic) задач. Как и многие китайские модели, ее предшественница подвергалась строгой цензуре; версия 3.7 изменилась незначительно, но модель выдает факты в области рассуждений, которые затем подавляются в финальном ответе, что, очевидно, является результатом ограничений (guardrails), наложенных на этапе финального обучения. В остальном ответы в основном корректны. Интересно, что на немецком языке процесс рассуждения в основном ведется на немецком, в то время как такие слова-прерыватели, как "wait", остаются на английском, что отличает ее от почти всех других моделей, рассуждающих только на английском. Сообщество высоко оценивает модель, особенно в сочетании с кодирующими агентами (Coding Agents). На сайте StepFun ее показатели значительно превосходят старые модели и даже обходят DeepSeek V4 Flash. Результаты Step 3.7 Flash можно найти в GitHub-репозитории этой статьи.

Модель M3 от MiniMax, хотя и обозначена как "открытый вес" (Open Weight), пока недоступна для загрузки весов на Hugging Face, ее можно опробовать только напрямую через MiniMax.ai или OpenRouter. MiniMax оптимизировала архитектуру внимания: первый этап определяет, какие токены важны, а второй этап передает эти токены для полного вычисления внимания. MiniMax утверждает, что M3 обрабатывает подсказки (prompts) почти в десять раз быстрее, чем M2, а скорость генерации даже в 15 раз выше. Публичных бенчмарков пока нет, но собственные данные MiniMax показывают, что в области кодирования, если данные точны, она может соперничать с лучшими моделями Anthropic. Результаты MiniMax M3 можно найти в GitHub-репозитории этой статьи.

Liquid AI использует уникальную архитектуру для своих Liquid Foundation Models, что делает генерацию токенов чрезвычайно эффективной и позволяет хорошо работать на CPU. Новая модель LFM2.5-8B-A1B имеет всего один миллиард активных параметров и предназначена для конкуренции с более крупными моделями, такими как gpt-oss-20b, Qwen3-30B-A3B-Thinking-2507 и Gemma-4-26B-A4B-IT. На Mac Studio M2 Ultra модель достигает скорости почти 200 токенов/сек, хотя и не может полностью сравниться с большими моделями, но подходит для специализированных приложений или агентных сценариев. Результаты LFM2.5-8B-A1B можно найти в GitHub-репозитории этой статьи.

Nvidia выпустила несколько обновлений моделей. Модель LocateAnything может использоваться для анализа изображений, выводя ограничивающие рамки с определенными объектами; ее процесс обработки высокопараллелен и даже может анализировать отсканированные документы, что полезно для распознавания элементов GUI и управления браузером через агентов. Модель имеет объем около 8 ГБ и может работать на потребительских GPU. Декодер пиксельной диффузии (Pixel Diffusion Decoder) представляет новую модель диффузии в пиксельном пространстве, но работа с ним все еще сложна: необходимо загрузить контрольную точку со страницы Hugging Face и обрабатывать ее с помощью специальной программы. Модель Nemotron 3 Ultra имеет 550 миллиардов параметров, из которых 55 миллиардов активны, использует тип данных NVFP4 и оптимизированный механизм внимания (с большим количеством слоев Mamba), а длина контекста может достигать 1 миллиона токенов. Однако Nemotron 3 Ultra пока не догнал китайские модели с открытым исходным кодом. Как и все модели Nemotron, Nvidia предоставляет большую часть обучающих данных и кода, что делает ее очень открытой с точки зрения прозрачности, и только гораздо меньшие по размеру AI-компании, такие как Olmo или Apertus, имеют аналогичный уровень. Из ответов чувствуется западное происхождение модели: в то время как китайские модели осторожно уклоняются, эта модель часто дает более четкие, политически нейтральные или отличающиеся ответы. Результаты Nemotron 3 Ultra можно найти в GitHub-репозитории этой статьи.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Китайско-австралийское сотрудничество в разработке наночипа для улучшения визуализации
2026-06-17
Сингапурская компания в области искусственного интеллекта Univers запускает физическую AI-платформу для управления активами мощностью более 1000 ГВт
2026-06-17
GFiber сотрудничает с Quext, поставщиком технологий для интеллектуальной недвижимости, запуская 3-гигабитный оптоволоконный интернет в Pacifica Place, Калифорния
2026-06-17
Ангольская телекоммуникационная компания Mercury подписала многомиллионное спутниковое соглашение с Eutelsat
2026-06-17
Компания Unity официально поддерживает XR-очки
2026-06-17
Южнокорейская компания S2W, специализирующаяся на искусственном интеллекте и анализе больших данных, совместно с E-Papyrus представила AI-решение для электронных документов Streamdocs AI
2026-06-17
Южнокорейская GS Neotek и китайская Tencent Cloud подписали соглашение о совместном продвижении услуг CDN и глобальных облачных сервисов
2026-06-17
AMD из США объявила о крупном приобретении, направленном на развитие технологий оптимизации памяти
2026-06-17
Google Cloud запускает платформу безопасности в Корее, сокращая время расследования до 1 минуты
2026-06-17
Корейское агентство по продвижению интернета выбрало 6 консорциумов для запуска проекта национальной системы кибербезопасности на сумму 4,5 млрд вон
2026-06-17
Последние новости
1
Peru: Panoro Minerals подписывает соглашение с общиной для продвижения медно-золото-серебряного проекта Cotabambas
2
Компания Eminent Gold из Невады начнет бурение на 10 000 метров в июле
3
Victoria Lake Gold усиливает команду для продвижения золотого проекта Imwelo в Танзании
4
Канадская Orestone потратила 112 000 канадских долларов на аэрогеофизическую съемку методом электромагнитного зондирования для поиска золото-медно-порфировых месторождений
5
Канадская компания Juno Corp. запускает крупнейшую за последние десять лет программу разведки в лагере «Огненное кольцо»
6
Американский производитель промышленного оборудования Martin Engineering представляет интеллектуальную систему для пневмопушек
7
Группа Dangote планирует расширить производство удобрений в Нигерии и Эфиопии с целью ежегодного экспорта на сумму 4 миллиарда долларов
8
Немецкая компания Covestro получила грант в размере 7 миллионов евро на запуск проекта непрерывного производства биологического анилина
9
Завод Evonik в Турции получил сертификат ISCC Plus и представил ULTRASIL eCO
10
Nippon Paint объявляет о планах расширения в Индии: строительство восьми новых заводов с инвестициями в 56 млн евро