Репортаж от Wedoany,Nvidia продолжает расширять свой портфель, добавляя несколько моделей, причем крупнейшая из них пока только анонсирована. Тем временем Microsoft на конференции Build в начале июня представила ряд моделей, но, к сожалению, все они с закрытым исходным кодом, что еще больше отдаляет ее от OpenAI.
Шанхайская AI-компания StepFun, успешно запустившая весной модель 3.5, выпустила новую модель рассуждений Step 3.7 Flash. Архитектура модели аналогична предыдущей, но добавлен визуальный энкодер (Vision Encoder), позволяющий ей понимать изображения. Функция рассуждений теперь настраиваема, что позволяет избежать накопления большого количества токенов для простых вопросов и особенно полезна для агентных (agentic) задач. Как и многие китайские модели, ее предшественница подвергалась строгой цензуре; версия 3.7 изменилась незначительно, но модель выдает факты в области рассуждений, которые затем подавляются в финальном ответе, что, очевидно, является результатом ограничений (guardrails), наложенных на этапе финального обучения. В остальном ответы в основном корректны. Интересно, что на немецком языке процесс рассуждения в основном ведется на немецком, в то время как такие слова-прерыватели, как "wait", остаются на английском, что отличает ее от почти всех других моделей, рассуждающих только на английском. Сообщество высоко оценивает модель, особенно в сочетании с кодирующими агентами (Coding Agents). На сайте StepFun ее показатели значительно превосходят старые модели и даже обходят DeepSeek V4 Flash. Результаты Step 3.7 Flash можно найти в GitHub-репозитории этой статьи.
Модель M3 от MiniMax, хотя и обозначена как "открытый вес" (Open Weight), пока недоступна для загрузки весов на Hugging Face, ее можно опробовать только напрямую через MiniMax.ai или OpenRouter. MiniMax оптимизировала архитектуру внимания: первый этап определяет, какие токены важны, а второй этап передает эти токены для полного вычисления внимания. MiniMax утверждает, что M3 обрабатывает подсказки (prompts) почти в десять раз быстрее, чем M2, а скорость генерации даже в 15 раз выше. Публичных бенчмарков пока нет, но собственные данные MiniMax показывают, что в области кодирования, если данные точны, она может соперничать с лучшими моделями Anthropic. Результаты MiniMax M3 можно найти в GitHub-репозитории этой статьи.
Liquid AI использует уникальную архитектуру для своих Liquid Foundation Models, что делает генерацию токенов чрезвычайно эффективной и позволяет хорошо работать на CPU. Новая модель LFM2.5-8B-A1B имеет всего один миллиард активных параметров и предназначена для конкуренции с более крупными моделями, такими как gpt-oss-20b, Qwen3-30B-A3B-Thinking-2507 и Gemma-4-26B-A4B-IT. На Mac Studio M2 Ultra модель достигает скорости почти 200 токенов/сек, хотя и не может полностью сравниться с большими моделями, но подходит для специализированных приложений или агентных сценариев. Результаты LFM2.5-8B-A1B можно найти в GitHub-репозитории этой статьи.
Nvidia выпустила несколько обновлений моделей. Модель LocateAnything может использоваться для анализа изображений, выводя ограничивающие рамки с определенными объектами; ее процесс обработки высокопараллелен и даже может анализировать отсканированные документы, что полезно для распознавания элементов GUI и управления браузером через агентов. Модель имеет объем около 8 ГБ и может работать на потребительских GPU. Декодер пиксельной диффузии (Pixel Diffusion Decoder) представляет новую модель диффузии в пиксельном пространстве, но работа с ним все еще сложна: необходимо загрузить контрольную точку со страницы Hugging Face и обрабатывать ее с помощью специальной программы. Модель Nemotron 3 Ultra имеет 550 миллиардов параметров, из которых 55 миллиардов активны, использует тип данных NVFP4 и оптимизированный механизм внимания (с большим количеством слоев Mamba), а длина контекста может достигать 1 миллиона токенов. Однако Nemotron 3 Ultra пока не догнал китайские модели с открытым исходным кодом. Как и все модели Nemotron, Nvidia предоставляет большую часть обучающих данных и кода, что делает ее очень открытой с точки зрения прозрачности, и только гораздо меньшие по размеру AI-компании, такие как Olmo или Apertus, имеют аналогичный уровень. Из ответов чувствуется западное происхождение модели: в то время как китайские модели осторожно уклоняются, эта модель часто дает более четкие, политически нейтральные или отличающиеся ответы. Результаты Nemotron 3 Ultra можно найти в GitHub-репозитории этой статьи.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









