Репортаж от Wedoany,Компания Xiyu Technology (MiniMax) в прошлую пятницу (12 июня) открыла исходный код весов модели MiniMax M3 и одновременно опубликовала техническую статью MSA (MiniMax Sparse Attention). Недавно модель была официально выпущена в открытый доступ.
M3 — это флагманская нативная мультимодальная модель от MiniMax с общим количеством параметров 428B и активируемыми параметрами 23B. Будучи первой моделью с открытым исходным кодом, обученной с нуля на мультимодальных смешанных данных, M3 за две недели с момента выпуска заняла высшее место среди глобальных моделей с открытым исходным кодом в рейтинге комплексного интеллектуального индекса Artificial Analysis.
В ответ на проблемы с производительностью, вызванные ростом трафика, компания заявила, что ведёт постоянную оптимизацию. Скорость вывода модели M3 уже увеличена с примерно 30 TPS на момент запуска до примерно 80 TPS, и планируется дальнейшее повышение на 30–40% для улучшения эффективности ответов модели. В тестах по кодированию и агентным задачам M3 продемонстрировала способность к автономному разбиению задач, вызову инструментов и многошаговому рассуждению, а качество генерируемого кода описывается как готовое к непосредственному использованию. Исходный код модели опубликован на платформе Hugging Face по ссылке: https://huggingface.co/MiniMaxAI/MiniMax-M3.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









