Тестирование отечественных мультимодальных моделей: Step 3.7 Flash лидирует по скорости и стоимости
2026-07-02 14:25
В избр.

Репортаж от Wedoany,На фоне перехода мультимодальных моделей от демонстраций к промышленному внедрению три модели — Step 3.7 Flash, Qwen3.6-flash и MiniMax M3 — прошли практическое тестирование в сценариях разработки и бизнеса. Сравнительная оценка по двум задачам — распознаванию блок-схем и анализу документов — показала, что все три модели демонстрируют стабильное качество визуального понимания и структурированного вывода, однако различаются по скорости отклика и потреблению токенов.

Оценка проводилась по трём параметрам: качество, скорость и стоимость. Были выбраны два типа промышленных сценариев: первый — восстановление бизнес-логики по системной блок-схеме в процессе разработки агента, второй — структурированное извлечение данных из счетов-фактур через API в бизнес-системе. Тестирование показало, что ни одна из трёх моделей не допустила серьёзных ошибок распознавания, а качество вывода было достаточно высоким.

В сценарии понимания блок-схемы модель должна была точно извлечь 10 шагов бизнес-логики из блок-схемы авторизации в мини-программе WeChat. Step 3.7 Flash полностью распознала все 10 шагов, каждый из которых полностью соответствовал исходной блок-схеме. MiniMax M3 также выдала 10 шагов с корректной логикой. Qwen3.6-flash объединила шаги 3 и 4, выдав 9 шагов, но общая логика осталась верной. При сопоставимом качестве вывода Step 3.7 Flash показала самую высокую скорость отклика и наименьшее потребление токенов.

383e7fb0-8f2f-4fc3-81e1-fedf30adb60e.png

В другом тесте, ориентированном на бизнес-системы, модель должна была вывести ключевые поля из электронного счёта-фактуры в заданной JSON-структуре. Все три модели точно распознали и структурированно вывели необходимую информацию. Step 3.7 Flash выполнила задачу за 5,6 секунды, потребив 1409 токенов; MiniMax M3 — за 6,1 секунды, потребив 2216 токенов; Qwen3.6-flash — за 7,38 секунды, потребив 2008 токенов. Стоимость структурированного извлечения одного документа составила менее 1 фыня.

7c426d93-c9ae-43cc-be6a-cfe369eb38d5.png e128749a-634b-46ea-b46f-0638601bd7ae.png

По итогам двух тестов стабильность качества визуального понимания и структурированного вывода всех трёх моделей соответствует начальным производственным требованиям, ошибок извлечения не зафиксировано. Для сценариев с частыми вызовами агентов или бизнес-API ключевыми дифференцирующими показателями становятся задержка отклика и потребление токенов. В данном сравнении Step 3.7 Flash, сохраняя одинаковое качество вывода, демонстрирует более высокую скорость отклика и меньшую стоимость, что делает её предпочтительной для первоочередного тестирования в производственной среде.

f646fa29-a15a-4180-9aaa-d3df1fab0bf7.png
Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com
Связанные продукты
Связанные рекомендации
Китайская Alibaba интегрирует линейку продуктов Agent, выпуская AI-продукт для корпоративной производительности
2026-07-02
HD Hyundai Electric получила заказ на оборудование для центров обработки данных на сумму 1,12 трлн вон
2026-07-02
Американская компания Patmos планирует инвестировать 107 миллионов долларов в переоборудование склада в дата-центр в городе Индепенденс
2026-07-02
Группа Membrane Group India и Kurita Water Industries создали совместное предприятие для обслуживания полупроводниковой промышленности
2026-07-02
250 моделей роботов FANUC в Японии поддерживают физический ИИ
2026-07-02
Годовая выручка подразделения ИИ Microsoft в США превысила 37 миллиардов долларов, темпы роста составили 123%
2026-07-02
Vertiv открывает первый производственный центр в Юго-Восточной Азии в Малайзии для удовлетворения спроса на ИИ
2026-07-02
Schneider Electric и Foxconn объединяют усилия для развития инфраструктуры центров обработки данных ИИ
2026-07-02
Британская компания Saltroad привлекла £1,5 млн финансирования и приобрела AI-платформу Ogma
2026-07-02
Азербайджанская авиакомпания Silk Way West Airlines подписала цифровое соглашение с CargoAi
2026-07-02
Последние новости
1
Основной корпус второго шлюза судоходного узла Лунтоушань в провинции Цзянси будет завершен к концу августа, годовая пропускная способность увеличится до 37 млн тонн
2
Американская компания Patmos планирует инвестировать 107 миллионов долларов в переоборудование склада в дата-центр в городе Индепенденс
3
В штате Сан-Паулу (Бразилия) открыто 180-дневное окно для присоединения муниципалитетов к санитарной регионализации
4
SAS заказала 18 самолётов Airbus A330neo в июне
5
FAA США устанавливает новые обзорные радиолокаторы в трех аэропортах
6
Аэропорт Крэнфилд в Великобритании переименован в Лондон-Крэнфилд и расширяет деловую авиацию совместно с Weston Aviation
7
Британская компания Universal Piling & Geotechnical завершила установку 428-метровой сетки для защиты от камнепадов
8
Марокканская CMS внедряет платформу Winddle для обеспечения поставок материалов на строительные площадки
9
Французский FIF и Railenium объявляют конкурс инновационных проектов в сфере железных дорог с максимальным финансированием до 1,5 млн евро
10
Бернем из Великобритании представил крупнейший послевоенный план муниципального жилищного строительства и децентрализации