Microsoft Build 2026: Microsoft представила 4 собственные ИИ-модели с посредственными результатами
2026-06-09 13:49
В избр.

Репортаж от Wedoany,На ежегодной конференции Build 2026 компания Microsoft представила несколько собственных ИИ-моделей, охватывающих области рассуждений, генерации изображений, транскрипции аудио и преобразования текста в речь. Пользователи могут бесплатно протестировать их на сайте Microsoft Playground. Тесты показали, что в целом эти модели демонстрируют приемлемые результаты, но не превосходят существующих конкурентов в своих областях.

Я протестировал все 4 новые ИИ-модели Microsoft. Суровая правда здесь

Серия моделей Microsoft MAI (Microsoft AI) основана на внутренних больших языковых моделях (LLM) и отличается от чат-бота Copilot, работающего на технологии OpenAI. В число представленных моделей входят: модель рассуждений MAI-Thinking-1, модели генерации изображений MAI-Image-2.5 и 2.5 Flash, модель транскрипции аудио MAI-Transcribe-1.5, а также модели преобразования текста в речь MAI-Voice-2 и 2 Flash. Microsoft называет эти модели «экспериментальными» и находящимися в состоянии «ограниченного предварительного просмотра». MAI-Thinking-1 в настоящее время доступна для раннего доступа только определённым пользователям.

MAI-Thinking-1, первая модель рассуждений от Microsoft, сравнивалась с моделью Claude Sonnet от Anthropic при обработке сложных запросов. Тесты показали, что модель Microsoft не имеет доступа к интернету и не демонстрирует значительных улучшений по сравнению с Sonnet в точности, качестве ответов или скорости при ответах на вопросы о механике игры Path of Exile 2 и построении структуры базы данных.

MAI-Image-2.5 значительно улучшилась по сравнению с первой версией от октября 2025 года, но всё ещё уступает Nano Banana Pro от Gemini в чёткости изображения и рендеринге текста. В ходе тестов в комиксах и диаграммах, созданных MAI-Image-2.5, наблюдались искажения текста, в то время как у Nano Banana Pro этой проблемы не было.

В тесте на транскрипцию модель MAI-Transcribe-1.5 допустила 13 ошибок, в то время как Gemini в том же сценарии допустила всего 6 ошибок. При расшифровке текста сложной песни обе модели допустили ошибки, но транскрипция MAI-Transcribe-1.5 оборвалась до окончания песни. Google не позиционирует Gemini специально как инструмент для транскрипции.

Ваш следующий компьютер — не компьютер: Microsoft Build 2026

MAI-Voice-2 предлагает множество языков и стилей, но в ходе тестов сочетание качества аудио, звуков дыхания, ритма и интонации приводило к тому, что голос звучал явно неестественно, далеко не достигая реалистичности таких голосовых технологий, как Sesame. В настоящее время модель поддерживает настройку голоса с помощью различных стилей.

Интерфейс MAI-Voice-2

Предварительные тесты с точки зрения потребителя показывают, что общая оценка моделей Microsoft MAI — «нормально», что аналогично производительности Copilot. Их конкурентоспособность больше зависит от широкого набора функций и интеграции в экосистему Microsoft, чем от абсолютного превосходства самих базовых моделей. Тем не менее, учитывая скорость улучшения серии MAI-Image за последние несколько месяцев, Microsoft продолжит тестирование этих моделей.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Китайская компания iFlytek представит интеллектуальную пространственную архитектуру SpaceMind
2026-06-09
Японская компания Brain AI Japan выпускает Natural AI Phone, эксклюзивно продаваемый SoftBank
2026-06-09
Verizon развертывает 5G в Северной Америке к 2026 году, объем данных на матч превысит 50 ТБ
2026-06-09
Cognizant выбран Channel 4 для модернизации рекламных операций
2026-06-09
В Риме запущен проект цифровых двойников деревьев, охватывающий 83,5 тысячи растений
2026-06-09
Италия и еще 17 стран присоединились к GUIDE для совместной защиты подводной инфраструктуры
2026-06-09
Новые правила FCC ужесточают контроль над подводными кабелями, что выгодно Meta и другим технологическим компаниям
2026-06-09
Deutsche Telekom и другие вскоре закроют услугу MMS
2026-06-09
Немецкая компания CODESYS представит технологии программно-определяемой автоматизации на выставке Automate 2026 в США
2026-06-09
Американский MSK и Sophia Genetics создают центр точной онкологии на базе ИИ
2026-06-09
Последние новости
1
Китайская компания iFlytek представит интеллектуальную пространственную архитектуру SpaceMind
2
Группа Phenna приобретает техасскую геотехническую компанию MLA Geotechnical
3
Южноафриканская компания Sasol инвестирует 60 миллионов евро в расширение производства специального глинозема в Германии
4
GHD приобретает инженерно-консалтинговую компанию Bowman Engineering в Техасе, США, для усиления транспортного направления на рынке инфраструктуры
5
Узбекистан запускает химические проекты на $17 млрд для модернизации промышленности
6
Pemex запускает программу восстановления нефтехимии и удобрений на 93 млрд песо
7
Американская компания Wold Architects & Engineers приобрела фирму JJCA из Нэшвилла
8
Американская инженерно-консалтинговая компания SGH расширяет команду консультантов по ограждающим конструкциям зданий в Атланте
9
Японская компания Brain AI Japan выпускает Natural AI Phone, эксклюзивно продаваемый SoftBank
10
Немецкая thyssenkrupp Uhde взялась за предпроектное проектирование двух заводов по производству «зеленого» аммиака в Бразилии