Репортаж от Wedoany,2–3 июня на конференции Build 2026 компания Microsoft (США) анонсировала обновление Windows AI APIs, включив в него API распознавания речи на стороне клиента, а также представила малые языковые модели Aion 1.0 Instruct и Aion 1.0 Plan, предназначенные для локального выполнения. Эти возможности ориентированы в первую очередь на разработчиков Windows 11 и позволяют реализовать преобразование речи в текст, интеллектуальную обработку текста и выполнение локальных агентных задач на персональных компьютерах.
Данное обновление переносит возможности обработки языка непосредственно на конечные устройства. Новый API распознавания речи поддерживает генерацию результатов транскрипции в реальном времени или пакетно из микрофона, аудиопотоков и аудиофайлов, что может использоваться для создания субтитров, голосового ввода, аудио- и видеоприложений, а также инструментов доступности. Microsoft подчеркивает, что при локальном выполнении эта возможность позволяет генерировать транскрипцию даже без подключения к сети, снижая зависимость от облачных вычислений. Для корпоративного ПО, инструментов для совещаний, полевой записи на производстве, удаленного обслуживания и систем обучения ценность локального распознавания речи заключается в снижении задержек, уменьшении затрат на облачные вызовы и возможности обработки части конфиденциальных речевых данных непосредственно на устройстве. По мере проникновения ИИ в офисные и отраслевые конечные устройства распознавание речи превращается из отдельного функционального модуля в базовую возможность на уровне операционной системы.
Aion 1.0 Instruct позиционируется как малая языковая модель для рабочих нагрузок на стороне клиента, способная выполнять такие интеллектуальные задачи с текстом, как создание сводок, перефразирование, распознавание намерений и задачи, связанные с доступностью.
Aion 1.0 Plan, в свою очередь, предназначена для сценариев локального агентного вывода. Модель имеет 14 миллиардов параметров, поддерживает контекстную длину в 32 000 токенов и возможность вызова инструментов, помогая приложениям понимать намерения пользователя, вызывать инструменты, управлять файлами и координировать работу подчиненных агентов. Microsoft планирует запускать эту модель как часть Windows на подходящих устройствах, перемещая часть агентных процессов из облака на локальные устройства. Для разработчиков это означает, что в будущем настольные приложения смогут напрямую вызывать возможности понимания текста, распознавания речи и оркестровки инструментов на уровне операционной системы, без необходимости интеграции внешних модельных сервисов для каждого приложения отдельно. Для ИТ-отделов предприятий локальные модели также порождают новые вопросы управления, включая права доступа моделей, границы доступа к файлам, идентификацию пользователей, хранение данных, производительность устройств и межприкладной аудит. Возможность масштабного внедрения в корпоративные сценарии будет зависеть от синхронного развития локальных ИИ-возможностей и механизмов безопасности управления.
Microsoft также объявила о расширении Windows AI APIs на большее количество компьютеров с Windows 11. Помимо NPU, некоторые возможности будут поддерживаться на CPU и GPU. На начальном этапе API распознавания речи будет работать преимущественно с английским языком, а в дальнейшем его поддержка будет постепенно расширяться на другие мировые рынки. С включением локальных моделей, распознавания речи и агентных возможностей в экосистему разработки Windows, технологии обработки языка переходят из облачных сервисных интерфейсов на уровень операционной системы конечных устройств, становясь важным базовым компонентом для разработки приложений, доступного взаимодействия и интеллектуальных корпоративных рабочих процессов.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









