Репортаж от Wedoany,Недавно американская компания Deepgram, специализирующаяся на инфраструктуре голосового ИИ в реальном времени, заключила партнерство с компанией по обеспечению безопасности данных Fortanix. Используя возможности Fortanix Confidential AI и конфиденциальных вычислений NVIDIA, партнеры предлагают решение для развертывания голосового ИИ в локальной среде для регулируемых отраслей. Решение ориентировано на такие сценарии, как здравоохранение, финансы, государственный сектор, корпоративное обслуживание клиентов и внутренние операции, с особым акцентом на защиту голосовых данных и весов моделей во время вывода.
Это сотрудничество переводит конкуренцию в сфере голосового ИИ от точности распознавания, низкой задержки и многоязычности к вопросу «возможности работы в высокочувствительных бизнес-средах». Во многих отраслях голосовые данные содержат значительный объем конфиденциальной информации и коммерческих секретов, например, диалоги врача и пациента, записи финансовых транзакций, идентификационные данные клиентов, содержание корпоративных совещаний, процессы обработки заявок и внутренние запросы в службу поддержки. Традиционные облачные решения для распознавания речи или голосовые агенты, хотя и обеспечивают быстрое подключение, часто сталкиваются с ограничениями в отношении местонахождения данных, соответствия требованиям аудита, защиты интеллектуальной собственности моделей и внутренних границ безопасности. Deepgram использует путь локального развертывания, позволяя предприятиям запускать возможности распознавания речи, синтеза речи и преобразования речи в речь в собственной среде. Fortanix, в свою очередь, с помощью технологии Confidential AI и доверенных сред исполнения обеспечивает аппаратную изоляцию обрабатываемых аудиоданных и весов моделей, снижая риск кражи моделей, несанкционированного доступа к данным или раскрытия процесса вывода для нижележащей инфраструктуры.
Решение работает на GPU, поддерживающих конфиденциальные вычисления NVIDIA, при этом аудиоданные и веса моделей ИИ остаются зашифрованными и изолированными на этапе активной обработки. Deepgram, Fortanix и NVIDIA позиционируют эту комбинацию как предварительно интегрированный технологический стек для сред с высокими требованиями к безопасности.
Голос становится новым интерфейсом для корпоративных систем. Раньше запись звонков в колл-центрах, протоколы совещаний, контроль качества обслуживания и транскрибация речи были в основном процессами постобработки: компании загружали аудио поставщику услуг, а затем получали текст, резюме или результаты анализа. С появлением голосовых агентов реального времени в обслуживании клиентов, медицинских записях, полевом ремонте, ИТ-сервисных службах и процессах комплаенс-контроля, голосовые данные напрямую участвуют в принятии бизнес-решений и автоматизации. Требования безопасности расширяются от «шифрования при хранении и передаче» до «защиты во время использования». Внедрение конфиденциальных вычислений решает критический разрыв в производственном развертывании голосового ИИ: модели и данные также нуждаются в изоляции во время выполнения на GPU, а администраторы платформы, нижележащая операционная система и инфраструктурная среда не должны иметь прямого доступа к незашифрованным данным или активам моделей. Для регулируемых предприятий такая возможность помогает запускать приложения голосового ИИ в реальном времени в пределах их собственных границ безопасности, сохраняя при этом взаимодействие с низкой задержкой.
Deepgram предоставляет возможности преобразования речи в текст, текста в речь и речи в речь, поддерживая развертывание через облачные API, самостоятельное размещение и локальные API. Компания сообщает, что более 200 000 разработчиков и 1400 организаций используют ее платформу, которая в совокупности обработала более 50 000 лет аудио и транскрибировала более 1 триллиона слов. Благодаря партнерству с Fortanix и NVIDIA, Deepgram может расширить свои возможности голосового ИИ, ориентированные в основном на разработчиков и платформенных клиентов, для больниц, банков, страховых компаний, государственных учреждений, внутренних сервисных служб предприятий и клиентов в отраслях с высокими требованиями к суверенитету данных. Роль Fortanix заключается в обеспечении безопасности данных, моделей ИИ и приложений на протяжении всего жизненного цикла в локальных, мультиоблачных и высокозащищенных средах, особенно в объединении конфиденциальных вычислений, контроля ключей, выполнения с нулевым доверием и защиты моделей.
Дальнейшие переменные сосредоточены на фактической стоимости внедрения для предприятий, доступности сред конфиденциальных вычислений на GPU, адаптации к требованиям комплаенс-аудита и степени воспроизводимости голосовых агентов в отраслевых процессах. Если решение сможет сформировать стабильные кейсы в регулируемых отраслях, способ развертывания голосового ИИ перейдет от «приоритета облачных вызовов» к гибридной архитектуре «локального запуска, защиты моделей и данных без выхода за границы». Для компаний, занимающихся распознаванием речи и диалоговым ИИ, будущая конкуренция будет одновременно сосредоточена на производительности моделей, работе в реальном времени, частной поставке, интеграции конфиденциальных вычислений и соответствии отраслевым нормативным требованиям.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









