Китайский Tencent Cloud совместно с американской Soniox интегрирует транскрипцию речи в реальном времени в глобальную коммуникационную инфраструктуру
2026-06-02 15:55
В избр.

Репортаж от Wedoany,Китайский Tencent Cloud недавно заключил стратегическое партнёрство с американской компанией Soniox, специализирующейся на голосовом ИИ из Сан-Франциско, интегрировав технологию транскрипции речи Soniox в глобальную инфраструктуру Tencent Cloud TRTC для аудио- и видеосвязи в реальном времени. Это позволит предоставлять возможности разработки приложений для многозычной транскрипции речи в реальном времени с низкой задержкой для корпоративных сценариев, таких как интеллектуальные службы поддержки, голосовые помощники, перевод в реальном времени и транскрипция совещаний.

Это сотрудничество находится на стыке «обработки языка и связи в реальном времени», а его основная цель — снизить порог развёртывания глобальных голосовых ИИ-приложений для предприятий. Soniox предоставляет возможности высокоточного распознавания речи с низкой задержкой, поддерживает более 60 языков и может обрабатывать сценарии переключения между разными языками в одном предложении; Tencent Cloud TRTC, в свою очередь, предоставляет корпоративную сеть связи в реальном времени, охватывающую более 3200 глобальных узлов, с задержкой по всему миру менее 300 миллисекунд, возможностями шумоподавления на основе ИИ и устойчивостью к слабым сетям. После объединения разработчики смогут напрямую интегрировать интерфейс транскрипции речи Soniox в консоли Tencent Cloud для создания кроссплатформенных голосовых ИИ-приложений. Для предприятий в сферах трансграничной электронной коммерции, онлайн-образования, удалённых совещаний, корпоративного сотрудничества, игровых социальных сетей, финансовых служб поддержки и международных SaaS-компаний голосовые приложения ранее сталкивались с тремя основными проблемами: во-первых, значительные различия в качестве сетей в разных странах, что приводит к задержкам и потере пакетов при передаче речи в реальном времени; во-вторых, многозычное распознавание требует адаптации к разным моделям и интерфейсам, что увеличивает затраты на разработку и обслуживание; в-третьих, сценарии, такие как службы поддержки, перевод и протоколирование совещаний, предъявляют высокие требования к точности и скорости ответа, и полагаться только на модель распознавания речи или только на канал связи для обеспечения стабильного опыта затруднительно. Объединив сеть связи в реальном времени и технологию транскрипции речи в одном канале доставки, Tencent Cloud и Soniox помогают предприятиям интегрировать ввод, передачу, распознавание речи, вывод текста и последующую обработку ИИ в более полную инфраструктуру речи в реальном времени, вместо того чтобы отдельно компоновать услуги связи, распознавания речи и модули многозычной обработки.

Это сотрудничество поддерживает разработку голосовых приложений для предприятий, ориентированных на англоязычный рынок, а также на многозычные рынки, включая арабский, хинди, малайский и другие языки. Направления применения включают интеллектуальные службы поддержки, голосовые помощники, перевод в реальном времени и транскрипцию совещаний.

Корпоративный голосовой ИИ переходит от точечных функций к этапу производственного развёртывания. Раньше транскрипция речи в основном использовалась для записи совещаний, создания субтитров или обработки записей служб поддержки, при этом методы обработки были в основном офлайн-транскрипцией и однозычным распознаванием; с распространением генеративного ИИ, роботов службы поддержки в реальном времени, трансграничного сотрудничества и интеллектуального оборудования, голос становится важным входным каналом для корпоративных приложений. На реальное внедрение влияет не только способность модели распознавания понять произнесённую фразу, но и качество канала передачи голоса от пользователя в облако, скорость возврата результатов распознавания, стабильность в условиях слабой сети, способность к непрерывному распознаванию в сценариях смешения языков, а также возможность плавного подключения к большим языковым моделям, базам знаний, системам обработки заявок и системам перевода. Tencent Cloud TRTC предоставляет глобальные узлы и возможности низкой задержки на уровне передачи аудио и видео в реальном времени, а Soniox — многозычное распознавание и обработку переключения в рамках одного предложения на уровне транскрипции речи. Объединившись, предприятия могут быстрее встраивать голосовой вход в центры обслуживания клиентов, онлайн-совещания, трансграничные прямые трансляции, удалённое обучение и мобильные приложения. Для индустрии информационных и коммуникационных технологий такое сотрудничество также показывает, что платформы связи в реальном времени превращаются из инструментов аудио- и видеозвонков в базовый канал для голосового ИИ, перевода, сотрудничества и автоматизированных услуг. В будущем тот, кто сможет объединить каналы связи, распознавание речи, многозычную обработку и ИИ-приложения в единую платформу, сможет легче обслуживать потребности предприятий в глобальном развёртывании и многозычном обслуживании пользователей.

Последующие переменные этого сотрудничества сосредоточены на скорости внедрения корпоративными клиентами, стабильности многозычного распознавания в реальных шумовых условиях, интерфейсной координации с приложениями на основе больших языковых моделей, а также на требованиях к соответствию данных в разных странах и регионах. По мере того как всё больше предприятий выводят на глобальный рынок службы поддержки, совещания, обучение и маркетинговые мероприятия, транскрипция речи в реальном времени перестанет быть просто вспомогательной функцией, а станет важной базовой возможностью для межъязыковой коммуникации, автоматизированных услуг и интеллектуального управления. Сотрудничество Tencent Cloud и Soniox предоставляет новый образец продуктового портфеля для китайских облачных провайдеров и американских компаний в сфере голосового ИИ на глобальном рынке корпоративных коммуникаций.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Компания Keysight Technologies (США) получила сертификацию Hybrid eCall, знаменуя переход систем экстренной связи подключённых автомобилей к гибридным сетям 4G/5G
2026-06-02
NTT (Япония) представила мультимодальную объяснимую структуру ИИ для рассуждений, модели визуального языка переходят к этапу калибровки достоверных выходных данных
2026-06-02
Компания Hyland из США запускает платформу управления корпоративными агентами, а программное обеспечение для управления контентом переходит к производственному ИИ-управлению
2026-06-02
Американская компания Allstacks запустила Product Studio: корпоративная разработка ПО переходит от генерации кода к управлению требованиями
2026-06-02
Американская DXC объединяет 11 000 инженеров: корпоративная поставка ПО переходит от пилотных проектов ИИ к производственным системам
2026-06-02
Южнокорейская компания TELICA выпускает стартовый набор электронных ценников, снижая порог внедрения цифровизации для малого и среднего розничного бизнеса
2026-06-02
Сингапурская SynaXG совместно с японской NHI запускает мобильное решение AI-RAN, частная сеть 5G может быть быстро развернута на месте
2026-06-02
Китайская Fibocom совместно с Luxshare Precision представила технологию 5G Dongle, модули связи переходят к интеллекту на периферии
2026-06-02
ASUS (Тайвань, Китай) представляет ZenWiFi BN12: начало эры высоконадёжных подключений для домашних сетей Wi-Fi 8
2026-06-02
Тайваньская компания SSSTC представила твердотельные накопители для иммерсионного охлаждения
2026-06-02
Последние новости
1
Metrolinx (Канада) начинает расширение станции GO в Оквилле
2
Порт Лонг-Бич получил федеральное финансирование в размере 283 миллионов долларов на железнодорожный проект Pier B
3
Inchcape Shipping Services запускает услуги NVOCC в США
4
Норвежская G2 Ocean добавит шесть новых судов с открытыми трюмами и портальными кранами к 2029 году
5
Французская Servier планирует приобрести бизнес по мышечной дистрофии американской Edgewise за $2,65 млрд, усиливая портфель редких неврологических заболеваний
6
Hino Australia представляет дизельные модели серии 300 стандарта Евро-6
7
Textron Aviation расширяет ангар для лётных испытаний площадью 57000 квадратных футов в Уичито, США
8
Американская компания SyberJet представит полноразмерный макет SJ36 в октябре 2026 года
9
PLD Space планирует инвестировать 35 миллионов евро в космический центр Гвианы в 2025-2026 годах
10
Venturi Space инвестирует 250 миллионов евро в строительство технологического центра во Франции к 2030 году