Репортаж от Wedoany,Китайский Tencent Cloud недавно заключил стратегическое партнёрство с американской компанией Soniox, специализирующейся на голосовом ИИ из Сан-Франциско, интегрировав технологию транскрипции речи Soniox в глобальную инфраструктуру Tencent Cloud TRTC для аудио- и видеосвязи в реальном времени. Это позволит предоставлять возможности разработки приложений для многозычной транскрипции речи в реальном времени с низкой задержкой для корпоративных сценариев, таких как интеллектуальные службы поддержки, голосовые помощники, перевод в реальном времени и транскрипция совещаний.
Это сотрудничество находится на стыке «обработки языка и связи в реальном времени», а его основная цель — снизить порог развёртывания глобальных голосовых ИИ-приложений для предприятий. Soniox предоставляет возможности высокоточного распознавания речи с низкой задержкой, поддерживает более 60 языков и может обрабатывать сценарии переключения между разными языками в одном предложении; Tencent Cloud TRTC, в свою очередь, предоставляет корпоративную сеть связи в реальном времени, охватывающую более 3200 глобальных узлов, с задержкой по всему миру менее 300 миллисекунд, возможностями шумоподавления на основе ИИ и устойчивостью к слабым сетям. После объединения разработчики смогут напрямую интегрировать интерфейс транскрипции речи Soniox в консоли Tencent Cloud для создания кроссплатформенных голосовых ИИ-приложений. Для предприятий в сферах трансграничной электронной коммерции, онлайн-образования, удалённых совещаний, корпоративного сотрудничества, игровых социальных сетей, финансовых служб поддержки и международных SaaS-компаний голосовые приложения ранее сталкивались с тремя основными проблемами: во-первых, значительные различия в качестве сетей в разных странах, что приводит к задержкам и потере пакетов при передаче речи в реальном времени; во-вторых, многозычное распознавание требует адаптации к разным моделям и интерфейсам, что увеличивает затраты на разработку и обслуживание; в-третьих, сценарии, такие как службы поддержки, перевод и протоколирование совещаний, предъявляют высокие требования к точности и скорости ответа, и полагаться только на модель распознавания речи или только на канал связи для обеспечения стабильного опыта затруднительно. Объединив сеть связи в реальном времени и технологию транскрипции речи в одном канале доставки, Tencent Cloud и Soniox помогают предприятиям интегрировать ввод, передачу, распознавание речи, вывод текста и последующую обработку ИИ в более полную инфраструктуру речи в реальном времени, вместо того чтобы отдельно компоновать услуги связи, распознавания речи и модули многозычной обработки.
Это сотрудничество поддерживает разработку голосовых приложений для предприятий, ориентированных на англоязычный рынок, а также на многозычные рынки, включая арабский, хинди, малайский и другие языки. Направления применения включают интеллектуальные службы поддержки, голосовые помощники, перевод в реальном времени и транскрипцию совещаний.
Корпоративный голосовой ИИ переходит от точечных функций к этапу производственного развёртывания. Раньше транскрипция речи в основном использовалась для записи совещаний, создания субтитров или обработки записей служб поддержки, при этом методы обработки были в основном офлайн-транскрипцией и однозычным распознаванием; с распространением генеративного ИИ, роботов службы поддержки в реальном времени, трансграничного сотрудничества и интеллектуального оборудования, голос становится важным входным каналом для корпоративных приложений. На реальное внедрение влияет не только способность модели распознавания понять произнесённую фразу, но и качество канала передачи голоса от пользователя в облако, скорость возврата результатов распознавания, стабильность в условиях слабой сети, способность к непрерывному распознаванию в сценариях смешения языков, а также возможность плавного подключения к большим языковым моделям, базам знаний, системам обработки заявок и системам перевода. Tencent Cloud TRTC предоставляет глобальные узлы и возможности низкой задержки на уровне передачи аудио и видео в реальном времени, а Soniox — многозычное распознавание и обработку переключения в рамках одного предложения на уровне транскрипции речи. Объединившись, предприятия могут быстрее встраивать голосовой вход в центры обслуживания клиентов, онлайн-совещания, трансграничные прямые трансляции, удалённое обучение и мобильные приложения. Для индустрии информационных и коммуникационных технологий такое сотрудничество также показывает, что платформы связи в реальном времени превращаются из инструментов аудио- и видеозвонков в базовый канал для голосового ИИ, перевода, сотрудничества и автоматизированных услуг. В будущем тот, кто сможет объединить каналы связи, распознавание речи, многозычную обработку и ИИ-приложения в единую платформу, сможет легче обслуживать потребности предприятий в глобальном развёртывании и многозычном обслуживании пользователей.
Последующие переменные этого сотрудничества сосредоточены на скорости внедрения корпоративными клиентами, стабильности многозычного распознавания в реальных шумовых условиях, интерфейсной координации с приложениями на основе больших языковых моделей, а также на требованиях к соответствию данных в разных странах и регионах. По мере того как всё больше предприятий выводят на глобальный рынок службы поддержки, совещания, обучение и маркетинговые мероприятия, транскрипция речи в реальном времени перестанет быть просто вспомогательной функцией, а станет важной базовой возможностью для межъязыковой коммуникации, автоматизированных услуг и интеллектуального управления. Сотрудничество Tencent Cloud и Soniox предоставляет новый образец продуктового портфеля для китайских облачных провайдеров и американских компаний в сфере голосового ИИ на глобальном рынке корпоративных коммуникаций.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









