Репортаж от Wedoany,Исландский стартап Treble разработал акустическую программу на основе физического моделирования, призванную заменить традиционные методы, основанные на многочисленных пробах и ошибках в текущей разработке звуков для ИИ, и помочь инженерам создавать звуки, генерируемые ИИ, для роботов, носимых устройств и других интеллектуальных устройств. Компания была основана 5 лет назад, штаб-квартира находится в Исландии.
Платформа Treble использует запатентованные алгоритмы в области акустического моделирования и пространственного звука. Компания утверждает, что эти алгоритмы способны достигать акустической реалистичности с точностью, сопоставимой с измерительной, со скоростью, значительно превышающей существующие методы моделирования. «Звук всегда игнорировался, — заявил генеральный директор Treble Финнур Пинд в интервью Design News. — ИИ необходимо обучать, чтобы научить роботов распознавать звуки и речь. ИИ должен пройти через множество звуковых сценариев». Пинд объяснил Design News, что современные методы акустического моделирования основаны на геометрической акустике, которая включает высокочастотные приближения звука, и этот метод не всегда точен. В отличие от этого, метод акустического моделирования Treble основан на численном волновом акустическом моделировании, которое напрямую решает волновое уравнение, улавливая такие волновые явления, как дифракция, фаза и рассеяние.
Производительность аудио-ИИ зависит от таких акустических факторов, как акустика помещения и реверберация, расстояние и локализация источника звука, конкурирующие динамики и фоновый шум, а также характеристики микрофона и расположение устройства. Более точное акустическое моделирование позволяет улучшить многоканальное усиление речи и снизить частоту ошибок в словах. Гибридный алгоритм Treble превосходит традиционное программное обеспечение за счет точного моделирования однократных отражений, дифракции и динамики связанных помещений, что позволяет достичь точного моделирования в сложных сценариях и улавливать низкочастотные эффекты, упускаемые другими методами.
Treble также может реализовать реалистичное моделирование распространения собственного голоса и акустики многомикрофонных устройств, генерируя высококачественные обучающие и тестовые данные для голосового ИИ, наушников, вкладышей и передовых систем микрофонных решеток. Компания заявляет, что платформа моделирования может использоваться для голосового ИИ и диалоговых систем, генерации синтетических аудиоданных, виртуального прототипирования аудиооборудования, робототехники и встроенного ИИ, автомобильной акустики и информационно-развлекательных систем, а также пространственного звука и иммерсивных данных. Пинд прогнозирует, что эта платформа моделирования сократит время разработки этих приложений.
Учитывая широкую вариативность речи, Treble разработала рейтинг, предоставляющий всесторонние, удобные и управляемые сообществом эталонные тесты для оценки производительности автоматического распознавания речи, отражающей реальные сценарии развертывания. Условия оценки основаны на реальных сценариях удаленного поля конечных пользователей, а результаты эталонных тестов разбиты по различным сценариям (например, легкий, средний, сложный) для предоставления более детальной информации. По словам Пинда, Treble будет совершенствовать будущие версии платформы звука для ИИ, делая инструмент более доступным для пользователей без знаний в области акустики.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









