Репортаж от Wedoany,Компания Stability AI, работающая в сфере генеративного ИИ, 20 мая 2026 года официально выпустила новое семейство моделей генерации аудио Stable Audio 3.0, включающее четыре модели различных спецификаций. Топ-версия способна генерировать профессиональную музыку длительностью до 6 минут 20 секунд. Компания полностью интегрировала этот новый набор моделей со своей платформой для создания брендированного креативного контента «Brand Studio», запущенной в апреле, что знаменует собой официальный переход Stability AI от генерации отдельных изображений и видео к сквозной платформе для создания брендированного контента, где аудиовозможности становятся ключевым элементом этой трансформации.
Генеральный директор Stability AI Прем Аккараджу при запуске Brand Studio отметил, что для компаний, креативных специалистов, агентств и маркетинговых команд по всему миру постоянство бренда является вечным стремлением и самой большой проблемой. «От бренд-команд постоянно требуют создавать контент на большем количестве каналов, в большем количестве регионов и в более разнообразных форматах, сохраняя при этом уникальную идентичность бренда, что чрезвычайно сложно». Brand Studio была создана именно для решения этой задачи — платформа объединяет модели изображений, видео и новейшие аудиомодели Stability AI, позволяя брендам настраивать и фиксировать собственные визуальные и звуковые стандарты в едином рабочем процессе, гарантируя, что все создаваемые пользователями материалы соответствуют стилистике бренда.
Серия Stable Audio 3.0 включает четыре модели: Small SFX (459 млн параметров), Small (459 млн параметров), Medium (1,4 млрд параметров) и Large (2,7 млрд параметров). Две малые модели ориентированы на развертывание на устройствах и могут локально генерировать звуковые эффекты и музыку длительностью до 2 минут; средняя и большая модели обладают более мощным архитектурным контролем, позволяя создавать законченные музыкальные произведения длительностью до 6 минут 20 секунд и точно поддерживать музыкальную структуру и мелодическую основу. Эта длина более чем вдвое превышает возможности Stable Audio 2.0, выпущенной в 2024 году.
Что касается стратегии открытого исходного кода, Stability AI опубликовала модели Small SFX, Small и Medium с открытыми весами, чтобы сообщество могло свободно загружать, использовать и модифицировать их. Большая модель доступна только через API и платный самостоятельный хостинг, а предприятия с годовой выручкой более 1 миллиона долларов США должны приобрести отдельную корпоративную лицензию. Эта модель «открытое ядро + коммерческий контур» позволяет сохранять влияние в сообществе, одновременно выстраивая четкий путь коммерциализации для компании.
Безопасность коммерциализации — еще одна ключевая опора этого запуска. Stability AI подчеркивает, что все модели этой серии обучены исключительно на полностью лицензированных наборах данных. Ранее компания подписала соглашения о стратегическом сотрудничестве с Warner Music Group и Universal Music Group для совместной разработки инструментов ответственного создания музыки с помощью ИИ нового поколения. Недавно к Stability AI официально присоединился Итан Каплан (Ethan Kaplan), бывший директор по цифровым технологиям Universal Audio, возглавив направление профессиональных музыкальных продуктов. Эти шаги позволили Stability AI создать определенный барьер соблюдения авторских прав в области генерации музыки с помощью ИИ, что контрастирует с судебными исками о нарушении авторских прав, с которыми сталкиваются конкуренты, такие как Suno и Udio.
С точки зрения эволюции продукта, Stability AI прошла через несколько итераций в аудиосфере. В 2023 году была запущена Stable Audio, в 2024 году она была обновлена до версии 2.0 с добавлением функции редактирования аудио в аудио, а в 2025 году была выпущена Stable Audio 2.5 для корпоративных приложений с поддержкой настройки фирменных звуковых эффектов и восстановления аудио (inpainting). Выпуск версии 3.0 знаменует собой переход ее аудиомоделей на новый этап коммерческого применения по таким параметрам, как длительность генерации, контроль музыкальной структуры и возможность развертывания в различных спецификациях.
Brand Studio позиционируется Stability AI как «сквозная креативная платформа, основанная на силе бренда», основная идея которой заключается в том, чтобы позволить бренд-командам «фиксировать» визуальные и звуковые стандарты в рабочем процессе ИИ, тем самым сохраняя постоянство бренда при масштабном производстве контента. Платформа объединяет возможности генерации изображений, видео и аудио от Stability AI, позволяя пользователям выполнять полный цикл креативного производства — от графического дизайна до озвучивания видео — без необходимости переключения между несколькими инструментами.
Компания Stability AI, основанная в 2019 году со штаб-квартирой в Лондоне, Великобритания, является одним из представительных предприятий в области генеративного ИИ с открытым исходным кодом. Ее модель преобразования текста в изображение Stable Diffusion имеет обширную экосистему разработчиков по всему миру. Нынешний генеральный директор компании — Прем Аккараджу, бывший CEO Weta Digital, исполнительный председатель — соучредитель Napster Шон Паркер (Sean Parker), а в совет директоров входит известный режиссер Джеймс Кэмерон (James Cameron). По состоянию на сентябрь 2025 года оценка компании составляет около 1 миллиарда долларов США, совокупный объем привлеченных средств — около 400 миллионов долларов США, основными инвесторами являются Coatue Management, Lightspeed Venture Partners, Greycroft и Sound Ventures.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com










