Семейство моделей Doubao компании ByteDance представило первую модель с полным модальным пониманием Doubao-Seed-2.0-lite
2026-05-07 11:44
В избр.

Репортаж от Wedoany,Принадлежащая ByteDance платформа Volcano Engine 6 мая 2026 года официально объявила о крупном обновлении семейства моделей Doubao — первой модели с полным модальным пониманием Doubao-Seed-2.0-lite. Ключевым аспектом этого обновления стало расширение способностей восприятия модели от единого понимания текста и изображений до нативного унифицированного понимания видео, изображений, аудио и текста, а также одновременное усиление способностей Agent (агент), Coding (программирование) и GUI (работа с графическим интерфейсом). При сопоставимых вычислительных затратах эта модель становится более оптимальным по соотношению цены и качества выбором для крупномасштабного, серийного развертывания задач полного модального логического вывода на предприятиях.

Президент Volcano Engine Тань Дай ранее отмечал, что индустрия ИИ все еще находится на ранней стадии развития, и ценообразование каждого поколения моделей Volcano Engine тщательно продумано. Хотя возможности моделей нового поколения значительно возросли, с учетом их интеллектуального уровня стоимость логического вывода за один токен фактически продолжает снижаться. Например, обновленная Doubao-Seed-2.0-lite значительно превосходит по производительности предыдущую флагманскую модель 1.8 Pro, но при этом имеет более низкую цену, что направлено на ускорение внедрения ИИ-приложений предприятиями в различных бизнес-сценариях.

Обновление Doubao-Seed-2.0-lite — это не просто косметические улучшения; модель демонстрирует значительный прирост производительности в ряде ключевых бенчмарков. Особого внимания заслуживает тот факт, что в задачах логического вывода по таким высокоуровневым дисциплинам, как физика (HiPhO) и медицина (MedXpertQA), эта модель значительно превзошла версию Doubao-Seed-2.0-pro, выпущенную в феврале этого года, что свидетельствует о качественном скачке в способности модели к пониманию сложной логики и профессиональных областей. Кроме того, в таких передовых областях, как детальное восприятие (BabyVision, WorldVQA) и воплощенное понимание (ERQA), Doubao-Seed-2.0-lite достигла передового отраслевого уровня (SOTA), что еще больше укрепляет ее потенциал для применения в сценариях с высокой ценностью.

Новая способность к пониманию речи — одна из главных особенностей этого обновления. Модель может одновременно обрабатывать визуальную и аудиальную информацию, выполняя кросс-модальный совместный логический вывод и точно определяя, совпадает ли «увиденное» и «услышанное» в видео. В области обработки аудио она не только поддерживает точную транскрипцию речи на 19 языках и взаимный перевод для 14 языков, включая китайский и английский, но и способна глубоко улавливать такие детали, как эмоциональные изменения в речи и фоновые звуки окружающей среды, что приближает ее восприятие к естественному человеческому познанию. Сообщается, что в бенчмарках по распознаванию и переводу речи обновленная модель превосходит даже известную модель Gemini-3.1-Pro.

Помимо скачка в способностях восприятия, Doubao-Seed-2.0-lite одновременно эволюционировала и в способностях к действию. Ее агентные способности были усилены: значительно улучшилось следование сложным многошаговым инструкциям в несколько раундов, а также появились более мощные способности к рефлексии задач, логическому выводу и координации работы нескольких агентов. В области программирования (Coding) возможности модели теперь полностью охватывают разработку фронтенд-страниц, 3D-сцен и даже игр; а совершенно новая способность GUI впервые позволила ИИ замкнуть цикл от «понимания интерфейса» до «практических действий», autonomously распознавая и управляя такими элементами приложений, как кнопки и меню.

В настоящее время новая версия Doubao-Seed-2.0-lite уже доступна на платформе Volcano Ark. Одновременно с ней была запущена и новая версия Doubao-Seed-2.0-mini, которая также поддерживает полное модальное понимание и отличается значительно сокращенной длительностью размышлений, что дополнительно повышает эффективность использования токенов. Эти обновления предоставляют предприятиям из самых разных областей — от онлайн-образования и анализа киберспортивных матчей до зарубежной электронной коммерции — более богатый и экономически эффективный выбор ИИ-инфраструктуры.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com
Связанные продукты
Связанные рекомендации
Salam открывает второй центр исследований и технологических инноваций в Эль-Хасе, Саудовская Аравия
2026-07-05
Samsung Galaxy S27 Ultra от Южной Кореи может получить аккумулятор на 5600–5800 мАч
2026-07-05
Starlink ускоряет цифровую трансформацию сельского хозяйства Бразилии
2026-07-05
Малайзийская группа Kuok планирует инвестировать 5,3 млрд евро в строительство центра обработки данных мощностью 300 МВт в Милане, Италия
2026-07-05
Доля доходов Airtel в Индии составляет 36%: компания расширяет 5G и углубляет финансовые услуги
2026-07-05
Израильская компания по кибербезопасности Dream привлекла $260 млн и планирует выход на рынок Латинской Америки
2026-07-05
Индийская Bharti Airtel расширяет покрытие сети на пути паломничества Амарнатх
2026-07-05
Авиакомпания United Airlines впервые развернула облачную развлекательную систему на борту Boeing 787-9
2026-07-05
В AIRI разработали нейросеть Genatator для аннотации генов
2026-07-05
Vodafone Ireland завершила первую в Европе демонстрацию экстренной связи с прямым подключением устройств к спутнику
2026-07-05
Последние новости
1
Японская компания Axelspace получила контракт JAXA на услуги по орбитальной демонстрации технологий на 2026 финансовый год
2
WSP оказывает консультационные услуги по первому этапу обоснования продления Шотландской пограничной железной дороги
3
Почта Японии с октября корректирует тарифы на посылки, средний рост составит около 10%
4
Frontier Airlines в июле прекращает все рейсы в Спокан, США
5
Программа NASA «Артемида» продвигает строительство базы на южном полюсе Луны
6
CMA CGM корректирует пиковую надбавку на маршруте Китай – Западная Африка (северный регион) до 200 долларов США за TEU
7
В Великобритании HS2 открывает центр найма на 30 000 рабочих мест в центре занятости Актона
8
Стоимость топлива для душа на A380 Emirates составляет около 100–400 долларов за рейс
9
Филиппинская авиакомпания Cebu Pacific в 2026 году доведет плотность кресел в экономклассе до 460 мест
10
Stellantis представит в Бразилии гибридный пикап с запасом хода 170 км