Репортаж от Wedoany,Компания Anthropic выпустила последнюю версию своей флагманской модели Claude Opus 4.8, а также представила новую возможность оркестровки под названием «Динамические рабочие процессы» (Dynamic Workflows), предназначенную для решения сложных инженерных задач, таких как миграция крупномасштабных корпоративных кодовых баз, с помощью параллельных мультиагентных систем.
Будучи самой дорогой чистой компанией в сфере искусственного интеллекта в мире, Anthropic в настоящее время оценивается примерно в 965 миллиардов долларов США. Как рассказал Майк Кригер (Mike Kriegar), член технической команды компании и сооснователь Instagram, Claude Opus 4.8 — это самая мощная модель на сегодняшний день. В бенчмарке SWE-bench Pro её результат вырос с 64,3 до 69,2. Кроме того, модель значительно улучшила свою честность: вероятность того, что она «не заметит» дефекты в собственном коде, снизилась примерно в 4 раза по сравнению с предыдущей версией 4.7.
Динамические рабочие процессы в настоящее время доступны в виде исследовательской предварительной версии. Эта функция позволяет Claude создавать и управлять сетью, состоящей из нескольких специализированных ИИ-субагентов. Claude может динамически генерировать сценарии оркестровки, распределяя задачи между десятками или сотнями субагентов, каждый из которых отвечает за проверку различных частей кодовой базы, исследование проблем, верификацию результатов и отправку отчётов координирующей модели. Anthropic отмечает, что эта функция особенно полезна для поиска уязвимостей во всей кодовой базе, аудита безопасности и оптимизации, крупномасштабного переноса языков программирования, а также для высокорисковых задач, требующих состязательной верификации.

Повышение эффективности демонстрируется на примере использования этой функции. Джарред Самнер (Jarred Sumner), член технической команды Anthropic, основатель и генеральный директор языка программирования Bun, использовал динамические рабочие процессы для переноса Bun с Zig на Rust. Эта кодовая база, содержащая 750 тысяч строк кода, была объединена через 11 дней после первой фиксации, а уровень прохождения тестов достиг 99,8%. Традиционно выполнение аналогичного проекта командой специализированных инженеров занимает от 6 до 12 месяцев. Динамические рабочие процессы позволяют нескольким параллельным агентам сотрудничать и оспаривать выводы друг друга перед получением окончательного результата, что напоминает форму «снохождения» мультиагентного ИИ, когда одновременно исследуются несколько путей рассуждения перед принятием решения.

Claude Opus 4.8 также включает быстрый режим, скорость обработки которого может достигать 2,5-кратной по сравнению с обычной скоростью, а стоимость составляет одну треть от стоимости старой модели. Эта модель демонстрирует улучшенные показатели в бенчмарках по программированию, агентским навыкам, рассуждению и задачам, требующим практических знаний. Кроме того, модель специально обучена обозначать неопределённость, что особенно важно для организаций, развёртывающих её в критически важных бизнес-средах, требующих точности, прозрачности и управляемости. Anthropic также сообщила, что в ближайшие недели может быть выпущена ещё более мощная модель уровня Mythos, и в настоящее время для неё разрабатываются более надёжные меры защиты. Функция динамических рабочих процессов теперь доступна пользователям Claude Code версий Enterprise, Team и Max.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









