Американская компания Anthropic извинилась за скрытый антидистилляционный фильтр в Claude Fable 5
2026-06-15 16:29
В избр.

Репортаж от Wedoany,Компания Anthropic установила в модели Claude Fable 5 скрытый антидистилляционный фильтр, который незаметно изменяет выходные данные при попытке пользователя дистиллировать модель, вместо того чтобы прямо отказать. 11 июня 2026 года технологическое издание The Verge раскрыло этот механизм, что вызвало бурную реакцию в сообществе ИИ. Anthropic впоследствии принесла извинения и пообещала в будущем сделать это ограничение таким же прозрачным, как и другие меры защиты.

Дистилляция — распространённая техника в исследованиях, использующая выходные данные крупных моделей для обучения более компактных моделей. Anthropic запрещает дистилляцию в своих условиях использования, но Fable 5 обрабатывает попытки дистилляции иначе, чем другие чувствительные области. Для запросов, связанных с кибератаками, биологией или химией, модель явно переключается на Claude Opus 4.8 и уведомляет пользователя; в случае же дистилляции она через сложный механизм незаметно изменяет подсказки, генерируя намеренно ухудшенные результаты, без каких-либо предупреждений или сообщений об ошибках. Существование этого фильтра было зафиксировано в системной карте модели, но сам механизм не был широко известен.

Сообщество отреагировало резко. По данным Gizmodo, некоторые исследователи ИИ заявили, что никогда не видели таких разгневанных коллег. Один пользователь Reddit обобщил общее настроение: для чувствительного контента можно отказать или вернуть код ошибки, но «брать у людей деньги и отравлять их кодовую базу» неприемлемо.

Anthropic быстро отреагировала. В своём заявлении компания признала, что «сделала неправильный компромисс», и извинилась за то, что не смогла «найти правильный баланс». В настоящее время запросы, идентифицированные как попытки дистилляции, будут переключаться на Claude Opus 4.8, что соответствует обработке других чувствительных областей, и пользователь каждый раз будет получать уведомление.

Производительность модели Mythos на распространённых тестах. © Anthropic

Этот инцидент обнажил глубокое противоречие Anthropic между открытостью модели и защитой технологических преимуществ. Fable 5 уже является ограниченной версией Mythos, которая не была публично выпущена из-за предполагаемой опасности. Компания стремится защитить свои технологические активы от дистилляции — это требование коммерчески обосновано, но выбор скрытого исполнения вместо публичного объявления ограничений подорвал доверие к компании, чьей основной ценностью является прозрачность и ответственная безопасность. Anthropic быстро скорректировала курс, но остаётся неясным, приведёт ли этот случай к долгосрочным изменениям в способах документирования мер защиты компании.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Чжан Цзинтао и др. из Китайской академии информационных и коммуникационных технологий: Модель и стратегические предложения по строительству цифровых городов-двойников
2026-06-17
Российская платформа для эффективных онлайн-встреч Mymeet.ai открыла протокол MCP для подключения ИИ-агентов
2026-06-17
Российская команда Deckhouse выпустила Stronghold 1.18 с усиленной безопасностью ключей и возможностями аудита
2026-06-17
Японская компания transcosmos и Kyoei запускают SmartOrderLink
2026-06-17
Китайская компания Longsys представляет чип WM8500, обеспечивающий сжатие 2:1 для твердотельных накопителей объёмом 128 ГБ
2026-06-17
Китай планирует инвестировать 2 триллиона юаней в создание национальной сети ИИ-вычислений, цель — завершить к 2028 году
2026-06-17
Bull и Foxconn будут производить AI-системы в Чехии и Франции с использованием NVIDIA Vera Rubin
2026-06-17
Китайская команда разработала интеллектуальную систему оптимизации компиляции OSCAR для ускорения работы отечественных чипов
2026-06-17
Мексиканские Toku и Cobre запускают решение для приема платежей в реальном времени через SPEI
2026-06-17
Швейцарская ABB и южнокорейская Samsung объединяют усилия для создания интеграционного решения для интеллектуальных зданий и корпоративного Интернета вещей
2026-06-17
Последние новости
1
Бразильская компания по добыче критических минералов подала заявки на получение руководства по разработке редкоземельного проекта Ema
2
Nippon Steel обязалась инвестировать 2,5 миллиарда долларов в US Steel для модернизации ключевых промышленных активов
3
Британская Certas Energy инвестирует 1,5 миллиона фунтов стерлингов в модернизацию сети заправочных станций
4
Индийская NGEL ввела в эксплуатацию дополнительные 50 МВт солнечной мощности в рамках проекта RTC в Раджастхане
5
Siemens Energy поставит турбины для электростанции Taweelah C мощностью 2,6 ГВт в ОАЭ
6
Абу-Дабийский фонд Mubadala инвестирует 200 миллионов долларов в подводную электрическую линию между Великобританией и Ирландией
7
Первая в Индии воздушно-охлаждаемая сверхкритическая ТЭС введена в эксплуатацию компанией BHEL
8
Verogy запускает солнечные проекты на четырёх свалках в Коннектикуте, США
9
Create Energy приобретает производителя солнечных трекеров SOL Components
10
Великобритания запускает центр инноваций в ветроэнергетике, выделив 2 миллиона фунтов стерлингов на ускорение инноваций