alphaXiv использует китайскую модель с открытым исходным кодом GLM-5.2 вместо ограниченной модели Claude
2026-06-23 09:17
В избр.

Репортаж от Wedoany,В первой демонстрации автоматического исследователя alphaXiv была использована китайская модель с открытым исходным кодом GLM-5.2, заменившая передовые модели компании Anthropic — Claude Fable 5 и Mythos 5, доступ к которым ранее был ограничен властями США. Команда alphaXiv четко заявила, что это лишь их собственная демонстрация, а не независимое тестирование; причиной выбора альтернативы с открытым исходным кодом стала недоступность передовых моделей для исследований, что побудило сообщество открытого кода искать замену.

В ходе показательной работы GLM-5.2 самостоятельно выполнила сравнение двух схем обучения с подкреплением — полностью асинхронной и комбинированной синхронной. Эксперимент проводился на двух узлах, каждый из которых был оснащен восемью ускорителями H100, на основе фреймворка SkyRL на наборе задач по кодированию Harbor. В описании команды указано, что агент самостоятельно исправил проблемы окружения (зависимость libnuma), выполнил все запуски и представил итоговые сравнительные данные по пропускной способности и стабильности вознаграждения.

Функция автоматического исследователя alphaXiv предназначена для решения проблемы воспроизводимости кода из научных статей. После замены в адресе статьи arxiv на autoarxiv агент автоматически развертывает репозиторий, исправляет окружение, проводит минимальную проверку воспроизводимости и оценивает стоимость полного воспроизведения результатов. Этот процесс включает инженерные этапы — сборку и проверку чужого кода, а не научные открытия. Для частного кода существует отдельная платформа OpenResearch.sh.

GLM-5.2 от китайской компании Z.ai (ранее Zhipu AI) — это модель с открытым исходным кодом на архитектуре MoE, содержащая около 750 миллиардов параметров, с активацией примерно 40 миллиардов параметров на каждый токен, длиной контекста в 1 миллион токенов и лицензией MIT. Команда отмечает, что ключевой особенностью модели являются не результаты бенчмарков, а то, что ее веса с открытым исходным кодом не могут быть отозваны регулирующими органами — это гарантия для инструментов, требующих предсказуемого доступа.

Команда alphaXiv признает, что GLM-5.2 лишена визуальных возможностей: когда другие модели напрямую считывают тренды с графиков WandB (сервис отслеживания экспериментов), GLM пишет код на numpy для анализа сырых чисел — этого достаточно для простых запусков, но может мешать в сложных задачах. Команда отмечает, что на текущем этапе модель еще не занимается настоящими исследованиями; ее преимущество заключается в решении задач реализации и воспроизведении существующих работ. Под самостоятельным исследованием здесь понимается инженерный цикл экспериментов, а не научные открытия.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Южнокорейская Samsung Electronics представляет мобильные накопители UFS 5.0
2026-06-23
Китайский AI-агент WeCom «Даюань» вступил в стадию внутреннего тестирования
2026-06-23
В провинции Цзянсу открылась первая промышленная академия Unitree по внедрению искусственного интеллекта в физические объекты (воплощённый интеллект)
2026-06-23
Вьетнамский город Донгнай запускает пилотную программу цифровой трансформации для более чем 105 000 индивидуальных предпринимателей
2026-06-23
Вьетнам продвигает цифровизацию туризма в Хюэ: ожидаемый доход в 10,3 трлн донгов за первое полугодие 2026 года
2026-06-23
Вьетнам утвердил план на 2026-2030 годы по цифровой трансформации не менее 500 тысяч предприятий
2026-06-23
Японская KDDI совместно с NVIDIA и другими компаниями создаёт цифровой двойник RAN
2026-06-23
Проекты KPO в Польше охватили 314,8 тыс. домохозяйств
2026-06-23
T-Mobile Polska участвует в проекте по установке умных водомеров NB-IoT на сумму 12,8 млн злотых
2026-06-23
Польская Nexera в 2025 году получила выручку в размере 152 млн злотых, охватив 9 воеводств
2026-06-23
Последние новости
1
Американская компания по строительным технологиям для жилых домов NileBuilt намерена продать интеллектуальную собственность на композитную строительную технологию Gen-2
2
Компания Laison представила решения с интеллектуальными предоплаченными водомерами на выставке водоснабжения в Замбии
3
Компания Gulf Coast Rebar Inc. установила почти 10 000 тонн арматуры и получила награду SEAA «Проект года 2026»
4
Carollo Engineers получила контракт на управление строительством водоочистной станции в Калифорнии (США) на сумму 210 миллионов долларов
5
Британская водная ассоциация запускает опрос эффективности водных и сточных компаний на 2026 год
6
Совет графства Дербишир испытывает машину для ремонта выбоин JCB
7
Верховный суд Валенсии начал установку стеклянного ограждения
8
Рынок школы Сан-Кристобаль в Испании модернизирован с использованием низкоуглеродных решений Saint-Gobain
9
Расширение Королевской больницы Александры стоимостью 33 миллиона фунтов стерлингов начнется в июле
10
В Кейптауне (ЮАР) началось строительство торгового центра GrandWest стоимостью 650 млн рандов