Репортаж от Wedoany,Модель GLM-5.2, разработанная китайской компанией Zhipu AI, добилась значительных успехов в области AI-программирования. Эта модель заняла второе место в мире в рейтинге Arena и первое место среди моделей с открытым исходным кодом. В Design Arena, специализирующейся на оценке вкуса моделей, GLM-5.2 заняла первое место в мире.
Официальные представители Arena назвали достижение GLM-5.2 «невероятной вехой».
В Design Arena модель GLM-5.2 показала результат, заняв первое место в мире.
В восьми авторитетных бенчмарках GLM-5.2 продемонстрировала выдающиеся результаты.
Судя по результатам, отечественная открытая большая языковая модель впервые вошла в тройку лучших в мире в области кодинга, находясь в одной лиге с Claude и OpenAI. Ранее широко упоминавшаяся модель Google Gemini была вытеснена GLM-5.2 в рейтинговых показателях.
Зарубежные блогеры провели ряд практических тестов, сравнивая GLM-5.2 с GPT-5.5 High, Opus 4.8 High и Kimi K2.7 Code.
Один блогер считает, что этот тест хорошо отражает возможности AI, и производительность GLM-5.2 уже близка к Claude Opus 4.8. Другой блогер после тестирования воскликнул: «This is crazy».
GLM-5.2 поддерживает реально используемый контекст в 1M токенов, сохраняя лидерство в длительных задачах. Это означает, что она может обрабатывать контекст уровня крупных проектов и автономно продвигаться в течение нескольких часов.

В тесте использовался проект Appsmith на GitHub — это платформа с открытым исходным кодом для низкокодовой разработки, предназначенная для создания дашбордов, административных панелей и других внутренних приложений.

В ходе практических испытаний GLM-5.2 показала хорошие результаты в таких сценариях, как понимание полной кодовой базы, поиск ошибок в разных файлах, добавление новых функций и многозадачная обработка. В проекте Appsmith она разбила проект на структуру monorepo, точно определила расположение фронтенда, бэкенда и каталогов, а также выявила несколько ключевых точек связывания. В проекте OpenWebUI она успешно определила проблему границ потоковой передачи DirectConnection и предложила план исправления. В тесте новых функций она разбила функцию «Экспорт в Markdown» на пять уровней: инструменты бэкенда, маршрутизация, API фронтенда, точка входа в UI и тестирование, а также успешно прошла 38 бэкенд-тестов. В тесте многозадачной обработки она за один раз сгенерировала полный набор аналитических отчетов, таблиц, графиков и скриптов.








Эксперты отмечают, что конкуренция в области AI-программирования переходит в фазу долгосрочной работоспособности. В настоящее время разработчики начинают внедрять модели в реальные инженерные процессы, где модели должны читать полные проекты, понимать архитектуру, отслеживать цепочки вызовов, соблюдать ограничения требований, вносить изменения в несколько файлов, дополнять тесты и генерировать документацию. В этом контексте подход GLM-5.2, представляющий собой открытый, длинноконтекстный и ориентированный на реальные инженерные задачи базовый путь Coding Agent, формирует третий вариант наряду с Claude Code и OpenAI CodeX.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









