Репортаж от Wedoany,Компания Z.ai (ранее известная как Zhipu AI) выпустила открытую весовую модель ИИ под названием GLM 5.2, которую можно загружать, настраивать и полностью запускать на локальных устройствах. Этот шаг бросает вызов распространённому мнению о том, что высокопроизводительный ИИ доступен только через платные подписки технологическим гигантам.
В отличие от закрытых систем, таких как ChatGPT или Claude, GLM 5.2 предоставляет разработчикам прямой доступ к самой модели. В отрасли, всё больше доминируемой закрытыми корпоративными серверами, эта особенность даёт пользователям больший контроль. Z.ai отмечает, что с появлением таких моделей, как серия Llama от Meta, Mistral и GLM 5.2, разрыв между высокопроизводительным ИИ и открытыми моделями быстро сокращается. Многим предприятиям не нужны модели, способные решать теоретические логические задачи мирового уровня; им скорее требуется система, которая может точно обобщать большие внутренние библиотеки документов или самостоятельно писать и отлаживать код. Если открытые модели могут выполнять от 90% до 95% этих задач с гораздо меньшими затратами, такие модели нельзя игнорировать.
Интерес к GLM 5.2 резко возрос, когда разработчики успешно продемонстрировали её локальный запуск на высокопроизводительных устройствах Apple, таких как Mac mini. Эта демонстрация доказала, что мощный ИИ теперь можно «иметь», а не только «арендовать по подписке». В моделях, основанных на подписке, третьи стороны контролируют цены, политику конфиденциальности и дорожную карту функций, тогда как открытые весовые модели меняют эту ситуацию. Для отраслей, работающих с конфиденциальными финансовыми данными, медицинскими записями или проприетарными корпоративными исследованиями, возможность полностью хранить данные на внутреннем оборудовании является значительным преимуществом в области безопасности. В будущем корпоративный технологический стек, скорее всего, будет представлять собой «гибридный» стек ИИ: закрытые флагманские модели будут обрабатывать самые сложные задачи рассуждения; открытые весовые модели будут управлять высокообъёмными рутинными рабочими процессами; а локально размещённые модели будут безопасно управлять наиболее конфиденциальными внутренними данными.
GLM 5.2 — это массивная модель смеси экспертов (MoE) с 744–753 миллиардами параметров. В несжатой форме её веса потребляют 1,51 ТБ памяти и хранилища. Стандартные высокопроизводительные ПК имеют максимум 24 ГБ видеопамяти, что создаёт «стену видеопамяти»; Mac Studio с максимальной унифицированной памятью 256 ГБ может запускать сильно сжатую версию. Для локального запуска GLM 5.2 разработчики должны использовать методы квантования для агрессивного сжатия. Даже после сильного сжатия для загрузки модели требуется около 240 ГБ памяти. Кроме того, GLM 5.2 имеет контекстное окно в 1 миллион токенов, такое же, как у Claude, что означает, что она может за один раз обработать всю кодовую базу или книги небольшой библиотеки. Однако отслеживание такого объёма данных требует специального выделения памяти, и при работе модели на пределе даже самые мощные потребительские настольные компьютеры начинают перегреваться.
Для непрограммистов эта новость всё ещё актуальна. ИИ фундаментально меняет программное обеспечение, которое мы используем ежедневно. GLM 5.2 не заменит приложения на вашем телефоне завтра, но она подчёркивает, что открытые модели становятся дешевле и чрезвычайно конкурентоспособны. Поскольку у компаний-разработчиков ПО появляется больше вариантов и им больше не нужно платить высокие сборы одному поставщику за добавление функций ИИ в свои приложения, это изменение может означать, что следующее поколение цифровых инструментов будет дешевле, более специализированным и более конфиденциальным. Открытые модели ИИ, такие как GLM 5.2, являются не просто альтернативой, но и важным вызовом дорогим подписным моделям, предоставляя предприятиям и разработчикам возможность создавать более эффективные, безопасные и доступные решения.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









