Китайская Lenovo запускает программу AION: снижение затрат и повышение эффективности за счёт CPU-инференции, уменьшение зависимости от GPU_Глобальные новости

Китайская Lenovo запускает программу AION: снижение затрат и повышение эффективности за счёт CPU-инференции, уменьшение зависимости от GPU

2026-07-02 08:46

В избр.

Репортаж от Wedoany，Компания Lenovo объявила о запуске программы AION, которая направлена на повышение операционной эффективности, снижение эксплуатационных расходов и уменьшение зависимости от GPU за счёт выполнения инференции непосредственно на CPU.

Президент Lenovo в Бразилии Рикардо Блож заявил, что на фоне роста потребностей в вычислительных мощностях, дефицита и высокой стоимости GPU программа AION определяет позиционирование компании на будущее. Основная идея программы заключается в оптимизации AI-нагрузок в соответствии с требованиями каждого приложения для повышения операционной эффективности и максимально полного использования существующей инфраструктуры. Блож пояснил, что AION укрепляет видение компании в отношении гибкой гибридной архитектуры, а цель заключается не только в предоставлении инфраструктуры, но и в помощи клиентам в создании эффективных и масштабируемых AI-сред. Он добавил, что предприятия могут использовать существующие ресурсы для ускорения AI-проектов, тем самым сокращая время вывода на рынок, повышая операционную эффективность и увеличивая отдачу от инвестиций в инфраструктуру.

Данное решение позволяет выполнять менее ресурсоёмкие или распределённые задачи инференции непосредственно на CPU, высвобождая ресурсы GPU для критически важных приложений с более высокой вычислительной плотностью. Помимо решения проблем стоимости и доступности GPU, программа AION также предлагает меры по преодолению распространённой проблемы недостаточной загрузки CPU в центрах обработки данных. Предприятия могут запускать AI-проекты, используя существующие ресурсы CPU, без полной зависимости от закупки специализированного оборудования.

На техническом уровне программа использует многоядерные возможности Intel Xeon 6 для крупномасштабного параллельного выполнения, что позволяет одновременно обрабатывать несколько запросов на инференцию, значительно повышая производительность каждого сервера в корпоративных приложениях, AI API, транзакционных системах и чат-ботах. По данным Lenovo, предварительные результаты тестирования AION показали, что время до первого токена (FTTT) при CPU-инференции составило 0,3 миллисекунды, а скорость генерации ответа достигла 11 токенов в секунду без использования GPU. Блож отметил, что этот проект демонстрирует, как интеллектуальное сочетание различных технологий может устойчиво и эффективно расширять доступ к искусственному интеллекту.

Китай

Информация и коммуникация Интеллектуальная обработка данных Искусственный интеллект

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта：news@wedoany.com