Репортаж от Wedoany,Компания Lenovo объявила о запуске программы AION, которая направлена на повышение операционной эффективности, снижение эксплуатационных расходов и уменьшение зависимости от GPU за счёт выполнения инференции непосредственно на CPU.

Президент Lenovo в Бразилии Рикардо Блож заявил, что на фоне роста потребностей в вычислительных мощностях, дефицита и высокой стоимости GPU программа AION определяет позиционирование компании на будущее. Основная идея программы заключается в оптимизации AI-нагрузок в соответствии с требованиями каждого приложения для повышения операционной эффективности и максимально полного использования существующей инфраструктуры. Блож пояснил, что AION укрепляет видение компании в отношении гибкой гибридной архитектуры, а цель заключается не только в предоставлении инфраструктуры, но и в помощи клиентам в создании эффективных и масштабируемых AI-сред. Он добавил, что предприятия могут использовать существующие ресурсы для ускорения AI-проектов, тем самым сокращая время вывода на рынок, повышая операционную эффективность и увеличивая отдачу от инвестиций в инфраструктуру.
Данное решение позволяет выполнять менее ресурсоёмкие или распределённые задачи инференции непосредственно на CPU, высвобождая ресурсы GPU для критически важных приложений с более высокой вычислительной плотностью. Помимо решения проблем стоимости и доступности GPU, программа AION также предлагает меры по преодолению распространённой проблемы недостаточной загрузки CPU в центрах обработки данных. Предприятия могут запускать AI-проекты, используя существующие ресурсы CPU, без полной зависимости от закупки специализированного оборудования.
На техническом уровне программа использует многоядерные возможности Intel Xeon 6 для крупномасштабного параллельного выполнения, что позволяет одновременно обрабатывать несколько запросов на инференцию, значительно повышая производительность каждого сервера в корпоративных приложениях, AI API, транзакционных системах и чат-ботах. По данным Lenovo, предварительные результаты тестирования AION показали, что время до первого токена (FTTT) при CPU-инференции составило 0,3 миллисекунды, а скорость генерации ответа достигла 11 токенов в секунду без использования GPU. Блож отметил, что этот проект демонстрирует, как интеллектуальное сочетание различных технологий может устойчиво и эффективно расширять доступ к искусственному интеллекту.









