Репортаж от Wedoany,В ответ на огромные потребности искусственного интеллекта в энергоёмких центрах обработки данных, исследователи из Extropic Corp. и Массачусетского технологического института (Massachusetts Institute of Technology), включая учёного в области квантовой информации Исаака Чуанга (Isaac Chuang), предложили архитектуру деноизирующего термодинамического компьютера (Denoising Thermodynamic Computer Architecture, DTCA), утверждая, что она способна выполнять определённые задачи ИИ с долей энергопотребления традиционного оборудования. Соответствующие результаты опубликованы в журнале npj Unconventional Computing.
Данное исследование направлено на решение ключевых проблем индустрии ИИ. Команда отмечает, что инвестиции в крупномасштабные системы ИИ оказывают огромное давление на мировую энергетическую инфраструктуру, и прогнозируется, что к 2030 году центры обработки данных, ориентированные на ИИ, могут потреблять около 10% всей электроэнергии США. Эффективность традиционных архитектур GPU (графических процессоров) повышается ограниченно, а сами алгоритмы ИИ могут быть сдерживаемы существующим оборудованием, поэтому поиск альтернативных вычислительных путей становится ключевым.
Предложение описывает архитектуру вероятностного компьютера на основе традиционных КМОП-транзисторов, использующую контролируемую случайность для непосредственного выполнения вероятностных вычислений в оборудовании. Его принцип заимствует концепцию диффузионных моделей, разбивая сложные задачи вероятностного моделирования на серию простых шагов деноизации, постепенно преобразуя случайный шум в структурированные данные, что позволяет обойти ограничения предыдущих вероятностных аппаратных средств в «компромиссе между смешиванием и выразительностью». Аппаратное ядро представляет собой специально разработанные транзисторные схемы для генерации программируемых случайных чисел; эти случайные биты составляют основу вероятностных вычислений на чипе и реализуют несколько последовательно соединённых разреженных машин Больцмана через модульные массивы. Такая модульная конструкция может быть реализована с помощью нескольких специализированных аппаратных блоков на одном чипе или с помощью нескольких взаимодействующих чипов, выполняющих разные этапы вычислений. Команда уже изготовила и протестировала экспериментальный генератор случайных чисел на транзисторах, который показал устойчивость при моделируемых вариациях производственного процесса.
Для проверки производительности исследователи смоделировали данную архитектуру на GPU, включив в неё фактические данные от физического генератора случайных чисел. Бенчмаркинг на наборе изображений Fashion-MNIST показал, что качество изображений, генерируемых этой архитектурой, сопоставимо с реализацией на GPU, однако оценка энергопотребления составляет лишь одну десятитысячную от последней на каждый сгенерированный образец. Кроме того, гибридный подход, сочетающий традиционные нейронные сети с термодинамическим оборудованием, продемонстрировал потенциал на наборе данных CIFAR-10, используя в десять раз меньше параметров нейронной сети по сравнению с традиционными генеративно-состязательными сетями, что открывает перспективы для более практичного распределения вычислительных задач между различными подсистемами.
Несмотря на обнадёживающие результаты, исследовательская группа указывает на ограничения. В настоящее время физически проверен только генератор случайных чисел на транзисторах, а полная вычислительная архитектура остаётся на стадии теоретического моделирования. Наборы изображений, использованные для бенчмаркинга, значительно уступают по сложности современным большим языковым моделям или передовым генеративным моделям. Эффективное масштабирование системы для обработки более сложных данных остаётся ключевой задачей вероятностных вычислений. Команда считает, что будущий прогресс, скорее всего, будет зависеть от глубокой интеграции вероятностного оборудования с традиционными нейронными сетями, а не от полной замены существующих ИИ-ускорителей. Данное исследование следует рассматривать как «первый шаг», заслуживающий дальнейших инвестиций и изучения.










