Inception запускает новую модель искусственного интеллекта на основе диффузионных технологий
2025-02-27 14:42
В избр.

Inception — начинающийся бизнес в Пало-Альто, основанный профессором компьютерных наук Стэнфордского университета Стефано Эрмоном. Недавно компания объявила о разработке модели ИИ, основанной на диффузионной технологии, которая называется Diffusion Large Language Model (DLM). Генеративный ИИ в настоящее время делится на две основные категории: большие языковые модели (LLM), основанные на трансформаторной архитектуре, хороши в генерации текста, а диффузионные модели, которые управляют такими системами, как Midjourney и OpenAI Sora, фокусируются на создании изображений, видео и аудио. DLM Inception сочетает в себе традиционные возможности LLM, такие как улучшение генерации кода и вопросы и ответы, при этом значительно обеспечивая производительность и снижая вычислительные затраты.

 

В интервью TechCrunch Эрмон сказал, что он много лет работал в Стэнфордской лаборатории, чтобы оценить генерацию текста с помощью диффузионных технологий. Традиционная LLM генерирует текст по порядку, каждое слово должно полагаться на предыдущее слово для завершения, а скорость устанавливается. Диффузионная модель запускается с грубых данных и оптимизирует общий выход за один раз, обрабатывая его за один раз. Эрмон подумал об использовании этой функции для генерации и корректировки больших абзацов текста. После многих лет напряженной работы он и его студенты подробно описали этот прорыв в статье, опубликованной в прошлом году. Затем он основал компанию Inception, которая объединила профессора Калифорнийского университета в Лос-Анджелесе Адитью Гровер и профессора Корнелльского университета Владимира Кулешова для продвижения технологизации. Хотя детали финансирования не раскрываются, TechCrunch узнала, что фонд Мэйфилда участвовал в инвестициях.

Inception включает в себя клиентов из списка Fortune 100, удовлетворяя потребности в низкой задержке и высокой скорости. Эрмон отметил, что DLM способен более эффективно использовать графические процессоры, что приведет к шаблонам разработки языковых моделей. Компания предлагает API, локальные и пограничные опции и поддерживает объявления моделей. Его DLM требует работы в 10 раз быстрее, чем традиционный LLM, и меньше стоимости на одну десятую. Далее предлагается, что производительность малой кодированной модели сопоставима с GPT-4o mini от OpenAI и в 10 раз быстрее; Мини-модель превосходит Llama 3.1 8B от Meta и обрабатывает более 1000 токенов в секунду. Если данные соответствуют действительности, то эта скорость довольно яркая.

Связанные продукты
Связанные рекомендации
Ожидается, что 6G в Китае будет запущен в коммерческую эксплуатацию в 2030 году, уже получено первое в мире разрешение на использование тестовой частоты 6 ГГц
2026-05-26
Американская pSemi представит радиочастотные переключатели и широкополосные технологии на IMS 2026
2026-05-26
Канада запускает конкурс по созданию квантовых повторителей для поддержки разработки дальнодействующих квантовых сетей
2026-05-26
NTT и Kubota проверили связь для дистанционного управления сельхозтехникой в горной местности
2026-05-26
Google Cloud (США) запускает в Сингапуре коридор AI-стартапов в Юго-Восточной Азии
2026-05-26
Китайская компания H3C провела международный саммит NAVIGATE, продемонстрировав полный стек инфраструктуры для ИИ
2026-05-26
Американская компания Thunderbit запускает Web Data API и MCP-сервер для интеграции в AI-рабочие процессы
2026-05-26
Китайские компании SmartSens и Unisoc нацелены на высокоскоростные оптические соединения на базе MicroLED
2026-05-26
SK Hynix из Южной Кореи представляет решение для охлаждения iHBM, ориентированное на память для ИИ следующего поколения
2026-05-26
Японская SoftBank запустит облачный сервис GPU для AI-дата-центров в октябре
2026-05-26
Последние новости
1
Новый Южный Уэльс, Австралия, преобразует пилотный проект по электротягачам в постоянную меру
2
CRSC на высоком уровне представлен на Всемирной конференции беспилотных летательных аппаратов
3
Премьер Госсовета КНР Ли Цян: необходимо в полной мере задействовать эффект зоны свободной торговли между Китаем и Сербией, расширять и улучшать торгово-экономическое сотрудничество двух стран
4
Президент Южного Судана принял участие в церемонии ввода в эксплуатацию проекта компании CCCC
5
Китайская компания Dajin Heavy Industry и нидерландская Jumbo подписали контракт на строительство двух тяжелых крановых судов, поставка в третьем квартале 2028 года
6
Air Canada в июне открывает 7 новых дальнемагистральных маршрутов, включая Шанхай Пудун и Будапешт
7
CMA CGM Group назначает Эслу Бору управляющим директором контейнерной линии ANL
8
Китайская ракетная академия «Ханчжэн Цзисе» завершила локализацию высокотемпературных и высоконапорных плавающих шаровых кранов
9
Hengli Heavy Industry сдаст VLCC греческого судовладельца почти на полгода раньше срока
10
Ожидается, что 6G в Китае будет запущен в коммерческую эксплуатацию в 2030 году, уже получено первое в мире разрешение на использование тестовой частоты 6 ГГц