Inception запускает новую модель искусственного интеллекта на основе диффузионных технологий
2025-02-27 14:42
В избр.

Inception — начинающийся бизнес в Пало-Альто, основанный профессором компьютерных наук Стэнфордского университета Стефано Эрмоном. Недавно компания объявила о разработке модели ИИ, основанной на диффузионной технологии, которая называется Diffusion Large Language Model (DLM). Генеративный ИИ в настоящее время делится на две основные категории: большие языковые модели (LLM), основанные на трансформаторной архитектуре, хороши в генерации текста, а диффузионные модели, которые управляют такими системами, как Midjourney и OpenAI Sora, фокусируются на создании изображений, видео и аудио. DLM Inception сочетает в себе традиционные возможности LLM, такие как улучшение генерации кода и вопросы и ответы, при этом значительно обеспечивая производительность и снижая вычислительные затраты.

 

В интервью TechCrunch Эрмон сказал, что он много лет работал в Стэнфордской лаборатории, чтобы оценить генерацию текста с помощью диффузионных технологий. Традиционная LLM генерирует текст по порядку, каждое слово должно полагаться на предыдущее слово для завершения, а скорость устанавливается. Диффузионная модель запускается с грубых данных и оптимизирует общий выход за один раз, обрабатывая его за один раз. Эрмон подумал об использовании этой функции для генерации и корректировки больших абзацов текста. После многих лет напряженной работы он и его студенты подробно описали этот прорыв в статье, опубликованной в прошлом году. Затем он основал компанию Inception, которая объединила профессора Калифорнийского университета в Лос-Анджелесе Адитью Гровер и профессора Корнелльского университета Владимира Кулешова для продвижения технологизации. Хотя детали финансирования не раскрываются, TechCrunch узнала, что фонд Мэйфилда участвовал в инвестициях.

Inception включает в себя клиентов из списка Fortune 100, удовлетворяя потребности в низкой задержке и высокой скорости. Эрмон отметил, что DLM способен более эффективно использовать графические процессоры, что приведет к шаблонам разработки языковых моделей. Компания предлагает API, локальные и пограничные опции и поддерживает объявления моделей. Его DLM требует работы в 10 раз быстрее, чем традиционный LLM, и меньше стоимости на одну десятую. Далее предлагается, что производительность малой кодированной модели сопоставима с GPT-4o mini от OpenAI и в 10 раз быстрее; Мини-модель превосходит Llama 3.1 8B от Meta и обрабатывает более 1000 токенов в секунду. Если данные соответствуют действительности, то эта скорость довольно яркая.

Связанные продукты
Связанные рекомендации
Zhiyuan Robot анонсировала несколько технологических прорывов, принят первый государственный стандарт тестирования для эмбодированного интеллекта.
2026-04-11
Всплеск спроса на ИИ стимулирует взрывной рост доходов производителей чипов памяти в первом квартале, отраслевая конъюнктура продолжает улучшаться
2026-04-10
Представлен vivo Pad6 Pro: стартовая цена от 4499 юаней, оснащен Snapdragon 8 Gen 5 Ultimate Edition для создания нового эталона флагманской производительности
2026-04-10
TCL Technology планирует приобрести 45% акций Guangzhou TCL China Star Semiconductor за 9,325 млрд юаней для усиления позиций в индустрии дисплейных панелей
2026-04-10
Vivo представляет смартфон X300 Ultra с ценой от 6999 юаней. Система камер получила комплексное обновление.
2026-04-10
CITIC Securities: Китайский экспорт оптического волокна демонстрирует рост как в объемах, так и в ценах, доля высока. Сильный зарубежный спрос, продолжаем оптимистично оценивать потенциал ИИ-вычислений.
2026-04-10
Высокая конъюнктура на рынке чипов памяти продолжает расширяться, цикличная устойчивость может превзойти ожидания
2026-04-10
Выходит новое поколение AI-смартфонов Doubao! ZTE сообщает о продвижении разработки и внедрения телефона совместно с ByteDance
2026-04-10
Asus объявила о повышении цен на видеокарты RX 9070 XT на Тайване, максимальный рост составил 17,5%
2026-04-10
天数智芯 опубликовала первый отчет о результатах деятельности после выхода на биржу, основной бизнес GPU вырос на 149,6%
2026-04-10
Последние новости
1
В Литве начнутся работы по демонтажу блока №2 Игналинской АЭС
2
PhosAgro-Region представляет на сельскохозяйственной выставке в Монголии систему удобрений для засушливых условий
3
Россия и Вьетнам исследуют потенциал сотрудничества в ядерной энергетике и продвигают проекты в различных энергетических областях
4
Ремонтные работы на фосфатном руднике Дорова в Зимбабве завершены на 95%, планируется возобновление производства в мае
5
Французский авиапроизводитель привлекает 340 миллионов евро для продвижения индустриализации гибридно-электрического самолета
6
В Сиане открылась 4-я международная выставка горнодобывающего оборудования
7
Испанская компания Finsa представляет комплексное решение Habitat 360 из дерева
8
Первый гидравлический испытательный тест парогенератора блока №1 первой фазы расширения АЭС Шидаовань в провинции Шаньдун, Китай, успешно завершен с первого раза
9
Китайская корпорация Dongfang Electric вновь получила заказ на ключевой компонент «искусственного солнца»
10
Национальная геологическая и горнодобывающая служба Чили проводит высокодетальное геопространственное картографирование в регионе Айсен