Inception запускает новую модель искусственного интеллекта на основе диффузионных технологий
2025-02-27 14:42
В избр.

Inception — начинающийся бизнес в Пало-Альто, основанный профессором компьютерных наук Стэнфордского университета Стефано Эрмоном. Недавно компания объявила о разработке модели ИИ, основанной на диффузионной технологии, которая называется Diffusion Large Language Model (DLM). Генеративный ИИ в настоящее время делится на две основные категории: большие языковые модели (LLM), основанные на трансформаторной архитектуре, хороши в генерации текста, а диффузионные модели, которые управляют такими системами, как Midjourney и OpenAI Sora, фокусируются на создании изображений, видео и аудио. DLM Inception сочетает в себе традиционные возможности LLM, такие как улучшение генерации кода и вопросы и ответы, при этом значительно обеспечивая производительность и снижая вычислительные затраты.

 

В интервью TechCrunch Эрмон сказал, что он много лет работал в Стэнфордской лаборатории, чтобы оценить генерацию текста с помощью диффузионных технологий. Традиционная LLM генерирует текст по порядку, каждое слово должно полагаться на предыдущее слово для завершения, а скорость устанавливается. Диффузионная модель запускается с грубых данных и оптимизирует общий выход за один раз, обрабатывая его за один раз. Эрмон подумал об использовании этой функции для генерации и корректировки больших абзацов текста. После многих лет напряженной работы он и его студенты подробно описали этот прорыв в статье, опубликованной в прошлом году. Затем он основал компанию Inception, которая объединила профессора Калифорнийского университета в Лос-Анджелесе Адитью Гровер и профессора Корнелльского университета Владимира Кулешова для продвижения технологизации. Хотя детали финансирования не раскрываются, TechCrunch узнала, что фонд Мэйфилда участвовал в инвестициях.

Inception включает в себя клиентов из списка Fortune 100, удовлетворяя потребности в низкой задержке и высокой скорости. Эрмон отметил, что DLM способен более эффективно использовать графические процессоры, что приведет к шаблонам разработки языковых моделей. Компания предлагает API, локальные и пограничные опции и поддерживает объявления моделей. Его DLM требует работы в 10 раз быстрее, чем традиционный LLM, и меньше стоимости на одну десятую. Далее предлагается, что производительность малой кодированной модели сопоставима с GPT-4o mini от OpenAI и в 10 раз быстрее; Мини-модель превосходит Llama 3.1 8B от Meta и обрабатывает более 1000 токенов в секунду. Если данные соответствуют действительности, то эта скорость довольно яркая.

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com
Связанные рекомендации
Цены на чипы памяти растут: рынок потребительской электроники сталкивается с вызовами
2026-01-22
Microchip расширяет экосистему интеллектуального встраиваемого видео для ПЛИС PolarFire
2026-01-22
Генеральный директор NVIDIA Дженсен Хуанг на Всемирном экономическом форуме в Давосе: ИИ вызовет волну инвестиций в инфраструктуру
2026-01-22
Meta представила первые модели от новой команды по ИИ
2026-01-22
Гендиректор OpenAI Altman ведет переговоры с инвесторами из Ближнего Востока о привлечении финансирования в размере 50 млрд долларов
2026-01-22
Woolworths сотрудничает с Google для обновления чат-бота Olive
2026-01-20
Компания Shunya Labs представила модель распознавания речи Zero Codeswitch
2026-01-20
Samsung Electronics планирует впервые интегрировать собственный GPU в процессоры в 2027 году, ускоряя развитие периферийного ИИ
2025-12-31
Tampnet и Quvia оптимизируют производительность сети с помощью искусственного интеллекта и расширяют морскую связь
2025-11-04
XKL представляет новый продукт для упрощения и оптимизации волоконно-оптических сетей
2025-11-04
Последние новости
1
Hua Hui Intelligent: Двойной движущий потенциал в сфере высокотехнологичного интеллектуального оборудования демонстрирует эффективность
2
Руководство по правильному включению и выключению конфокального микро-рамановского спектрометра Renishaw inVia
3
Компания Sany Group представилась на выставке тяжелой техники в Саудовской Аравии, расширяя присутствие на рынке Ближнего Востока с полным спектром оборудования
4
Производство упаковочного оборудования: интеллектуализация и экологизация ведут к новым преобразованиям
5
Промышленный компьютер Cincoze Diamond MD-3000: идеальная вычислительная платформа для интеллектуального производства
6
Rockwell Automation и Lucid сотрудничают для продвижения автомобильного производства в Саудовской Аравии
7
Унифицированная архитектура ввода-вывода способствует повышению эффективности обработки данных в системах промышленной автоматизации
8
Bystronic завершила приобретение и учредила Bystronic Rofin, усиливая применение лазерных технологий
9
238 кабеля chainflex от igus получили сертификацию для сухих чистых помещений классов 4 и 5
10
Лазерные технологии способствуют прорыву в квантовых вычислениях: метаповерхностные оптические пинцеты реализуют крупномасштабные атомные массивы