Репортаж от Wedoany,16 июня 2026 года на первой Глобальной конференции разработчиков компания Xinghaitu представила новую базовую модель VLA G0.5 и объявила о её открытии исходного кода. Совместно с Пекинским Ичжуаном компания основала дата-компанию «Ишу Интеллект» и запустила программу сбора 1 миллиона часов высококачественных реальных данных, а также совместно с Cathay Capital запустила стартап-инкубатор «Проект Синту». Конференция собрала множество представителей промышленности, академических кругов и научных сообществ, включая профессора кафедры электронной инженерии Университета Цинхуа Ван Юя, основательницу Capital Today Сюй Синь и других.
Компания Xinghaitu совместно с Пекинским Ичжуаном основала компанию «Ишу Интеллект (Пекин) Технолоджи», где Xinghaitu является вторым по величине акционером с уставным взносом 25 миллионов юаней и долей 25%. В число первых соучредителей вошли 15 компаний, включая Yuanli Lingji, Ant Digital Technologies, Baidu Smart Cloud, Liepin, Huitian Ruisheng и другие. Компания предложила программу сбора 1 миллиона часов сверхвысококачественных реальных данных. Основатель Xinghaitu Гао Цзиян подчеркнул, что в области воплощённого интеллекта данные являются базовым производственным ресурсом, и модель, данные и носитель должны работать в единой системе.

В области сбора данных команда Xinghaitu в краткосрочной перспективе будет использовать данные UMI (универсальный интерфейс управления) и Egocentric (от первого лица) в качестве дополнения. Компания с осторожностью относится к симуляционным данным, считая, что они сильно отличаются от данных реальных машин и их трудно использовать для эффективного проектирования алгоритмов. С точки зрения затрат, стоимость данных о поведении человека (Human centric data) составляет около 50–100 юаней в час, а стоимость данных телеуправления роботами (Robot centric data) — около 250 юаней в час. Гао Цзиян отметил, что соотношение затрат на данные и вычислительные мощности составляет примерно 1:10, а сбор 1 миллиона часов данных обойдётся в 100–200 миллионов юаней, что он назвал «необходимыми инвестициями».
Модель G0.5 объединяет зрение, язык, цепочку рассуждений и действия в единую структуру авторегрессионной генерации, реализуя замкнутый цикл рассуждений «понимание и выполнение одновременно». Модель уже имеет открытый исходный код. Что касается адаптации G0.5 для двуногого гуманоидного робота Kengo, сооснователь и технический директор компании Чжао Син заявил, что это займёт как минимум до конца 2026 года, в основном из-за ограниченной вычислительной мощности на стороне устройства, например, проблем с энергопотреблением и размером NVIDIA Jetson Thor. Гао Цзиян отметил, что общая архитектура G0.5 больше подходит для форм с двумя манипуляторами или колёсных роботов с двумя манипуляторами, и на данном этапе будет чаще внедряться на платформах R1 Lite, R1 Pro и других. Техническая дорожная карта компании делится на три уровня: инстинктивный интеллект, операционный интеллект и эволюционный интеллект. Пути инстинктивного и операционного интеллекта, вероятно, в конечном итоге сольются.
В начале этого года компания также выпустила первую версию мировой модели Fast-WAM, которая исключает процесс прогнозирования видео на этапе рассуждений, увеличивая скорость рассуждений более чем в 4 раза. Fast-WAM может стабильно работать на потребительских видеокартах с моделями от 500 миллионов до 1 миллиарда параметров.
В экосистеме компания Xinghaitu совместно с Cathay Capital запустила стартап-инкубатор «Проект Синту», сосредоточившись на трёх направлениях: интеллект на основе данных, прорыв в прикладных сценариях и ключевые технологии следующего поколения. За последний год Xinghaitu инвестировала почти в 10 компаний, а в ближайшие 3–5 лет планирует инвестировать в 30–50 компаний. Гао Цзиян отметил, что успех отрасли — это не успех одной компании, а общий успех группы компаний.
Гао Цзиян также представил бизнес-модель компании, которая будет развиваться по трёхэтапному пути: «от продажи готовых машин к подписке на решения, а затем к продаже токенов физического мира». В октябре 2024 года первые корпуса роботов Galaxea R1 от Xinghaitu были поставлены в лабораторию Ли Фэйфэй в Стэнфорде.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









