Американская компания Saturn Cloud запускает платформу Token Factory для операторов GPU-облаков
2026-06-10 11:49
В избр.

Репортаж от Wedoany,Платформа разработки ИИ Saturn Cloud, ориентированная на операторов GPU-облаков, представила платформу Token Factory, которая позволяет корпоративным ИИ-командам выполнять полный цикл тонкой настройки моделей и инференс-сервисов на GPU-инфраструктуре оператора. Платформа поддерживает neocloud-операторов, строителей ИИ-фабрик и корпоративных пользователей, предоставляя им возможность предлагать своим клиентам управляемые задачи тонкой настройки, управление наборами данных и инференс-энпоинты, совместимые с OpenAI, с оплатой за токен и под собственным брендом оператора, без необходимости самостоятельной разработки или обслуживания каких-либо компонентов.

Операторы GPU-облаков вкладывают значительные средства в ускорение инфраструктуры: системы NVIDIA Grace Blackwell, NVIDIA Blackwell и NVIDIA Hopper уже развернуты в больших масштабах, а доходы neocloud-бизнеса быстро растут. Однако бизнес-модель многих операторов по-прежнему ограничивается почасовой арендой вычислительных мощностей GPU. Потребности корпоративных клиентов вышли за рамки простого предоставления вычислительных ресурсов: им требуются управляемые среды разработки, оркестрация распределенного обучения, конвейеры тонкой настройки моделей, единый вход (SSO) и управление доступом на основе ролей (RBAC), отслеживание использования и инструменты соответствия требованиям. Большинству операторов GPU-облаков не хватает персонала для самостоятельного создания такой платформенной инфраструктуры, что обычно требует месяцев разработки и постоянного обслуживания.

Основатель Saturn Cloud Себастьян Метти заявил, что операторам не следует создавать платформу разработки ИИ с нуля, чтобы сделать GPU-инфраструктуру доступной для корпоративных команд. Saturn Cloud с самого начала предоставляет управляемую среду, оркестрацию обучения, тонкую настройку, инференс-энпоинты, совместимые с OpenAI, и оплату за токен.

Платформа Token Factory позволяет ИИ-командам выполнять тонкую настройку и обслуживание открытых моделей без управления инфраструктурой. Пользователям достаточно загрузить набор данных, настроить задачу тонкой настройки и развернуть полученную модель на инференс-энпоинте — все операции выполняются в брендированной среде оператора. Задачи тонкой настройки поддерживают контролируемую тонкую настройку (полный вес и LoRA) для открытых моделей; при оснащении выбранного экземпляра несколькими GPU система автоматически выполняет многопроцессорную конфигурацию DeepSpeed. Пользователь указывает базовую модель, набор данных и несколько гиперпараметров, а Saturn Cloud генерирует полную конфигурацию обучения и обрабатывает оркестрацию, повторные попытки и вывод контрольных точек. Поддерживаемые фреймворки обучения включают Axolotl, vLLM, Unsloth, TRL, PEFT и DeepSpeed.

Наборы данных представляют собой типизированные, проверенные коллекции обучающих данных в форматах диалогов, инструкций, текста или предварительно токенизированных данных. Пользователи могут загружать наборы данных напрямую, импортировать из внешних источников (например, S3, NFS) или подготавливать данные в управляемом рабочем пространстве, а затем регистрировать их как наборы данных Token Factory. Все хранилища наборов данных используют высокопроизводительную параллельную файловую систему, а не объектное хранилище, чтобы устранить накладные расходы на холодный запуск и избежать снижения загрузки GPU во время обучения.

Управление контрольными точками и артефактами автоматизировано. После завершения задачи тонкой настройки созданные контрольные точки регистрируются в реестре артефактов Saturn Cloud, сохраняя полную родословную от запуска обучения до весов модели. Контрольные точки могут быть немедленно использованы в качестве входных данных для развертывания инференс-энпоинтов. Инференс-энпоинты развертывают тонко настроенные или базовые модели в виде постоянных сервисных энпоинтов, поддерживаемых vLLM, каждый со своим поддоменом, мониторингом работоспособности и учетом по токенам. Конфигурация обслуживания (например, dtype, максимальная длина контекста, квантизация) генерируется при развертывании, без необходимости в пользовательских скриптах обслуживания. Весь рабочий процесс изолирован по организациям: ресурсы Token Factory ограничены в пределах арендатора, что гарантирует недоступность наборов данных, контрольных точек и энпоинтов одного клиента для других клиентов.

Saturn Cloud предоставляет операторам GPU-облаков прямой путь от «голой» инфраструктуры до монетизируемой ИИ-платформы. Функциональный слой для операторов включает white-label брендинг, оплату за токен и за GPU-час, онбординг арендаторов и самостоятельную настройку, панели мониторинга использования и отчеты по биллингу, а также корпоративные инструменты безопасности (включая SSO, RBAC и соответствие SOC 2). Без платформенного слоя операторы могут продавать только вычислительное время, попадая в ценовую конкуренцию; с Saturn Cloud они могут продавать платформу, конкурируя по качеству разработки, безопасности и времени выхода на рынок. Платформа позволяет операторам проходить корпоративные проверки безопасности, поскольку инструменты соответствия уже на месте, а также предоставлять арендаторам панели использования, контроль затрат и управление командами, а также демонстрировать продукт, а не спецификации, командам продаж операторов.

ИИ-команды и разработчики, работающие на инфраструктуре оператора, получают управляемые среды разработки (с поддержкой JupyterLab, VS Code, RStudio и SSH-доступа), распределенное многопроцессорное обучение (с оркестрацией, повторными попытками и логированием), Token Factory для тонкой настройки и обслуживания открытых моделей, а также предварительно настроенную поддержку NVIDIA CUDA, драйверов GPU и ИИ-фреймворков. Инженеры могут использовать весь кластер GPU оператора, включая системы NVIDIA Hopper, Blackwell и Blackwell Ultra, а также стоечные системы NVIDIA GB200 NVL72. Saturn Cloud является участником программы стартапов NVIDIA Inception.

Saturn Cloud интегрируется с партнерами по автоматизации инфраструктуры в экосистеме, включая Mirantis k0rdent AI, Spectro Cloud, OpenNebula и Rafay. Операторы, управляющие Kubernetes непосредственно в облачном бэкенде, также могут развернуть Saturn Cloud поверх существующего стека без изменения инфраструктурного слоя.

Функциональность Token Factory теперь доступна для операторов GPU-облаков, neocloud и предприятий, управляющих собственной GPU-инфраструктурой. Организации, заинтересованные в развертывании платформы, могут связаться с Saturn Cloud для оценки.

Saturn Cloud — это платформа ИИ-токен-фабрики для neocloud, операторов ИИ-фабрик и предприятий, предоставляющая управляемую тонкую настройку, обслуживание моделей, совместимое с OpenAI (с оплатой за токен), управляемые среды, распределенное обучение, а также корпоративную безопасность и управление. Платформа поддерживает различные архитектуры GPU и может быть развернута в публичных, частных и локальных средах.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
IPO SpaceX в США установлен по цене $135, ожидается листинг 12 июня
2026-06-10
В Бразилии введено в эксплуатацию подводное оптоволокно протяженностью 800 км, которое принесет пользу более 1,5 миллиона человек
2026-06-10
Американская компания NetVendor запускает 5 функций на базе ИИ для ускорения управления поставщиками
2026-06-10
Intel помогает городу Беллфлауэр в США развернуть муниципальную сеть, планируется расширение до 50 городов
2026-06-10
Американские компании Moment и Ramp заключили партнерство: за 3 месяца приток средств на инвестиционные счета составил 1 миллиард долларов
2026-06-10
Американская компания Saturn Cloud запускает платформу Token Factory для операторов GPU-облаков
2026-06-10
Американская компания Lola GEN запускает глобальную сеть экстренной связи и представляет первый терминал
2026-06-10
Американская платформа для логических выводов d-Matrix Corsair запущена в серийное производство и отгружается
2026-06-10
WEKA (США) подтвердила длинноконтекстные рассуждения в Oracle Cloud, пропускная способность увеличена в 10 раз
2026-06-10
Британская компания Western Computer проведет совместно с Microsoft мероприятие по ERP и ИИ в США
2026-06-10
Последние новости
1
Испанское исследовательское судно начинает промысловую разведку рыбных ресурсов Ньюфаундленда
2
Испанская группа Costa инвестирует 300 миллионов долларов в свиноводческий проект в Парагвае
3
Бразильское кофеводство переходит к брендингу и устойчивому развитию
4
Ожидается, что чемпионат мира по футболу 2026 года увеличит экспорт мяса из Мексики на 5–12%
5
Национальная банановая корпорация Коста-Рики разрабатывает план экстренных мер для смягчения последствий Эль-Ниньо
6
Минсельхоз России планирует увеличить производительность труда в АПК на 12,6% к 2030 году
7
IPO SpaceX в США установлен по цене $135, ожидается листинг 12 июня
8
В Бразилии введено в эксплуатацию подводное оптоволокно протяженностью 800 км, которое принесет пользу более 1,5 миллиона человек
9
Американская компания NetVendor запускает 5 функций на базе ИИ для ускорения управления поставщиками
10
Импорт сои в Китай в мае превысил ожидания, достигнув 11,79 млн тонн