Репортаж от Wedoany,Платформа разработки ИИ Saturn Cloud, ориентированная на операторов GPU-облаков, представила платформу Token Factory, которая позволяет корпоративным ИИ-командам выполнять полный цикл тонкой настройки моделей и инференс-сервисов на GPU-инфраструктуре оператора. Платформа поддерживает neocloud-операторов, строителей ИИ-фабрик и корпоративных пользователей, предоставляя им возможность предлагать своим клиентам управляемые задачи тонкой настройки, управление наборами данных и инференс-энпоинты, совместимые с OpenAI, с оплатой за токен и под собственным брендом оператора, без необходимости самостоятельной разработки или обслуживания каких-либо компонентов.
Операторы GPU-облаков вкладывают значительные средства в ускорение инфраструктуры: системы NVIDIA Grace Blackwell, NVIDIA Blackwell и NVIDIA Hopper уже развернуты в больших масштабах, а доходы neocloud-бизнеса быстро растут. Однако бизнес-модель многих операторов по-прежнему ограничивается почасовой арендой вычислительных мощностей GPU. Потребности корпоративных клиентов вышли за рамки простого предоставления вычислительных ресурсов: им требуются управляемые среды разработки, оркестрация распределенного обучения, конвейеры тонкой настройки моделей, единый вход (SSO) и управление доступом на основе ролей (RBAC), отслеживание использования и инструменты соответствия требованиям. Большинству операторов GPU-облаков не хватает персонала для самостоятельного создания такой платформенной инфраструктуры, что обычно требует месяцев разработки и постоянного обслуживания.
Основатель Saturn Cloud Себастьян Метти заявил, что операторам не следует создавать платформу разработки ИИ с нуля, чтобы сделать GPU-инфраструктуру доступной для корпоративных команд. Saturn Cloud с самого начала предоставляет управляемую среду, оркестрацию обучения, тонкую настройку, инференс-энпоинты, совместимые с OpenAI, и оплату за токен.
Платформа Token Factory позволяет ИИ-командам выполнять тонкую настройку и обслуживание открытых моделей без управления инфраструктурой. Пользователям достаточно загрузить набор данных, настроить задачу тонкой настройки и развернуть полученную модель на инференс-энпоинте — все операции выполняются в брендированной среде оператора. Задачи тонкой настройки поддерживают контролируемую тонкую настройку (полный вес и LoRA) для открытых моделей; при оснащении выбранного экземпляра несколькими GPU система автоматически выполняет многопроцессорную конфигурацию DeepSpeed. Пользователь указывает базовую модель, набор данных и несколько гиперпараметров, а Saturn Cloud генерирует полную конфигурацию обучения и обрабатывает оркестрацию, повторные попытки и вывод контрольных точек. Поддерживаемые фреймворки обучения включают Axolotl, vLLM, Unsloth, TRL, PEFT и DeepSpeed.
Наборы данных представляют собой типизированные, проверенные коллекции обучающих данных в форматах диалогов, инструкций, текста или предварительно токенизированных данных. Пользователи могут загружать наборы данных напрямую, импортировать из внешних источников (например, S3, NFS) или подготавливать данные в управляемом рабочем пространстве, а затем регистрировать их как наборы данных Token Factory. Все хранилища наборов данных используют высокопроизводительную параллельную файловую систему, а не объектное хранилище, чтобы устранить накладные расходы на холодный запуск и избежать снижения загрузки GPU во время обучения.
Управление контрольными точками и артефактами автоматизировано. После завершения задачи тонкой настройки созданные контрольные точки регистрируются в реестре артефактов Saturn Cloud, сохраняя полную родословную от запуска обучения до весов модели. Контрольные точки могут быть немедленно использованы в качестве входных данных для развертывания инференс-энпоинтов. Инференс-энпоинты развертывают тонко настроенные или базовые модели в виде постоянных сервисных энпоинтов, поддерживаемых vLLM, каждый со своим поддоменом, мониторингом работоспособности и учетом по токенам. Конфигурация обслуживания (например, dtype, максимальная длина контекста, квантизация) генерируется при развертывании, без необходимости в пользовательских скриптах обслуживания. Весь рабочий процесс изолирован по организациям: ресурсы Token Factory ограничены в пределах арендатора, что гарантирует недоступность наборов данных, контрольных точек и энпоинтов одного клиента для других клиентов.
Saturn Cloud предоставляет операторам GPU-облаков прямой путь от «голой» инфраструктуры до монетизируемой ИИ-платформы. Функциональный слой для операторов включает white-label брендинг, оплату за токен и за GPU-час, онбординг арендаторов и самостоятельную настройку, панели мониторинга использования и отчеты по биллингу, а также корпоративные инструменты безопасности (включая SSO, RBAC и соответствие SOC 2). Без платформенного слоя операторы могут продавать только вычислительное время, попадая в ценовую конкуренцию; с Saturn Cloud они могут продавать платформу, конкурируя по качеству разработки, безопасности и времени выхода на рынок. Платформа позволяет операторам проходить корпоративные проверки безопасности, поскольку инструменты соответствия уже на месте, а также предоставлять арендаторам панели использования, контроль затрат и управление командами, а также демонстрировать продукт, а не спецификации, командам продаж операторов.
ИИ-команды и разработчики, работающие на инфраструктуре оператора, получают управляемые среды разработки (с поддержкой JupyterLab, VS Code, RStudio и SSH-доступа), распределенное многопроцессорное обучение (с оркестрацией, повторными попытками и логированием), Token Factory для тонкой настройки и обслуживания открытых моделей, а также предварительно настроенную поддержку NVIDIA CUDA, драйверов GPU и ИИ-фреймворков. Инженеры могут использовать весь кластер GPU оператора, включая системы NVIDIA Hopper, Blackwell и Blackwell Ultra, а также стоечные системы NVIDIA GB200 NVL72. Saturn Cloud является участником программы стартапов NVIDIA Inception.
Saturn Cloud интегрируется с партнерами по автоматизации инфраструктуры в экосистеме, включая Mirantis k0rdent AI, Spectro Cloud, OpenNebula и Rafay. Операторы, управляющие Kubernetes непосредственно в облачном бэкенде, также могут развернуть Saturn Cloud поверх существующего стека без изменения инфраструктурного слоя.
Функциональность Token Factory теперь доступна для операторов GPU-облаков, neocloud и предприятий, управляющих собственной GPU-инфраструктурой. Организации, заинтересованные в развертывании платформы, могут связаться с Saturn Cloud для оценки.
Saturn Cloud — это платформа ИИ-токен-фабрики для neocloud, операторов ИИ-фабрик и предприятий, предоставляющая управляемую тонкую настройку, обслуживание моделей, совместимое с OpenAI (с оплатой за токен), управляемые среды, распределенное обучение, а также корпоративную безопасность и управление. Платформа поддерживает различные архитектуры GPU и может быть развернута в публичных, частных и локальных средах.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









