Репортаж от Wedoany,29 июня американская компания CoreWeave представила агента для исследований и итераций в области ИИ под названием ARIA. Этот агент способен считывать экспериментальные данные, выявлять скрытые закономерности и обеспечивать непрерывное совершенствование моделей и агентов. ARIA построена на платформе разработки агентов W&B Weave, принадлежащей компании Weights & Biases, входящей в CoreWeave. Возможности разработки агентов W&B Weave также стали общедоступными.
ARIA ориентирована на этап анализа экспериментов в процессе разработки ИИ. В ходе обучения, тонкой настройки, оценки и разработки агентов команды моделей генерируют большое количество записей о проведённых экспериментах, графиков показателей, конфигурационных параметров, результатов оценки и неудачных образцов. Исследователям часто приходится многократно искать взаимосвязи между этими данными, чтобы определить, какие параметры привели к улучшению, какие типы ошибок повторяются и какие эксперименты стоит продолжать. ARIA объединяет считывание экспериментальных данных, распознавание образов, обобщение выводов и формирование рекомендаций по дальнейшим действиям, позволяя исследовательским группам выйти за рамки работы, основанной исключительно на «просмотре графиков, чтении журналов и ручном анализе». По заявлению CoreWeave, ARIA способна за несколько минут проанализировать тысячи экспериментальных запусков и десятки тысяч показателей, превращая результаты уже проведённых экспериментов в исходные данные для улучшения моделей и итераций агентов.
Позиционирование этого продукта заключается в сокращении разрыва между анализом экспериментов и последующими действиями. Распространённая проблема в исследованиях ИИ в прошлом заключалась не в отсутствии данных, а в их избыточности, разрозненности показателей и неспособности команд своевременно преобразовывать результаты в следующий раунд экспериментов.
Чен Голдберг, исполнительный вице-президент по продуктам и инжинирингу CoreWeave, отметил, что исследователи добились быстрого прогресса в разработке моделей, но инструменты управления не поспевают за этим развитием, и ARIA призвана устранить этот разрыв. Для команд, работающих с большими языковыми моделями и интеллектуальными агентами, скорость обучения, масштабы вычислительных мощностей и количество экспериментов быстро растут, однако управление экспериментами, интерпретация результатов, автоматический анализ и генерация следующих задач по-прежнему в значительной степени требуют ручного труда. Внедрение ARIA на этом этапе поможет командам быстрее выявлять изменения в производительности моделей, аномалии показателей, узкие места в обучении и проблемы в поведении агентов, а также преобразовывать результаты анализа в новые экспериментальные гипотезы, направления оценки или оптимизационные задачи.
W&B Weave является важной технологической основой ARIA. Компания Weights & Biases долгое время занималась отслеживанием экспериментов в области машинного обучения, оценкой моделей и совместной разработкой. После завершения приобретения этой компании CoreWeave объединяет облачную инфраструктуру ИИ с инструментарием для разработки моделей. Создание ARIA на базе W&B Weave свидетельствует о том, что CoreWeave не только предоставляет вычислительные мощности GPU и облачные ресурсы, но и расширяет свою деятельность в области инструментов для процессов разработки ИИ. Для команд, занимающихся экспериментами в сфере ИИ, вычислительная мощность — это лишь первый уровень потребностей; возможность отслеживать эксперименты, интерпретировать показатели, оценивать агентов и автоматизировать итерации являются ключевыми факторами для постоянного повышения качества моделей.
ARIA также укрепляет продуктовые границы CoreWeave на рынке инфраструктуры ИИ. Раньше облачные провайдеры ИИ делали больший упор на кластеры GPU, производительность обучения, сетевое взаимодействие и экономическую эффективность. Теперь конкуренция смещается в сторону исследовательских платформ, управления экспериментами, разработки агентов и управления жизненным циклом моделей. Если CoreWeave сможет объединить вычислительные ресурсы, управление экспериментами W&B, разработку агентов Weave и исследовательского агента ARIA, это позволит охватить полную цепочку от обучения модели до анализа экспериментов, от создания агентов до их непрерывной оптимизации. Исследовательские группы смогут выполнять запись экспериментов, анализ результатов, оценку агентов и продвижение к следующим задачам в рамках единой системы, сокращая затраты на переключение между инструментами и ручную обработку данных.
Запуск ARIA также отражает переход исследований в области ИИ от разовых экспериментов к непрерывным итерациям. Чем сложнее модели и агенты, тем труднее объяснить все проблемы с помощью одного показателя. Исследовательским группам необходимо одновременно отслеживать точность, задержку, стоимость, стабильность, типы сбоев, успешность вызова инструментов и уровень выполнения пользовательских задач. Если ARIA сможет стабильно обрабатывать эти многомерные показатели, это поможет командам быстрее определить, какие изменения действительно эффективны, а какие оптимизации являются лишь локальными улучшениями. Для приложений на основе больших языковых моделей, платформ интеллектуальных агентов и корпоративных продуктов ИИ такие инструменты автоматизированных исследований и итераций станут важной частью сокращения циклов разработки.









