Репортаж от Wedoany,Генеральный директор Microsoft Сатья Наделла (Satya Nadella) пояснил, что многие компании упускают ключевой момент в своей стратегии в области искусственного интеллекта: настоящая конкуренция заключается не в выборе той или иной модели, а в способности организации учиться на основе создаваемых ею систем.
Ключевая концепция, которую подчеркивает Наделла, — это «цикл обучения». Данный механизм подразумевает систему, которая самооптимизируется при каждом использовании, не за счет обновления программного обеспечения, а путем захвата, анализа и улучшения событий, возникающих в процессе работы, постоянно повышая свою производительность. В противоположность этому, большинство современных корпоративных приложений ИИ работают иначе. Например, компания развертывает ChatGPT или аналогичную модель в рабочем процессе, и она может отвечать на вопросы, но когда пользователь задает тот же вопрос немного иным способом, система не запоминает конкретный бизнес-контекст компании. Это означает, что у компании есть лишь более умный универсальный инструмент, а не циклическая система, обладающая способностью к обучению.

В последние два года в отрасли широко пропагандировались решения с «человеком в цикле», то есть одобрение результатов работы ИИ через ручную проверку. Наделла считает, что такой подход является лишь контрольной точкой, а не настоящим процессом обучения. Компания не улучшает систему, а лишь увеличивает затраты на персонал для контроля качества. Он предложил, что если организация не просто проверяет результаты работы ИИ, а захватывает каждое взаимодействие, каждое исправление и каждый результат, и использует эту обратную связь для итерации самой системы, делая ее умнее в конкретной бизнес-области, только тогда формируется настоящий цикл обучения.
Наделла привел конкретный пример из сферы продаж. Система, составляющая коммерческие предложения с помощью ИИ-агента, без цикла обучения может составить 80 из 100 предложений, которые потребуют редактирования продавцом с учетом ценовой модели компании или болевых точек клиента, и в следующем месяце проблема повторится. В системе с циклом обучения система будет захватывать каждое действие по редактированию. После обучения на 500 предложениях система усвоит реальную логику продаж компании, а не общий процесс. К 1000-му предложению редактирование практически не потребуется. Таким образом, компания создает эксклюзивную интеллектуальную собственность, которую невозможно получить простым скачиванием.
В соответствующей служебной записке Наделла указал, что не следует конкурировать в выборе моделей, поскольку все компании могут использовать такие модели, как Claude, GPT и Gemini. Преимущество должно исходить из систем, построенных вокруг моделей, а не из вычислительной мощности самих моделей. Интерес Microsoft заключается в том, что она хочет, чтобы компании строили эти циклы на своей платформе Azure, включая тонкую настройку, хранение проприетарных данных и вложение средств, чтобы сделать переход затруднительным. Эта концепция смещает фокус конкуренции с «у кого лучшая модель» на «кто построил самую умную систему».
В отрасли существуют разные мнения относительно теории цикла обучения. OpenAI в настоящее время поддерживает широкий спектр методов тонкой настройки, но ее более крупная стратегия заключается в постоянном улучшении базовых моделей, делая их достаточно мощными, чтобы не требовать сложных циклов. Anthropic склоняется к управлению через проекты, поисковые рабочие процессы и конституционный ИИ, при этом ее тонкая настройка в основном ограничивается более старыми моделями Claude, уделяя больше внимания контролю, безопасности и управлению. Путь с открытым исходным кодом через LoRA и параметро-эффективную тонкую настройку на таких моделях, как Llama, обеспечивает независимость, но перекладывает операционную нагрузку на пользователя. Есть и прагматики, которые утверждают, что вызов API и автоматическое обновление могут быть более простым выбором.
Построение цикла обучения требует одновременного решения проблем на трех уровнях: на уровне инфраструктуры необходимо построить конвейер для захвата обучающих данных из использования в реальном времени, тонкой настройки, развертывания и мониторинга результатов; на уровне управления данными необходимо преобразовывать проприетарные диалоги и рабочие процессы в чистые, соответствующие требованиям и машиночитаемые обучающие данные; на уровне дисциплины требуется постоянная оценка для подтверждения того, что модель действительно улучшает результаты. Бизнес-консультант Кумар Гаурав (Kumar Gauraw) неоднократно документировал эту модель: команды спешно проводят тонкую настройку, арендуют дорогие GPU, а затем обнаруживают, что лучше написанный промпт решает задачу за меньшее время. Регулирование также добавляет сложности. Дарио Амодеи (Dario Amodei) из Anthropic недавно предложил ввести для передовых моделей независимый аудит, аналогичный авиационному регулированию, проводимый до развертывания. Для крупных компаний, имеющих отделы комплаенс, это еще управляемо, но для компаний среднего звена, постоянно проводящих тонкую настройку на проприетарных данных, это гораздо сложнее.
Несмотря на вышеуказанные проблемы, основной тезис Наделлы заслуживает внимания: компании, которые рано построят проприетарные циклы обучения, смогут получить трудно копируемое преимущество. Это преимущество проистекает не из самой технологии, а из того, что цикл кодирует институциональные знания в систему, которая улучшается при каждом использовании. Это создание актива, а не просто покупка доступа к более умным моделям. Настоящий вопрос заключается в том, способна ли компания взять на себя инфраструктуру, управление и дисциплину, необходимые для построения цикла, или же ей следует дождаться, пока сами модели станут достаточно мощными, чтобы не требовать сложных циклов. Это стратегический выбор, касающийся позиционирования компании.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









