JD.com совместно с исследовательскими институтами представила технологию RLSD для снижения затрат на обучение моделей ИИ-рассуждений
2026-04-29 15:14
В избр.

Репортаж от Wedoany,Высокая стоимость обучения моделей ИИ-рассуждений давно является проблемой для корпоративных команд. Исследователи JD.com в сотрудничестве с рядом академических институтов предложили новую парадигму обучения под названием RLSD, направленную на создание пользовательских агентов рассуждения с использованием меньших вычислительных ресурсов. Эта технология сочетает обучение с подкреплением и самодистилляцию, решая проблемы разреженности сигнала или больших вычислительных затрат, характерные для традиционных методов.

rlvr

В экспериментах модель, обученная с помощью RLSD, достигла средней точности 56,18% на нескольких бенчмарках визуального рассуждения, превзойдя базовую модель и стандартный метод RLVR. Соавтор работы Ян Чэньсюй пояснил, что RLSD разделяет направление и величину обновления, используя верифицируемый сигнал вознаграждения для определения направления и добиваясь пошаговой обратной связи на уровне токенов за счет самодистилляции. Это позволяет избежать проблемы утечки информации и поддерживает стабильность обучения.

RLSD требует лишь одного дополнительного прямого прохода, а скорость его сходимости примерно в два раза выше, чем у традиционных методов. Он подходит для задач с верифицируемым вознаграждением, таких как компиляция кода или математическая верификация, и может гибко использовать привилегированную информацию. Эту технологию можно легко интегрировать в существующие открытые фреймворки, что открывает компаниям новый путь для оптимизации моделей с использованием внутренних данных.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Ланкастерский университет запускает ядерный симулятор стоимостью 2 миллиона фунтов стерлингов
2026-06-20
Deutsche Telekom T-Systems и SupplyOn объединяют усилия для внедрения ИИ в европейские цепочки поставок
2026-06-20
Американская компания Hyperscale Data планирует закупить гуманоидных роботов на 13,4 млн долларов в третьем квартале 2026 года для развертывания в Мичигане
2026-06-20
Amazon рассматривает возможность продажи чипов Trainium AI центрам обработки данных
2026-06-20
Индийская компания Synergy Quantum представляет интегрированный постквантовый защищённый комплект SynQ Suite
2026-06-20
Американская компания Allbirds переименована в Smartbird, получив 143 миллиона долларов на переход в сферу ИИ-инфраструктуры
2026-06-20
Anglian Water и What Caused This создают цифровую платформу для анализа первопричин
2026-06-20
Американская компания Panthalassa завершила раунд финансирования серии B на сумму 140 миллионов долларов для расширения плавучей платформы данных
2026-06-20
UltramapGlobal обновляет платформу мониторинга оптоволоконных кабелей
2026-06-20
OQC инвестирует 92 миллиона евро в создание глобального центра исследований и производства в Барселоне, Испания
2026-06-20
Последние новости
1
Компания Terrestrial Energy получила 77 акров земли для испытаний реактора на расплавленной соли
2
В штате Огайо (США) в 2030 году начнется строительство проекта малых модульных реакторов BWRX-300 мощностью 1,5 ГВт
3
На реакторе на быстрых нейтронах БРЕСТ-ОД-300 в России завершена первая заливка фундамента турбоагрегата
4
Ланкастерский университет запускает ядерный симулятор стоимостью 2 миллиона фунтов стерлингов
5
На Запорожской АЭС начат ремонт линии электропередачи 750 кВ
6
Реактор Ward 250 компании Valar Atomics достиг критичности
7
Американская компания Oklo подписала письмо о намерениях с Centrus на поставку топлива для пяти реакторов
8
Tata Power из Индии выиграла проект по передаче электроэнергии в Карнатаке с годовым доходом в 5,2107 млрд рупий
9
ЕС одобрил 1 миллиард евро для Словакии и запустил план чистой энергетики на 690 миллионов евро для Египта
10
План строительства подстанции мощностью 4,22 ГВт в регионе Хамбер компании National Grid получил одобрение