Швейцарская команда разработала модель TutorRL с 7 миллиардами параметров, балансирующую предметные знания и педагогические навыки
2026-06-15 16:14
В избр.

Репортаж от Wedoany,Швейцарский постдок Якуб Мачина совместно с профессором информатики Мриньмаей Сачаном и учёным в области обучения Ману Капуром разработал модель ИИ под названием «TutorRL», предназначенную для балансирования предметных знаний и педагогических навыков. Эта модель требует всего 7 миллиардов параметров, что значительно меньше, чем у современных основных больших языковых моделей, насчитывающих сотни миллиардов или даже триллионы параметров, и она менее склонна отклоняться от темы в ходе учебных взаимодействий, состоящих из 20 шагов.

Исследования Мачины сосредоточены на том, как превратить большие языковые модели в учебных коучей, обладающих педагогической ценностью. Он отмечает, что большинство существующих больших языковых моделей оптимизированы для генерации ответов и решений, а не для направления пользователей к самостоятельному мышлению в процессе обучения. Даже при явном указании в подсказке на необходимость предоставления учебной поддержки результаты обычно оказываются неудовлетворительными. Для проверки педагогической пригодности различных моделей Мачина совместно с исследователями из Дармштадтского технического университета (TU Darmstadt) разработал бенчмарк для оценки преподавания математики «MathTutorBench». Этот бенчмарк основан на данных диалогов с учителями и учебного процесса, создавая систему оценки для конкретных педагогических навыков, используемую для сравнения и анализа ответов больших языковых моделей. Тестирование показало, что разные модели часто демонстрируют компромисс между предметными знаниями и педагогическими навыками, и большинство моделей при пошаговых ответах склонны терять нить рассуждений и отклоняться от темы.

Во втором проекте Мачина разработал модель TutorRL. Эта модель обучается посредством многошагового взаимодействия между виртуальным учеником и виртуальным учителем, не требуя дорогостоящих обучающих данных. В процессе обучения используется другая модель для мониторинга учебного процесса и оценки реакций виртуального учителя, что позволяет реализовать «обучение с подкреплением». Мачина отмечает, что огромное преимущество этого метода заключается в отсутствии необходимости в огромных объёмах данных и в возможности использования меньших языковых моделей. По сравнению с новейшими моделями OpenAI или Google, имеющими сотни миллиардов или триллионы параметров, модель TutorRL с 7 миллиардами параметров значительно меньше. Предварительные результаты показывают, что TutorRL лучше балансирует между предметными знаниями и педагогическими навыками, чем традиционные большие языковые модели, и менее склонна отклоняться от темы. Модель также может объяснять причины своих ответов и решений в процессе обучения, что облегчает учителям понимание и мониторинг учебного процесса.

TutorRL теперь доступен бесплатно в виде открытого исходного кода, и его загрузили уже более тысячи раз. Однако модель ещё не была протестирована и оценена на реальных учащихся в классе; в настоящее время она применима только для преподавания математики на уровне старших классов и начальных курсов бакалавриата. Мачина считает, что в долгосрочной перспективе модель также может использоваться для таких дисциплин MINT, как математика, информатика, естественные науки и технология, и её производительность достаточна для поддержки магистерских курсов. Он отмечает, что исследование актуально не только для преподавания, но и имеет фундаментальное значение для дальнейшего развития искусственного интеллекта, поскольку совместное решение проблем станет ключевым во многих будущих сферах работы, и человеческое суждение по-прежнему будет иметь решающее значение.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Чжан Цзинтао и др. из Китайской академии информационных и коммуникационных технологий: Модель и стратегические предложения по строительству цифровых городов-двойников
2026-06-17
Российская платформа для эффективных онлайн-встреч Mymeet.ai открыла протокол MCP для подключения ИИ-агентов
2026-06-17
Российская команда Deckhouse выпустила Stronghold 1.18 с усиленной безопасностью ключей и возможностями аудита
2026-06-17
Японская компания transcosmos и Kyoei запускают SmartOrderLink
2026-06-17
Китайская компания Longsys представляет чип WM8500, обеспечивающий сжатие 2:1 для твердотельных накопителей объёмом 128 ГБ
2026-06-17
Китай планирует инвестировать 2 триллиона юаней в создание национальной сети ИИ-вычислений, цель — завершить к 2028 году
2026-06-17
Bull и Foxconn будут производить AI-системы в Чехии и Франции с использованием NVIDIA Vera Rubin
2026-06-17
Китайская команда разработала интеллектуальную систему оптимизации компиляции OSCAR для ускорения работы отечественных чипов
2026-06-17
Мексиканские Toku и Cobre запускают решение для приема платежей в реальном времени через SPEI
2026-06-17
Швейцарская ABB и южнокорейская Samsung объединяют усилия для создания интеграционного решения для интеллектуальных зданий и корпоративного Интернета вещей
2026-06-17
Последние новости
1
Бразильская компания по добыче критических минералов подала заявки на получение руководства по разработке редкоземельного проекта Ema
2
Nippon Steel обязалась инвестировать 2,5 миллиарда долларов в US Steel для модернизации ключевых промышленных активов
3
Британская Certas Energy инвестирует 1,5 миллиона фунтов стерлингов в модернизацию сети заправочных станций
4
Индийская NGEL ввела в эксплуатацию дополнительные 50 МВт солнечной мощности в рамках проекта RTC в Раджастхане
5
Siemens Energy поставит турбины для электростанции Taweelah C мощностью 2,6 ГВт в ОАЭ
6
Абу-Дабийский фонд Mubadala инвестирует 200 миллионов долларов в подводную электрическую линию между Великобританией и Ирландией
7
Первая в Индии воздушно-охлаждаемая сверхкритическая ТЭС введена в эксплуатацию компанией BHEL
8
Verogy запускает солнечные проекты на четырёх свалках в Коннектикуте, США
9
Create Energy приобретает производителя солнечных трекеров SOL Components
10
Великобритания запускает центр инноваций в ветроэнергетике, выделив 2 миллиона фунтов стерлингов на ускорение инноваций