Швейцарская команда разработала модель TutorRL с 7 миллиардами параметров, балансирующую предметные знания и педагогические навыки_Глобальные новости

Швейцарская команда разработала модель TutorRL с 7 миллиардами параметров, балансирующую предметные знания и педагогические навыки

2026-06-15 16:14

В избр.

Репортаж от Wedoany，Швейцарский постдок Якуб Мачина совместно с профессором информатики Мриньмаей Сачаном и учёным в области обучения Ману Капуром разработал модель ИИ под названием «TutorRL», предназначенную для балансирования предметных знаний и педагогических навыков. Эта модель требует всего 7 миллиардов параметров, что значительно меньше, чем у современных основных больших языковых моделей, насчитывающих сотни миллиардов или даже триллионы параметров, и она менее склонна отклоняться от темы в ходе учебных взаимодействий, состоящих из 20 шагов.

Исследования Мачины сосредоточены на том, как превратить большие языковые модели в учебных коучей, обладающих педагогической ценностью. Он отмечает, что большинство существующих больших языковых моделей оптимизированы для генерации ответов и решений, а не для направления пользователей к самостоятельному мышлению в процессе обучения. Даже при явном указании в подсказке на необходимость предоставления учебной поддержки результаты обычно оказываются неудовлетворительными. Для проверки педагогической пригодности различных моделей Мачина совместно с исследователями из Дармштадтского технического университета (TU Darmstadt) разработал бенчмарк для оценки преподавания математики «MathTutorBench». Этот бенчмарк основан на данных диалогов с учителями и учебного процесса, создавая систему оценки для конкретных педагогических навыков, используемую для сравнения и анализа ответов больших языковых моделей. Тестирование показало, что разные модели часто демонстрируют компромисс между предметными знаниями и педагогическими навыками, и большинство моделей при пошаговых ответах склонны терять нить рассуждений и отклоняться от темы.

Во втором проекте Мачина разработал модель TutorRL. Эта модель обучается посредством многошагового взаимодействия между виртуальным учеником и виртуальным учителем, не требуя дорогостоящих обучающих данных. В процессе обучения используется другая модель для мониторинга учебного процесса и оценки реакций виртуального учителя, что позволяет реализовать «обучение с подкреплением». Мачина отмечает, что огромное преимущество этого метода заключается в отсутствии необходимости в огромных объёмах данных и в возможности использования меньших языковых моделей. По сравнению с новейшими моделями OpenAI или Google, имеющими сотни миллиардов или триллионы параметров, модель TutorRL с 7 миллиардами параметров значительно меньше. Предварительные результаты показывают, что TutorRL лучше балансирует между предметными знаниями и педагогическими навыками, чем традиционные большие языковые модели, и менее склонна отклоняться от темы. Модель также может объяснять причины своих ответов и решений в процессе обучения, что облегчает учителям понимание и мониторинг учебного процесса.

TutorRL теперь доступен бесплатно в виде открытого исходного кода, и его загрузили уже более тысячи раз. Однако модель ещё не была протестирована и оценена на реальных учащихся в классе; в настоящее время она применима только для преподавания математики на уровне старших классов и начальных курсов бакалавриата. Мачина считает, что в долгосрочной перспективе модель также может использоваться для таких дисциплин MINT, как математика, информатика, естественные науки и технология, и её производительность достаточна для поддержки магистерских курсов. Он отмечает, что исследование актуально не только для преподавания, но и имеет фундаментальное значение для дальнейшего развития искусственного интеллекта, поскольку совместное решение проблем станет ключевым во многих будущих сферах работы, и человеческое суждение по-прежнему будет иметь решающее значение.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com