SK Telecom (SKT) и Krafton недавно объявили о совместной разработке трех специальных языковых моделей рассуждения 7B (7 миллиардов параметров), которые сосредоточены на решении математических задач и задачах разработки кода. Модель использует технологию обучения, разработанную Krafton самостоятельно, и продемонстрировала значительную производительность в бенчмарке математического рассуждения AIME 25, что знаменует собой прорыв в применении небольших языковых моделей в конкретных областях. Это сотрудничество сочетает в себе преимущества SKT в построении инфраструктуры с технологическими инновационными возможностями Krafton, обеспечивая новую парадигму для разработки моделей ИИ в вертикальной сфере.

Выпущенная модель оптимизирована для математических рассуждений и сценариев генерации кода, и ее основное преимущество заключается в технологии ретроспективного обучения неправильным ответам, разработанной Krafton. Эта технология значительно повышает точность рассуждений, анализируя случаи ошибок в выводе модели, автоматически генерируя схемы коррекции и итеративно оптимизируя их. « Наша технология позволяет точно определять слабые места модели и усиливать логическую цепочку путем сравнительного обучения, что особенно важно в области математики, требующей высокого пространственного восприятия »,-сказал Крафтон. Математические способности имеют техническую общность с сценариями рассуждения высокой сложности, такими как разработка игр, и Крафтон планирует еще больше расширять границы применения игрового ИИ на основе этой модели.
В рамках проекта SKT взяла на себя работу по созданию инфраструктуры для проверки данных и обучения моделям. Построив распределенную вычислительную структуру и автоматизированную систему тестирования, SKT обеспечивает эффективность обучения модели и стабильность выходных результатов. Результаты сотрудничества между двумя сторонами уже рассматриваются как типичные случаи разработки моделей ИИ в конкретных областях, их идеи модульного проектирования могут быстро адаптироваться к потребностям различных отраслей. Крафтон сообщил, что в будущем будет изучено применение модели в таких сценариях, как моделирование поведения игровых NPC и генерация динамических сюжетов, в то время как SKT планирует расширить свои технологии на области умных городов и промышленной автоматизации.









