Репортаж от Wedoany,С ускорением итерации технологий больших языковых моделей токен (Token), как минимальная единица информации для ввода и вывода больших языковых моделей, превращается из технического термина за кулисами в ключевое понятие эпохи интеллектуальной экономики. Согласно статистическим данным Государственного управления данных Китая, по состоянию на конец марта 2026 года среднесуточный объем вызовов токенов в Китае превысил 140 триллионов, что более чем в тысячу раз больше по сравнению с началом 2024 года. Токены все чаще становятся основным показателем для измерения производительности модельных сервисов, эффективности использования вычислительных мощностей и зрелости отрасли. Высококачественные токен-сервисы, с одной стороны, обеспечивают оптимизацию обучения и инференса моделей, а с другой — способствуют внедрению приложений в тысячах отраслей, играя важную роль в укреплении базы поставок больших языковых моделей и раскрытии ценности приложений искусственного интеллекта.
Для содействия высококачественному развитию токен-сервисов в Китае Академия информационных и коммуникационных технологий Китая (сокращенно «Китайская академия ИКТ») совместно с 10 организациями, включая Huawei Cloud, Ant Digital Technologies, Mobile Jiutian, Unicom Digital Intelligence, JD Cloud, Lenovo Baiying, Inspur Haiyue, Haowei Technology, Tianyun Data и Paiyun Cloud, официально запустила «Программу восхождения по способностям токен-сервиса» (сокращенно «Программа восхождения») и разработала и опубликовала «Базовый уровень производительности токен-сервиса для корпоративных сценариев общего назначения».
Первый базовый уровень производительности корпоративного токен-сервиса (сценарии общего назначения)
Количество выводимых токенов в секунду (TPS) ≥ 55 токенов/сек
Задержка первого токена (TTFT) ≤ 0,9 секунды
Успешность вызова ≥ 99,9%
Данная «Программа восхождения» ориентирована на такие ключевые направления, как установление эталонов, повышение производительности, стабилизация сервисов, снижение затрат и консолидация экосистемы. Она фокусируется на ключевых трудностях и общих проблемах в процессе инженерного внедрения токен-сервисов. Используя данные мониторинга «Платформы мониторинга производительности токен-сервисов больших языковых моделей» Китайской академии ИКТ, программа предоставляет отрасли динамически обновляемые ежеквартальные эталоны производительности и регулярно публикует список предприятий, достигших целей «Программы восхождения», способствуя переходу токен-сервисов от стадии «пригодности к использованию» к стадии «удобства и доступности».
Институт исследований искусственного интеллекта Китайской академии ИКТ долгое время занимается исследованиями политики, разработкой технологий, стандартизацией, построением экосистемы, а также тестированием и оценкой в области искусственного интеллекта. На следующем этапе он продолжит продвигать «Программу восхождения по способностям токен-сервиса» для ускорения высококачественного развития токен-сервисов.
Во-первых, будет продолжен набор предприятий-участников. Приглашаются новые компании присоединиться и бросить вызов «Программе восхождения», чтобы совместно повысить производительность токен-сервисов в сценариях общего назначения. Кроме того, Китайская академия ИКТ оптимизирует инструменты и методы тестирования способностей токен-сервисов, обеспечивая эффективную работу механизма динамического обновления эталонов.
Во-вторых, планируется совместное создание отраслевых программ восхождения. В сотрудничестве с ведущими предприятиями и поставщиками технологий из различных отраслей будут разработаны базовые уровни производительности токен-сервисов для вертикальных отраслевых сценариев, а также определены пути восхождения.
В-третьих, будет предоставлена комплексная оценка полного стека возможностей высококачественных токен-сервисов. С одной стороны, будет продолжена итерация и совершенствование платформы тестирования производительности (TokenBenchX) и специализированных наборов тестовых данных для предоставления профессиональной комплексной оценки производительности предприятиям токен-сервисов. С другой стороны, будет проводиться оценка полного стека возможностей токен-сервисов, охватывающая весь процесс производства и эксплуатации, а также качество и безопасность сервисов.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









