Южнокорейские софтверные компании комбинируют технологии для борьбы с резким ростом затрат на токены AI-агентов
2026-07-02 08:57
В избр.

Репортаж от Wedoany,Южнокорейские софтверные компании активно используют комбинацию таких технологий, как оптимизация промптов, LLM-шлюзы, локальное развертывание и мультимодельные стратегии, чтобы снизить резкий рост затрат на токены, вызванный распространением AI-агентов.

[Источник изображения: сгенерировано nanobanana2]

Для выполнения задач AI-агенты многократно самостоятельно вызывают языковые модели и используют различные инструменты, что приводит к увеличению расхода токенов в несколько раз и даже в десятки раз по сравнению с использованием человеком. Одна южнокорейская компания с начала этого года внедрила AI-агентов во всей организации, ежемесячно потребляя около 250 миллиардов токенов, что порождает ежемесячные затраты на инфраструктуру в размере от 200 до 300 миллионов южнокорейских вон.

Некоторые компании начинают с облегчения промптов и кэширования. WISEITECH сокращает ненужные длинные вводы и повторные вызовы, а Naver Cloud оптимизирует модели в зависимости от задачи. Компании рассматривают LLM-шлюзы как ключевые узлы управления, осуществляя мониторинг использования моделей в различных отделах в реальном времени. Hancom интегрирует системы маршрутизации и отката, а NDS строит шлюзы на основе LiteLLM.

Многие компании также применяют локальное развертывание. MakinaRocks подключает модели с открытым исходным кодом к собственной инфраструктуре vLLM, а S2W использует собственные GPU-серверы для обработки задач с большим объемом. Мультимодельная стратегия позволяет передавать стандартизированные повторяющиеся задачи легковесным моделям или моделям с открытым исходным кодом. Crowdworks использует коммерческие модели, такие как Amazon Bedrock, в сочетании с мини-моделями. CyNapse Soft внедряет технологии Serena MCP и LSP, разделяя исходный код на семантические блоки, что позволяет сэкономить около 20% токенов по сравнению с фреймворками с открытым исходным кодом.

Оптимизация затрат в эпоху генеративного AI проверяет способность компаний проектировать архитектуру. Удаление повторяющихся запросов через кэширование, изоляция конфиденциальных данных при локальном развертывании и замена дорогостоящих моделей с помощью маршрутизации — построение комплексной системы контроля станет критерием, определяющим устойчивость софтверных компаний.

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com
Связанные продукты
Связанные рекомендации
Кувейтская Zain выиграла тендер на получение 25-летней телекоммуникационной лицензии в Сирии за 747 миллионов долларов
2026-07-02
Magna AI и EEC построят суверенную ИИ-инфраструктуру в Саудовской Аравии
2026-07-02
В индийском штате Телангана планируется строительство дата-центра на площади 1500 акров
2026-07-02
Digital Realty приобретает три гипермасштабируемых центра обработки данных в Северной Виргинии за 3,5 миллиарда долларов
2026-07-02
VodafoneZiggo в Нидерландах завершила развертывание единой платформы управления сбоями
2026-07-02
Google Cloud расширяет базу данных Spanner, добавляя поддержку мультимодельности и ИИ
2026-07-02
Инженеры американской компании Nvidia возглавляют разработку открытого программного стека для роботов Isaac ROS
2026-07-02
Американские компании, такие как Google и Meta, инвестируют в AppsFlyer
2026-07-02
С 7 июля AT&T расширяет услугу Build-A-Plan
2026-07-02
Япония выделяет 1 триллион иен на разработку базовой модели ИИ
2026-07-02
Последние новости
1
Крупногабаритный цилиндр массой 45 тонн из суперсплава Lanzhou LS успешно поставлен
2
Кувейтская Zain выиграла тендер на получение 25-летней телекоммуникационной лицензии в Сирии за 747 миллионов долларов
3
Magna AI и EEC построят суверенную ИИ-инфраструктуру в Саудовской Аравии
4
В индийском штате Телангана планируется строительство дата-центра на площади 1500 акров
5
Накопленная выработка электроэнергии ГЭС «Суапити» в Гвинее превысила 10 миллиардов кВт·ч
6
Digital Realty приобретает три гипермасштабируемых центра обработки данных в Северной Виргинии за 3,5 миллиарда долларов
7
Китайский Xiaomi Auto в июне снова поставил более 30 000 автомобилей, за первое полугодие накоплено около 180 000 единиц
8
VodafoneZiggo в Нидерландах завершила развертывание единой платформы управления сбоями
9
Google Cloud расширяет базу данных Spanner, добавляя поддержку мультимодельности и ИИ
10
Инженеры американской компании Nvidia возглавляют разработку открытого программного стека для роботов Isaac ROS