Репортаж от Wedoany,Компания FAR Labs объявила об открытии регистрации на свою платформу ИИ-инференса FAR AI, предоставив доступ разработчикам и опубликовав цены на развёртывание нескольких моделей. Эта базирующаяся в Абу-Даби компания в сфере искусственного интеллекта и инфраструктуры (входящая в Dizzaract) стремится помочь разработчикам снизить эксплуатационные расходы на ИИ-приложения по мере роста использования программных продуктов и инструментов автоматизации.

Основой платформы является распределённая сеть инференса, которая сопоставляет потребности разработчиков с доступными вычислительными ресурсами. Пользователи могут получить доступ к системе через совместимый с OpenAI API, выбирать из нескольких моделей и быстро запускать их, а их рабочие нагрузки маршрутизируются через FAR Orchestrator для выполнения на ресурсах GPU. FAR Labs делает стоимость своим главным конкурентным преимуществом. Сравнивая свои цены с ценами других провайдеров, компания утверждает, что её сетевая структура позволяет предлагать значительно более низкие цены на некоторые развёртывания.
В частности, для модели Qwen3-30B-A3B цена FAR AI составляет 0,03 доллара за 1 миллион токенов, тогда как у NextBit — 0,35 доллара, а у DeepInfra — 0,27 доллара. Компания заявляет, что эта цена ниже последней на целых 91%. Для модели Qwen2.5-72B-Instruct компания указывает цену FP8 в 0,17 доллара за 1 миллион токенов, в то время как у NovitaAI BF16 — 0,39 доллара, а у DeepInfra FP8 — 0,38 доллара. Утверждается, что это делает их ценообразование на 55–56% ниже, чем у указанных альтернатив. Для модели Qwen3.5-122B-A10B FAR AI указывает цену FP8 в 0,51 доллара за 1 миллион токенов. По словам компании, по сравнению с такими провайдерами, как AtlasCloud FP8 и SiliconFlow FP8, стоимость выходных токенов снижена на целых 79%.
Этот шаг FAR Labs происходит в то время, когда ИИ-компании сталкиваются с иными экономическими вызовами, чем в предыдущие годы. Несмотря на значительное снижение цены за токен, общие расходы на инференс продолжают расти, поскольку компании отправляют всё больше ИИ-запросов через инструменты поддержки клиентов, агентов, ассистентов, игры и внутренние рабочие процессы. Этот сдвиг особенно важен для разработчиков, которые полагаются на проприетарные API таких компаний, как OpenAI и Anthropic. По мере масштабирования продуктов повторяющиеся расходы на инференс могут сжимать прибыль и ограничивать пространство для тестирования и расширения.
FAR Labs заявляет, что её ценовое преимущество проистекает из использования недостаточно загруженных вычислительных ресурсов, а не из опоры на крупные специализированные кластеры центров обработки данных. Платформа использует доступную мощность GPU от потребительских устройств и центров обработки данных малого и среднего бизнеса, распределяя работу через свой ориентированный на производительность уровень оркестрации. Компания также пытается решать вопросы, выходящие за рамки цены, утверждая, что разработчики, запускающие производственные рабочие нагрузки, нуждаются в системах, которые являются приватными, надёжными в маршрутизации, с низкой задержкой и пригодными для реальных сценариев. Её уровень оркестрации включает безопасный инференс на основе доверенных сред исполнения, рейтинги надёжности, поддержку открытых и проприетарных моделей, а также семантические векторные потоки. По словам FAR Labs, система маршрутизации спроектирована с учётом времени безотказной работы, непрерывности рабочих нагрузок и производительности, чувствительной к задержкам.
Компания сообщает, что во время конференции SuperAI Singapore в многочисленных беседах с разработчиками, поставщиками GPU, командами моделей, инвесторами и руководителями предприятий упоминался интерес к такой инфраструктуре, что указывает на потребность в более быстрой, надёжной, дешёвой и готовой к производству инфраструктуре инференса. FAR AI в настоящее время находится на стадии тестирования с закрытыми партнёрами и предлагает разработчикам раннюю регистрацию доступа, предоставляя 1 миллион бесплатных токенов для тех, кто присоединится к программе.
В заявлении основатель и генеральный директор Dizzaract Ильман Шажаев изложил рыночное обоснование компании. «Цены на ИИ постоянно снижаются. С 2021 года стоимость за токен упала примерно на 99%. Однако счета за ИИ продолжают расти, потому что объёмы использования растут быстрее, чем падают цены. Инференс становится крупнейшей единичной статьёй расходов в ИИ», — сказал он. «Наше ценовое преимущество — это не скидка за счёт сжигания денег. Оно структурное».
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









