Netflix оптимизирует запросы Apache Druid: 84% результатов поступает из кэша
2026-06-04 10:41
В избр.

Репортаж от Wedoany,Компания Netflix (Нетфликс) оптимизировала эффективность запросов к базе данных Apache Druid, внедрив стратегию кэширования с учётом интервалов. В результате около 84% аналитических результатов поступает из кэша, нагрузка на запросы снизилась примерно на 33%, а время выполнения P90 улучшилось на 66%. Оптимизация в основном реализована через внешний прокси-слой кэширования, решая проблему избыточных вычислений и повторного сканирования больших наборов данных, вызванных незначительным смещением временных диапазонов при непрерывном обновлении запросов на панелях мониторинга с прокручивающимся окном.

В масштабах Netflix система реального времени обрабатывает триллионы строк данных, обеспечивая поддержку панелей мониторинга для мониторинга, экспериментов и операционных решений. Эти панели часто выполняют почти идентичные запросы, например, подсчёт уровня ошибок или показателей вовлечённости в скользящем временном окне. Эван Кинг, сооснователь Hello Interview, отмечал, что традиционное кэширование рассматривает повторяющиеся запросы с одинаковым намерением, но незначительно смещёнными временными границами, как разные запросы, что приводит к низкой частоте повторного использования кэша и повторным вычислениям в Apache Druid.

Метод Netflix разбивает результаты запросов на сегменты, выровненные по времени, чтобы их можно было повторно использовать в перекрывающихся запросах с прокручивающимся окном. Вместо кэширования полного вывода запроса система хранит промежуточные агрегации за фиксированные временные интервалы. Когда поступает новый запрос, кэшированные сегменты используются для относительно стабильной исторической части временного окна, а данные только за последний интервал пересчитываются из Druid и объединяются с кэшированными результатами.

При рабочей нагрузке более 10 триллионов строк в Apache Druid повторяющиеся запросы с прокручивающимся окном стали основным узким местом. Слой кэширования, используя сегменты с выравниванием по гранулярности и стратегию экспоненциального TTL (времени жизни), обеспечивает долгосрочное кэширование исторических интервалов, сохраняя актуальность самых свежих данных. Архитектурно слой кэширования работает как внешний прокси, перехватывая входящие запросы, разделяя структуру запроса и временной интервал, генерируя повторно используемые ключи кэша. Сегменты кэша хранятся в распределённой системе ключ-значение, поддерживая независимое истечение срока действия и эффективный поиск.

Благодаря такой конструкции только последний интервал требует пересчёта, а исторические сегменты могут повторно использоваться в нескольких перекрывающихся запросах. В результате временной диапазон операций запросов, поступающих в Druid, значительно сокращается, сканируется меньше сегментов и обрабатывается меньше данных. При определённых рабочих нагрузках Netflix наблюдала уменьшение объёма результирующих байтов до 14 раз и значительное сокращение сканирования сегментов.

В настоящее время система развёрнута как экспериментальный слой и продолжает развиваться. Будущие работы включают расширение поддержки шаблонных SQL-запросов, используемых инструментами панелей мониторинга, чтобы уменьшить зависимость от нативных выражений запросов Druid. Netflix также изучает возможность прямой интеграции кэширования с учётом интервалов в Apache Druid, чтобы устранить необходимость во внешнем прокси-слое и повысить эффективность планирования запросов.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Британская WSP с помощью ИИ экономит инженерам 165 минут в неделю
2026-06-04
Американская компания SpaceX планирует привлечь 75 миллиардов долларов в рамках IPO, которое может стать крупнейшим в истории
2026-06-04
В 2026 году в Шанхае (Китай) прошёл четвёртый Форум по развитию информатизации передового производства
2026-06-04
81% респондентов в Великобритании поддерживают внедрение дорожных камер с ИИ
2026-06-04
Британская компания Gigaton привлекла $26 млн в рамках раунда финансирования серии A
2026-06-04
Большая модель сварки Boqing Technology стала первой в Китае промышленной сварочной моделью, прошедшей государственную регистрацию
2026-06-04
В апреле 2026 года китайская компания Zeta Technology открыла инновационный научно-исследовательский штаб в Нанкине
2026-06-04
Поставщики WMS, такие как Manhattan Associates, заявляют, что SaaS-модель становится основным способом развертывания в складской отрасли
2026-06-04
Китай запускает акцию «Модульно-цифровой резонанс» 2026 года для масштабного внедрения промышленного ИИ
2026-06-04
Китайская компания Ubtech 2 июня запускает предпродажи первого в мире полноразмерного сверхбионического человекоподобного робота
2026-06-04
Последние новости
1
Британская WSP с помощью ИИ экономит инженерам 165 минут в неделю
2
Американский марсианский зонд MAVEN официально завершил миссию после более чем 11 лет работы на орбите
3
Американская компания SpaceX планирует привлечь 75 миллиардов долларов в рамках IPO, которое может стать крупнейшим в истории
4
На станции Ботен на лаосском участке железной дороги Китай-Лаос началась первая масштабная реконструкция и расширение
5
В 2026 году в Шанхае (Китай) прошёл четвёртый Форум по развитию информатизации передового производства
6
81% респондентов в Великобритании поддерживают внедрение дорожных камер с ИИ
7
Британская компания Gigaton привлекла $26 млн в рамках раунда финансирования серии A
8
Крупнейшая в мире морская преобразовательная подстанция «Сердце морского ветра» приступит к монтажным работам в море
9
В июне 2026 года Liebherr поставил бульдозер PR 756 для крупного зарубежного карьера
10
Компания CNPC Powder заложила первый камень в строительство завода площадью 2000 кв. м в Калифорнии, США