Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Apache Kylin - это механизм распределенной аналитики с открытым исходным кодом , предназначенный для обеспечения интерфейса SQL и многомерного анализа (OLAP) на Hadoop и Alluxio, поддерживающих чрезвычайно большие наборы данных.

Первоначально он был разработан eBay , а теперь является проектом Apache Software Foundation . [4]

История [ править ]

Проект Kylin был запущен в 2013 году в отделе исследований и разработок eBay в Шанхае, Китай. В октябре 2014 года на github.com был открыт исходный код Kylin v0.6 под названием «KylinOLAP». [5]

В ноябре 2014 года Кайлин присоединился к инкубатору Apache Software Foundation.

В декабре 2015 года Apache Kylin получил статус проекта высшего уровня. [4]

В марте 2016 года создателями Apache Kylin была основана компания Kyligence, Inc. [6] [7] Kyligence предоставляет коммерческую аналитическую платформу на основе Apache Kylin для локальных и облачных наборов данных. [8]

Архитектура [ править ]

Apache Kylin построен на основе Apache Hadoop, Apache Hive, Apache HBase, Apache Parquet, Apache Calcite, Apache Spark и других технологий. [9] Эти технологии позволяют Kylin легко масштабироваться для поддержки больших объемов данных. [10]

Kylin состоит из следующих основных компонентов: [11] [9]

  • Сервер REST: получение и ответ на запросы пользователя или API
  • Метаданные: постоянная и управляемая система, особенно метаданные куба;
  • Механизм запросов: анализируйте SQL-запросы в соответствии с планом выполнения, а затем общайтесь с механизмом хранения;
  • Механизм хранения: развертывание и сканирование базового хранилища кубов (по умолчанию в HBase);
  • Механизм заданий: создание и выполнение задания MapReduce или Spark для встраивания исходных данных в куб;

Пользователи [ править ]

Apache Kylin был принят многими компаниями в качестве своей OLAP-платформы в производстве. Типичные пользователи: eBay, Meituan, XiaoMi, NetEase, Beike, Yahoo! Япония.

Дорожная карта [ править ]

Дорожная карта Apache Kylin (с веб-сайта Kylin [12] ):

  • Поддержка Hadoop 3.0 (Erasure Coding) - завершена (v2.5)
  • Полностью на движке Spark Cube - завершено (v2.5)
  • Подключить больше источников данных (MySQL, Oracle, SparkSQL и т. Д.) - завершено (v2.6)
  • Аналитика в реальном времени с Lambda Architecture - завершено (v3.0)
  • Собственное облачное хранилище (Parquet) - в процессе (v4.0.0-alpha)
  • Специальные запросы без кубинга

Ссылки [ править ]

  1. ^ «Предыдущий выпуск» . v0.7.1-инкубация (первый выпуск Apache) . Проверено 15 июня 2019 .
  2. ^ «Предыдущий выпуск» . v3.1.0 . Проверено 30 сентября 2020 .
  3. ^ «Apache Kylin - Примечания к выпуску» . v4.0.0-альфа . Проверено 30 сентября 2020 .
  4. ^ a b Фонд программного обеспечения Apache. «Apache Software Foundation объявляет Apache ™ Kylin ™ проектом высшего уровня» , 8 декабря 2015 г.
  5. ^ «Представляем Kylin: Extreme OLAP Engine для больших данных» . www.ebayinc.com . 2014-10-20 . Проверено 8 ноября 2018 .
  6. ^ "Apache Kylin глазами основателей - Часть первая" . Килидженс . 2020-06-12 . Проверено 30 сентября 2020 .
  7. ^ «Платформа аналитики больших данных | Подробнее о Kyligence» . Килидженс . Проверено 30 сентября 2020 .
  8. ^ «Платформа аналитики больших данных: Apache Kylin против Kyligence» . Килидженс . Проверено 30 сентября 2020 .
  9. ^ a b «Apache Kylin | Аналитическое хранилище данных для больших данных» . kylin.apache.org . Проверено 30 сентября 2020 .
  10. ^ Кнорр, Эрик (2016-03-07). «Как выглядит eBay изнутри» . InfoWorld . Проверено 30 сентября 2020 .
  11. ^ «Apache Kylin добавляет OLAP в реальном времени» . www.i-programmer.info . Проверено 30 сентября 2020 .
  12. ^ Kylin, Apache. «Apache Kylin | Краткое руководство по разработке» . kylin.apache.org . Проверено 30 сентября 2020 .