Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Apache Samza - это асинхронная вычислительная среда с открытым исходным кодом , работающая почти в реальном времени, для потоковой обработки, разработанная Apache Software Foundation на Scala и Java . Он был разработан совместно с Apache Kafka . Оба изначально были разработаны LinkedIn . [1]

Обзор [ править ]

Samza позволяет пользователям создавать приложения с отслеживанием состояния, которые обрабатывают данные в режиме реального времени из нескольких источников, включая Apache Kafka.

Samza обеспечивает отказоустойчивость, изоляцию и обработку с отслеживанием состояния. В отличие от пакетных систем, таких как Apache Hadoop или Apache Spark , он обеспечивает непрерывные вычисления и вывод, в результате чего время отклика составляет менее секунды [2] .

Есть много игроков в области потоковой обработки в реальном времени, и Samza - один из зрелых продуктов. [3] [4] [5] Он был добавлен в Apache в 2013 году. [6]

Samza используется несколькими компаниями. [7] Самая большая установка - в LinkedIn.

См. Также [ править ]

Ссылки [ править ]

  1. ^ «Как LinkedIn использует Apache Samza» . InfoQ . Проверено 28 сентября 2016 .
  2. ^ «Самза: масштабируемая обработка потоков с отслеживанием состояния в LinkedIn» (PDF) .
  3. ^ «Spark Streaming против Flink против Storm против Kafka Streams против Samza: выберите свой фреймворк обработки потока» . www.linkedin.com . Проверено 23 июля 2019 .
  4. ^ «Сравнение механизмов обработки потоков Apache Spark, Storm, Flink и Samza - Часть 1» . Скотт Логик . Проверено 23 июля 2019 .
  5. ^ «Hadoop, Storm, Samza, Spark и Flink: Сравнение платформ больших данных» . DigitalOcean . Проверено 23 июля 2019 .
  6. ^ "Apache Samza" . blogs.apache.org . Проверено 23 июля 2019 .
  7. ^ "Samza - Powered By" . samza.apache.org . Проверено 23 июля 2019 .

Внешние ссылки [ править ]

  • Веб-сайт Apache Samza