Из Википедии, свободной энциклопедии
  (Перенаправлено из Solr )
Перейти к навигации Перейти к поиску

Solr (произносится как «солнечный») - это платформа корпоративного поиска с открытым исходным кодом, написанная на Java . Его основные функции включают полнотекстовый поиск , выделение совпадений , фасетный поиск , индексацию в реальном времени, динамическую кластеризацию, интеграцию с базами данных, функции NoSQL [2] и обработку документов (например, Word, PDF). Обеспечивая распределенный поиск и репликацию индексов, Solr разработан с учетом масштабируемости и отказоустойчивости . [3] Solr широко используется для корпоративного поиска и аналитики, имеет активное сообщество разработчиков и регулярные выпуски.

Solr работает как автономный сервер полнотекстового поиска. Он использует поисковую библиотеку Lucene Java в своей основе для полнотекстового индексирования и поиска и имеет REST- подобные API HTTP / XML и JSON, которые позволяют использовать его с большинством популярных языков программирования. Внешняя конфигурация Solr позволяет адаптировать его ко многим типам приложений без программирования на Java, и он имеет архитектуру плагинов для поддержки более продвинутой настройки.

Apache Solr разрабатывается совместно с проектом Apache Solr в Apache Software Foundation .

История [ править ]

В 2004 году Йоник Сили (Yonik Seeley) из CNET Networks создал Solr в качестве внутреннего проекта для добавления возможностей поиска на веб-сайт компании.

В январе 2006 года CNET Networks решила открыто опубликовать исходный код, пожертвовав его Apache Software Foundation . [4] Как и любой новый проект Apache, он вступил в инкубационный период, который помог решить организационные, юридические и финансовые вопросы.

В январе 2007 года Solr перешел из инкубационного статуса в автономный проект верхнего уровня (TLP) и неуклонно рос за счет накопленных функций, тем самым привлекая пользователей, участников и коммиттеров. Хотя он был довольно новым в качестве общедоступного проекта, он поддерживал несколько веб-сайтов с высокой посещаемостью. [5]

В сентябре 2008 года был выпущен Solr 1.3, включающий, среди прочего, возможности распределенного поиска и улучшения производительности. [6]

В январе 2009 года Йоник Сили вместе с Грантом Ингерсоллом и Эриком Хэтчером присоединился к Lucidworks (ранее Lucid Imagination), первой компании, предоставляющей коммерческую поддержку и обучение технологиям поиска Apache Solr. [ необходима цитата ] С тех пор предложения поддержки вокруг Solr были в изобилии. [7]

В ноябре 2009 года был выпущен Solr 1.4. В этой версии были внесены улучшения в индексирование, поиск и фасетирование, а также множество других улучшений, таких как расширенная обработка документов ( PDF , Word , HTML ), кластеризация результатов поиска на основе Carrot2, а также улучшенная интеграция с базой данных. В выпуске также есть множество дополнительных плагинов. [8]

В марте 2010 года проекты Lucene и Solr объединились. [9] Раздельная загрузка продолжалась, но теперь продукты разрабатывались совместно одним набором коммиттеров.

В 2011 году схема номеров версий Solr была изменена, чтобы соответствовать Lucene. После Solr 1.4 следующий выпуск Solr был помечен как 3.1, чтобы сохранить Solr и Lucene с одним и тем же номером версии. [10]

В октябре 2012 года была выпущена версия 4.0 Solr, включая новую функцию SolrCloud. [11] В 2013 и 2014 годах было выпущено несколько выпусков Solr в линейке 4.x, постоянно расширяющих набор функций и повышающих надежность.

В феврале 2015 года был выпущен Solr 5.0 [12], первый выпуск, в котором Solr упакован как отдельное приложение [13], что прекратило официальную поддержку развертывания Solr для ведения войны . Solr 5.3 имел встроенную подключаемую среду аутентификации и авторизации. [14]

В апреле 2016 года был выпущен Solr 6.0. [15] Добавлена ​​поддержка выполнения параллельных SQL-запросов в коллекциях SolrCloud. Включает поддержку StreamExpression и новый драйвер JDBC для интерфейса SQL.

В сентябре 2017 года был выпущен Solr 7.0. [16] В этом выпуске, помимо прочего, добавлена ​​поддержка нескольких типов реплик, автоматическое масштабирование и математический механизм.

В марте 2019 года была выпущена Solr 8.0, включающая множество исправлений ошибок и обновлений компонентов. [17] Узлы Solr теперь могут прослушивать и обслуживать запросы HTTP / 2. Имейте в виду, что по умолчанию внутренние запросы также отправляются с использованием HTTP / 2. Кроме того, был добавлен вход в пользовательский интерфейс администратора с поддержкой BasicAuth и Kerberos. И теперь возможно построение математических выражений в Apache Zeppelin.

В ноябре 2020 года Bloomberg пожертвовал оператора Solr проекту Lucene / Solr. Оператор Solr помогает развертывать и запускать Solr в Kubernetes .

В феврале 2021 года Solr был создан как отдельный проект Apache (TLP), независимый от Lucene.

Операции [ править ]

Для поиска в документе Apache Solr последовательно выполняет следующие операции:

  1. Индексирование: прежде всего, он преобразует документы в машиночитаемый формат, который называется индексированием.
  2. Запросы: понимание условий запроса, заданного пользователем. Эти термины могут быть, например, изображениями или ключевыми словами.
  3. Сопоставление: Solr сопоставляет пользовательский запрос с документами, хранящимися в базе данных, чтобы найти соответствующий результат.
  4. Ранжирование результата: как только механизм выполняет поиск проиндексированных документов, он ранжирует результаты по их релевантности.

Сообщество [ править ]

В Solr есть как частные лица, так и компании, которые вносят новые функции и исправляют ошибки. [18] [19] [20] [21] [22]

Интеграция Solr [ править ]

Solr входит в состав встроенного поиска во многих приложениях, таких как системы управления контентом и системы управления корпоративным контентом . Все дистрибутивы Hadoop от Cloudera , [23], Hortonworks [24] и MapR включают Solr в качестве поисковой системы для своих продуктов, предназначенных для работы с большими данными . DataStax DSE интегрирует Solr в качестве поисковой системы с Cassandra . [25] Solr поддерживается в качестве конечной точки в различных средах обработки данных и средах интеграции Enterprise . [ необходима цитата ]

Solr предоставляет стандартные HTTP REST-подобные API с поддержкой как XML, так и JSON , и будет интегрироваться с любой системой или языком программирования, поддерживающими эти стандарты. Для простоты использования доступны также клиентские библиотеки для Java , C # , PHP , Python , Ruby и большинства других популярных языков программирования. [26]

См. Также [ править ]

  • Открытая семантическая структура
  • Ориентированная на поиск архитектура
  • Список информационно-поисковых библиотек

Ссылки [ править ]

  1. ^ "Новости" . Фонд Apache . Проверено 12 февраля 2021 года .
  2. ^ "Архивная копия" . Архивировано из оригинала на 2014-07-06 . Проверено 10 июля 2014 .CS1 maint: archived copy as title (link)
  3. ^ "Apache Solr -" . apache.org . Проверено 16 января 2017 года .
  4. ^ "[SOLR-1] Добавление кода CNET - ASF JIRA" . apache.org . Проверено 16 января 2017 года .
  5. ^ "PublicServers - Solr Wiki" . apache.org . Проверено 16 января 2017 года .
  6. ^ "Apache Solr -" . apache.org . Проверено 16 января 2017 года .
  7. ^ "Поддержка - Solr Wiki" . apache.org . Проверено 16 января 2017 года .
  8. ^ "Apache Solr -" . apache.org . Проверено 16 января 2017 года .
  9. ^ "[ГОЛОСОВАНИЕ] разработка merge lucene / solr (дубль 3) - Йоник Сили - org.apache.lucene.general - MarkMail" . markmail.org . Проверено 16 января 2017 года .
  10. ^ Solr3.1 - Solr Wiki . Wiki.apache.org (16 мая 2013 г.). Проверено 21 июля 2013.
  11. ^ Apache Lucene . Lucene.apache.org. Проверено 21 июля 2013.
  12. ^ "Apache Solr - Новости" . apache.org . Проверено 16 января 2017 года .
  13. ^ "[SOLR-6733] Проблема зонтика - Solr как отдельное приложение - ASF JIRA" . apache.org . Проверено 16 января 2017 года .
  14. ^ "Объявление о выпуске Solr 5.3" . lucene.apache.org . Проверено 24 сентября 2015 .
  15. ^ "Apache Solr - Новости" . apache.org . Проверено 16 января 2017 года .
  16. ^ "Apache Solr - Новости" .
  17. ^ «Примечания к выпуску Apache Solr 8.0» .
  18. ^ «Вопросы с наибольшим количеством голосов» . stackoverflow.com . Проверено 16 января 2017 года .
  19. ^ "Lucene / Solr Revolution 2016" . lucenerevolution.org . Проверено 16 января 2017 года .
  20. ^ "Встреча SFBay Apache Lucene / Solr" . meetup.com . Проверено 16 января 2017 года .
  21. ^ "Сообщество Oslo Solr" . meetup.com . Проверено 16 января 2017 года .
  22. ^ "LinkedIn Solr Group" . linkedin.com . Проверено 16 января 2017 года .
  23. ^ «Hadoop для всех: внутри поиска Cloudera - блог разработчиков Cloudera» . cloudera.com . 24 июня 2013 . Проверено 16 января 2017 года .
  24. ^ «Использование корпоративного поиска в Enterprise Hadoop - Hortonworks» . hortonworks.com . 2 апреля 2014 . Проверено 16 января 2017 года .
  25. ^ «DataStax Enterprise: Cassandra с деталями интеграции с Solr» . datastax.com . 12 апреля 2012 . Проверено 6 февраля +2017 .
  26. ^ "IntegratingSolr - Solr Wiki" . apache.org . Проверено 16 января 2017 года .

Библиография [ править ]

  • Грейнджер, Трей; Поттер, Тимоти (март 2014 г.). Solr в действии (1-е изд.). Публикации Мэннинга . п. 664. ISBN 9781617291029.
  • Смайли, Дэвид; Пью, Эрик; Париса, Кранти; Митчелл, Мэтт (февраль 2014 г.). Сервер поиска предприятия Apache Solr 4 (1-е изд.). Packt Publishing . п. 451. ISBN. 9781782161363.
  • Серафини, Альфредо (декабрь 2013 г.). Руководство для начинающих по Apache Solr (1-е изд.). Packt Publishing . п. 324. ISBN 9781782162520.
  • Рафалович, Александр (июнь 2013 г.). Instant Apache Solr для индексирования данных How-to (1-е изд.). Packt Publishing . п. 90. ISBN 9781782164845.
  • Куч, Рафал (январь 2013 г.). Поваренная книга Apache Solr 4 (1-е изд.). Packt Publishing . п. 328. ISBN 9781782161325.
  • Смайли, Дэвид; Пью, Эрик (20 ноября 2011 г.). Сервер поиска предприятия Apache Solr 3 (1-е изд.). Packt Publishing . п. 418. ISBN 1-84951-606-5.
  • Куч, Рафал (22 июля 2011 г.). Поваренная книга Apache Solr 3.1 (1-е изд.). Packt Publishing . п. 300. ISBN 1-84951-218-3.
  • Смайли, Дэвид; Пью, Эрик (19 августа 2009 г.). Solr 1.4 Enterprise Search Server (1-е изд.). Packt Publishing . п. 336. ISBN. 1-84719-588-1.

Внешние ссылки [ править ]

  • Официальный сайт
  • Роль Ansible для установки SolrCloud в среде Debian