Разработчики) | Фонд программного обеспечения Apache |
---|---|
Стабильный выпуск | 8.8.1 / 22 февраля 2021 г . [1] |
Репозиторий | Репозиторий Solr |
Написано в | Ява |
Операционная система | Кроссплатформенность |
Тип | API поиска и индексации |
Лицензия | Лицензия Apache 2.0 |
Веб-сайт | lucene |
Solr (произносится как «солнечный») - это платформа корпоративного поиска с открытым исходным кодом, написанная на Java . Его основные функции включают полнотекстовый поиск , выделение совпадений , фасетный поиск , индексацию в реальном времени, динамическую кластеризацию, интеграцию с базами данных, функции NoSQL [2] и обработку документов (например, Word, PDF). Обеспечивая распределенный поиск и репликацию индексов, Solr разработан с учетом масштабируемости и отказоустойчивости . [3] Solr широко используется для корпоративного поиска и аналитики, имеет активное сообщество разработчиков и регулярные выпуски.
Solr работает как автономный сервер полнотекстового поиска. Он использует поисковую библиотеку Lucene Java в своей основе для полнотекстового индексирования и поиска и имеет REST- подобные API HTTP / XML и JSON, которые позволяют использовать его с большинством популярных языков программирования. Внешняя конфигурация Solr позволяет адаптировать его ко многим типам приложений без программирования на Java, и он имеет архитектуру плагинов для поддержки более продвинутой настройки.
Apache Solr разрабатывается совместно с проектом Apache Solr в Apache Software Foundation .
История [ править ]
В 2004 году Йоник Сили (Yonik Seeley) из CNET Networks создал Solr в качестве внутреннего проекта для добавления возможностей поиска на веб-сайт компании.
В январе 2006 года CNET Networks решила открыто опубликовать исходный код, пожертвовав его Apache Software Foundation . [4] Как и любой новый проект Apache, он вступил в инкубационный период, который помог решить организационные, юридические и финансовые вопросы.
В январе 2007 года Solr перешел из инкубационного статуса в автономный проект верхнего уровня (TLP) и неуклонно рос за счет накопленных функций, тем самым привлекая пользователей, участников и коммиттеров. Хотя он был довольно новым в качестве общедоступного проекта, он поддерживал несколько веб-сайтов с высокой посещаемостью. [5]
В сентябре 2008 года был выпущен Solr 1.3, включающий, среди прочего, возможности распределенного поиска и улучшения производительности. [6]
В январе 2009 года Йоник Сили вместе с Грантом Ингерсоллом и Эриком Хэтчером присоединился к Lucidworks (ранее Lucid Imagination), первой компании, предоставляющей коммерческую поддержку и обучение технологиям поиска Apache Solr. [ необходима цитата ] С тех пор предложения поддержки вокруг Solr были в изобилии. [7]
В ноябре 2009 года был выпущен Solr 1.4. В этой версии были внесены улучшения в индексирование, поиск и фасетирование, а также множество других улучшений, таких как расширенная обработка документов ( PDF , Word , HTML ), кластеризация результатов поиска на основе Carrot2, а также улучшенная интеграция с базой данных. В выпуске также есть множество дополнительных плагинов. [8]
В марте 2010 года проекты Lucene и Solr объединились. [9] Раздельная загрузка продолжалась, но теперь продукты разрабатывались совместно одним набором коммиттеров.
В 2011 году схема номеров версий Solr была изменена, чтобы соответствовать Lucene. После Solr 1.4 следующий выпуск Solr был помечен как 3.1, чтобы сохранить Solr и Lucene с одним и тем же номером версии. [10]
В октябре 2012 года была выпущена версия 4.0 Solr, включая новую функцию SolrCloud. [11] В 2013 и 2014 годах было выпущено несколько выпусков Solr в линейке 4.x, постоянно расширяющих набор функций и повышающих надежность.
В феврале 2015 года был выпущен Solr 5.0 [12], первый выпуск, в котором Solr упакован как отдельное приложение [13], что прекратило официальную поддержку развертывания Solr для ведения войны . Solr 5.3 имел встроенную подключаемую среду аутентификации и авторизации. [14]
В апреле 2016 года был выпущен Solr 6.0. [15] Добавлена поддержка выполнения параллельных SQL-запросов в коллекциях SolrCloud. Включает поддержку StreamExpression и новый драйвер JDBC для интерфейса SQL.
В сентябре 2017 года был выпущен Solr 7.0. [16] В этом выпуске, помимо прочего, добавлена поддержка нескольких типов реплик, автоматическое масштабирование и математический механизм.
В марте 2019 года была выпущена Solr 8.0, включающая множество исправлений ошибок и обновлений компонентов. [17] Узлы Solr теперь могут прослушивать и обслуживать запросы HTTP / 2. Имейте в виду, что по умолчанию внутренние запросы также отправляются с использованием HTTP / 2. Кроме того, был добавлен вход в пользовательский интерфейс администратора с поддержкой BasicAuth и Kerberos. И теперь возможно построение математических выражений в Apache Zeppelin.
В ноябре 2020 года Bloomberg пожертвовал оператора Solr проекту Lucene / Solr. Оператор Solr помогает развертывать и запускать Solr в Kubernetes .
В феврале 2021 года Solr был создан как отдельный проект Apache (TLP), независимый от Lucene.
Операции [ править ]
Для поиска в документе Apache Solr последовательно выполняет следующие операции:
- Индексирование: прежде всего, он преобразует документы в машиночитаемый формат, который называется индексированием.
- Запросы: понимание условий запроса, заданного пользователем. Эти термины могут быть, например, изображениями или ключевыми словами.
- Сопоставление: Solr сопоставляет пользовательский запрос с документами, хранящимися в базе данных, чтобы найти соответствующий результат.
- Ранжирование результата: как только механизм выполняет поиск проиндексированных документов, он ранжирует результаты по их релевантности.
Сообщество [ править ]
В Solr есть как частные лица, так и компании, которые вносят новые функции и исправляют ошибки. [18] [19] [20] [21] [22]
Интеграция Solr [ править ]
Solr входит в состав встроенного поиска во многих приложениях, таких как системы управления контентом и системы управления корпоративным контентом . Все дистрибутивы Hadoop от Cloudera , [23], Hortonworks [24] и MapR включают Solr в качестве поисковой системы для своих продуктов, предназначенных для работы с большими данными . DataStax DSE интегрирует Solr в качестве поисковой системы с Cassandra . [25] Solr поддерживается в качестве конечной точки в различных средах обработки данных и средах интеграции Enterprise . [ необходима цитата ]
Solr предоставляет стандартные HTTP REST-подобные API с поддержкой как XML, так и JSON , и будет интегрироваться с любой системой или языком программирования, поддерживающими эти стандарты. Для простоты использования доступны также клиентские библиотеки для Java , C # , PHP , Python , Ruby и большинства других популярных языков программирования. [26]
См. Также [ править ]
- Открытая семантическая структура
- Ориентированная на поиск архитектура
- Список информационно-поисковых библиотек
Ссылки [ править ]
- ^ "Новости" . Фонд Apache . Проверено 12 февраля 2021 года .
- ^ "Архивная копия" . Архивировано из оригинала на 2014-07-06 . Проверено 10 июля 2014 .CS1 maint: archived copy as title (link)
- ^ "Apache Solr -" . apache.org . Проверено 16 января 2017 года .
- ^ "[SOLR-1] Добавление кода CNET - ASF JIRA" . apache.org . Проверено 16 января 2017 года .
- ^ "PublicServers - Solr Wiki" . apache.org . Проверено 16 января 2017 года .
- ^ "Apache Solr -" . apache.org . Проверено 16 января 2017 года .
- ^ "Поддержка - Solr Wiki" . apache.org . Проверено 16 января 2017 года .
- ^ "Apache Solr -" . apache.org . Проверено 16 января 2017 года .
- ^ "[ГОЛОСОВАНИЕ] разработка merge lucene / solr (дубль 3) - Йоник Сили - org.apache.lucene.general - MarkMail" . markmail.org . Проверено 16 января 2017 года .
- ^ Solr3.1 - Solr Wiki . Wiki.apache.org (16 мая 2013 г.). Проверено 21 июля 2013.
- ^ Apache Lucene . Lucene.apache.org. Проверено 21 июля 2013.
- ^ "Apache Solr - Новости" . apache.org . Проверено 16 января 2017 года .
- ^ "[SOLR-6733] Проблема зонтика - Solr как отдельное приложение - ASF JIRA" . apache.org . Проверено 16 января 2017 года .
- ^ "Объявление о выпуске Solr 5.3" . lucene.apache.org . Проверено 24 сентября 2015 .
- ^ "Apache Solr - Новости" . apache.org . Проверено 16 января 2017 года .
- ^ "Apache Solr - Новости" .
- ^ «Примечания к выпуску Apache Solr 8.0» .
- ^ «Вопросы с наибольшим количеством голосов» . stackoverflow.com . Проверено 16 января 2017 года .
- ^ "Lucene / Solr Revolution 2016" . lucenerevolution.org . Проверено 16 января 2017 года .
- ^ "Встреча SFBay Apache Lucene / Solr" . meetup.com . Проверено 16 января 2017 года .
- ^ "Сообщество Oslo Solr" . meetup.com . Проверено 16 января 2017 года .
- ^ "LinkedIn Solr Group" . linkedin.com . Проверено 16 января 2017 года .
- ^ «Hadoop для всех: внутри поиска Cloudera - блог разработчиков Cloudera» . cloudera.com . 24 июня 2013 . Проверено 16 января 2017 года .
- ^ «Использование корпоративного поиска в Enterprise Hadoop - Hortonworks» . hortonworks.com . 2 апреля 2014 . Проверено 16 января 2017 года .
- ^ «DataStax Enterprise: Cassandra с деталями интеграции с Solr» . datastax.com . 12 апреля 2012 . Проверено 6 февраля +2017 .
- ^ "IntegratingSolr - Solr Wiki" . apache.org . Проверено 16 января 2017 года .
Библиография [ править ]
- Грейнджер, Трей; Поттер, Тимоти (март 2014 г.). Solr в действии (1-е изд.). Публикации Мэннинга . п. 664. ISBN 9781617291029.
- Смайли, Дэвид; Пью, Эрик; Париса, Кранти; Митчелл, Мэтт (февраль 2014 г.). Сервер поиска предприятия Apache Solr 4 (1-е изд.). Packt Publishing . п. 451. ISBN. 9781782161363.
- Серафини, Альфредо (декабрь 2013 г.). Руководство для начинающих по Apache Solr (1-е изд.). Packt Publishing . п. 324. ISBN 9781782162520.
- Рафалович, Александр (июнь 2013 г.). Instant Apache Solr для индексирования данных How-to (1-е изд.). Packt Publishing . п. 90. ISBN 9781782164845.
- Куч, Рафал (январь 2013 г.). Поваренная книга Apache Solr 4 (1-е изд.). Packt Publishing . п. 328. ISBN 9781782161325.
- Смайли, Дэвид; Пью, Эрик (20 ноября 2011 г.). Сервер поиска предприятия Apache Solr 3 (1-е изд.). Packt Publishing . п. 418. ISBN 1-84951-606-5.
- Куч, Рафал (22 июля 2011 г.). Поваренная книга Apache Solr 3.1 (1-е изд.). Packt Publishing . п. 300. ISBN 1-84951-218-3.
- Смайли, Дэвид; Пью, Эрик (19 августа 2009 г.). Solr 1.4 Enterprise Search Server (1-е изд.). Packt Publishing . п. 336. ISBN. 1-84719-588-1.
Внешние ссылки [ править ]
- Официальный сайт
- Роль Ansible для установки SolrCloud в среде Debian