Ключевое слово в контексте


Ключевое слово в контексте ( KWIC ) является наиболее распространенным форматом строк соответствия . Термин KWIC был впервые введен Гансом Петером Луном . [1] Система была основана на концепции, называемой ключевым словом в названиях , которая была впервые предложена для библиотек Манчестера в 1864 году Андреа Крестадоро . [2]

Индекс KWIC формируется путем сортировки и выравнивания слов в заголовке статьи, чтобы обеспечить возможность поиска каждого слова (кроме стоп-слов ) в заголовках в индексе в алфавитном порядке. [3] Это был полезный метод индексирования технических руководств до того, как компьютеризированный полнотекстовый поиск стал обычным явлением.

Например, поисковый запрос, включающий все слова в примерном определении («KWIC — это аббревиатура от Key Word In Context, наиболее распространенный формат строк согласования») и слоган Википедии на английском языке («бесплатная энциклопедия»), поиск на странице Википедии может дать индекс KWIC следующим образом. В индексе KWIC обычно используется широкий макет, позволяющий отображать максимум информации «в контексте» (не показано в следующем примере).

Индекс KWIC является частным случаем пермутируемого индекса . [4] Этот термин относится к тому факту, что он индексирует все циклические перестановки заголовков. Книги, состоящие из множества коротких разделов с собственными описательными заголовками, в первую очередь сборники справочных страниц , часто заканчивались переставленным индексным разделом, что позволяло читателю легко найти раздел по любому слову из его заголовка. Эта практика, также известная как «Ключевое слово вне контекста » ( KWOC ), больше не используется.

Примечание. Первая ссылка не показывает индекс KWIC, если вы не платите за просмотр статьи. Во второй ссылке даже не указана бумага.