Термин индекса


В информационном поиске индексный термин ( также известный как тематический термин , предметный заголовок , дескриптор или ключевое слово ) — это термин, который отражает суть темы документа. Термины указателя составляют контролируемый словарь для использования в библиографических записях . Они являются неотъемлемой частью библиографического контроля , который является функцией, с помощью которой библиотеки собирают, систематизируют и распространяют документы. Они используются в качестве ключевых слов для поиска документов в информационной системе, например, каталоге или поисковой системе . Популярной формой ключевых слов в Интернете являются теги ., которые видны непосредственно и могут быть назначены неспециалистами. Термины индекса могут состоять из слова, фразы или буквенно-цифрового термина. Они создаются путем анализа документа либо вручную с предметным индексированием , либо автоматически с автоматическим индексированием или более сложными методами извлечения ключевых слов. Термины указателя могут быть либо взяты из контролируемого словаря, либо могут быть назначены свободно.

Ключевые слова хранятся в поисковом индексе . Общие слова, такие как артикли (a, an, the) и союзы (and, or, but) не рассматриваются как ключевые слова, поскольку это неэффективно. Почти на каждом англоязычном сайте в Интернете есть артикль « the », так что искать его нет смысла. Google , самая популярная поисковая система, удалила стоп-слова , такие как «the» и «a», из своих индексов на несколько лет, но затем повторно ввела их, снова сделав возможными определенные типы точного поиска.

Термин «дескриптор» был введен Кэлвином Мурсом в 1948 году. Он, в частности, используется в отношении предпочтительного термина из тезауруса .

Язык Simple Knowledge Organization System (SKOS) предоставляет способ выражения индексных терминов с помощью Resource Description Framework для использования в контексте Semantic Web . [1]

Большинство систем веб-поиска предназначены для поиска слов в любом месте документа — в заголовке, теле и т. д. В этом случае ключевым словом может быть любой термин, существующий в документе. Однако приоритет отдается словам, встречающимся в заголовке, многократно повторяющимся словам и словам, явно назначенным в качестве ключевых слов в кодировке. [2] Термины индекса могут быть дополнительно уточнены с помощью логических операторов.например, «И, ИЛИ, НЕ». «И» обычно не требуется, поскольку большинство поисковых систем делают вывод об этом. «ИЛИ» будет искать результаты с одним условием поиска, другим или обоими. «НЕ» удаляет слово или фразу из поиска, избавляясь от всех результатов, которые их содержат. Несколько слов можно также заключить в кавычки, чтобы превратить отдельные термины указателя в определенную фразу указателя . Все эти модификаторы и методы помогают уточнить условия поиска, чтобы повысить точность результатов поиска. [3]

Авторские ключевые слова являются неотъемлемой частью литературы. [1] Многие журналы и базы данных предоставляют доступ к индексным терминам, составленным авторами соответствующих статей. От того, насколько квалифицирован поставщик, зависит качество как терминов индекса, предоставленных индексатором, так и терминов индекса, предоставленных автором. Качество этих двух типов терминов индекса представляет исследовательский интерес, особенно в отношении поиска информации . Как правило, автору будет трудно предоставить термины индексации, которые характеризуют его или ее документ по сравнению с другими документами в базе данных.