Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

ISO 25964 - это международный стандарт для тезаурусов , опубликованный в двух следующих частях:

 ISO 25964  Информация и документация - Тезаурусы и взаимодействие с другими словарями  Часть 1: Тезаурусы для поиска информации [опубликовано в августе 2011 г.]  Часть 2: Взаимодействие с другими словарями [опубликовано в марте 2013 г.]

Он был выпущен ISO , Международной организацией по стандартизации, и его официальный веб-сайт [1] поддерживается ее секретариатом в NISO , Национальной организации информационных стандартов США. Каждую часть стандарта можно приобрести отдельно в ISO или в любой из ее национальных организаций-членов (таких как ANSI , BSI , AFNOR , DIN и т. Д.). Некоторые его части доступны бесплатно на официальном сайте.

История [ править ]

Первым международным стандартом для тезаурусов был ISO 2788 , Руководство по созданию и развитию одноязычных тезаурусов , первоначально опубликованный в 1974 году и обновленный в 1986 году. В 1985 году к нему присоединился дополнительный стандарт ISO 5964 , Руководящие принципы создания и развития многоязычных тезаурусов.. Со временем ISO 2788 и ISO 5964 были приняты в качестве национальных стандартов в нескольких странах, например, в Канаде, Франции и Великобритании. В Великобритании им дали псевдонимы BS 5723 и BS 6723 соответственно. И именно в Великобритании на рубеже веков началась работа по их пересмотру с учетом сетевых потребностей нового тысячелетия. В результате в 2005-2008 годах был опубликован Британский стандарт BS 8723, состоящий из 5 частей, а именно:

 BS 8723 Структурированные словари для поиска информации - Руководство.  Часть 1: Определения, символы и сокращения.  Часть 2: Тезаурусы.  Часть 3: Словари, отличные от тезаурусов.  Часть 4: Взаимодействие между словарями.  Часть 5: Обмен форматами и протоколами для обеспечения взаимодействия.

Еще до того, как была опубликована последняя часть BS 8723, началась работа по ее принятию и адаптации в качестве международного стандарта для замены ISO 2788 и ISO 5964. Проект возглавляла рабочая группа Подкомитета № 46 Технического комитета ISO 46 (Информация и документация). (Идентификация и описание), известные как «Структурированные словари ISO TC46 / SC9 / WG8».

ISO 2788 и ISO 5964 были отменены в 2011 году, когда они были заменены первой частью ISO 25964. Вторая часть ISO 25964 была выпущена в марте 2013 года, завершив проект.

Цели и сфера применения [ править ]

ISO 25964 предназначен для тезаурусов, предназначенных для поддержки поиска информации и, в частности, для руководства выбором терминов, используемых при индексировании, тегах и поисковых запросах.

Таким образом, основная цель кратко изложена во введении к стандарту как:

«Если и индексатор, и поисковик выберут один и тот же термин для одного и того же понятия, то будут извлечены соответствующие документы».

В то время как большинство приложений, предусмотренных для ISO 2788 и ISO 5964, были базами данных в одном домене, часто внутренними или для бумажных систем, ISO 25964 предоставляет дополнительные рекомендации для нового контекста сетевых приложений, включая семантическую паутину . Тезаурус - это один из нескольких типов контролируемой лексики, используемых в этом контексте.

ISO 25964 Часть 1 [ править ]

В тезаурусе, соответствующем стандарту ISO 25964-1 (известному как часть 1), перечислены все концепции, доступные для индексации в данном контексте, и каждому из них присвоен предпочтительный термин, а также любые применимые синонимы. Показаны связи между концепциями и терминами, что упрощает навигацию по полю при построении поискового запроса. К основным типам отношений можно отнести:

  • эквивалентность (между синонимами и почти синонимами, например, мотоциклы, мотоциклы и мотоциклы)
  • иерархический (между более широкими и более узкими понятиями, например, цветы и розы)
  • ассоциативный (между понятиями, которые тесно связаны каким-то неиерархическим образом, например, между болезнью и вирусом, вызывающим эту болезнь)

В многоязычных тезаурусах эквивалентность также применяется между соответствующими терминами на разных естественных языках. Наладить переписку не всегда легко, и стандарт содержит рекомендации по устранению часто возникающих трудностей.

ISO 25964-1 объясняет, как создать одно- или многоязычный тезаурус, как его отображать и как управлять его разработкой. Существует модель данных, которая используется для обработки данных тезауруса (особенно при обмене данными между системами), и схема XML для кодирования данных. И модель, и схема доступны круглосуточно и без выходных на официальном сайте NISO. Стандарт также устанавливает функции, на которые следует обратить внимание при выборе программного обеспечения для управления тезаурусом.

ISO 25964 Часть 2 [ править ]

ISO 25964-2 рассматривает проблемы использования одного тезауруса в сочетании с другим и / или с каким-либо другим типом управляемого словаря или системы организации знаний (KOS). Охватываемые типы включают схемы классификации , таксономии , схемы предметных заголовков , онтологии , авторитетные списки имен , терминологию и кольца синонимов.. В рамках одной организации обычно можно найти несколько различных таких KOS, используемых в таких контекстах, как система управления записями, каталог библиотеки, корпоративная интрасеть, исследовательская лаборатория и т. Д. Чтобы помочь пользователям справиться с задачей ведения единого поиска по всем Из доступных коллекций ISO 25964-2 предоставляет руководство по сопоставлению терминов и понятий одного тезауруса и других KOS. Если сопоставление не является разумным вариантом, стандарт рекомендует другие формы использования дополнительной лексики.

Точно так же в Интернете есть возможность производить одновременный поиск репозиториев и баз данных, проиндексированных разными KOS, в еще более широком масштабе. Взаимодействие между различными сетями, платформами, программными приложениями и языками (как естественными, так и искусственными) зависит от принятия множества протоколов и стандартов. ISO 25964-2 предназначен для решения проблемы взаимодействия между структурированными словарями, особенно когда задействован тезаурус.

Связанные стандарты [ править ]

С момента публикации части 1 стандарта ISO 25964 он был принят национальными органами по стандартизации в ряде стран. Например, Британский институт стандартов (BSI) в Великобритании принял его и обозначил как BS ISO 25964-1 без изменений. На момент написания аналогичное рассмотрение находится в стадии реализации для Части 2. Американский стандарт ANSI / NISO Z39.19 - Руководство по созданию , формату и управлению одноязычными контролируемыми словарями.частично охватывает те же вопросы, что и ISO 25964-1. Он имеет дело с одноязычными списками, кольцами синонимов и таксономиями, а также тезаурусами, но не предоставляет модель данных, не затрагивает многоязычные словари или другие аспекты взаимодействия, такие как сопоставление между KOS. Если эти два стандарта частично совпадают, они в целом совместимы друг с другом. NISO активно участвует в разработке обоих стандартов, участвуя в разработке ISO 25964, а также руководя его секретариатом. Рекомендация W3C SKOS ( Простая система организации знаний ) тесно связана с ISO 25964 в контексте семантической сети. SKOSприменяется ко всем видам «простых KOS», которые можно найти в Интернете, включая тезаурусы и другие. В то время как ISO 25964-1 рекомендует выбирать и согласовывать концепции, термины и взаимосвязи для создания хорошего тезауруса, SKOS рассматривает следующий шаг - перенос тезауруса в Интернет. И в то время как ISO 25964-2 рекомендует виды сопоставлений, которые могут быть установлены между одним KOS и другим, SKOS представляет способ выражения сопоставлений при публикации в Интернете.

См. Также [ править ]

  • SKOS
  • ISO 2788
  • ISO 5964
  • Тезаурус (информационный поиск)

Ссылки [ править ]

  1. ^ ISO 25964 - международный стандарт для тезаурусов и взаимодействия с другими словарями

Внешние ссылки [ править ]

  • ISO 25964-1
  • Глоссарий терминов тезауруса в Wayback Machine (архивировано 18 марта 2019 г.)
  • Обсуждение модели данных BS 8723
  • страница ISO TC46 / SC9 / WG8
  • XML-схема для обмена тезаурусами ISO 25964
  • онтология на основе ISO 25964, расширение SKOS и SKOS-XL