Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Простая система организации знаний ( SKOS ) - это рекомендация W3C, разработанная для представления тезаурусов , классификационных схем , таксономий , систем предметных заголовков или любого другого типа структурированного контролируемого словаря . SKOS является частью семейства стандартов семантической паутины, основанных на RDF и RDFS , и его основная цель - облегчить публикацию и использование таких словарей в качестве связанных данных .

История [ править ]

Проект DESIRE II (1997–2000) [ править ]

Самым прямым предшественником SKOS была работа по RDF Thesaurus, проведенная во второй фазе проекта EU DESIRE [1] [ необходима цитата ] . В связи с необходимостью улучшения пользовательского интерфейса и удобства использования мультисервисного просмотра и поиска [2] был создан базовый словарь RDF для тезаурусов. Как отмечалось позже в рабочем плане SWAD-Europe, работа DESIRE была принята и получила дальнейшее развитие в проектах SOSIG и LIMBER. Версия реализации DESIRE / SOSIG была описана на семинаре W3C QL'98, что послужило стимулом для ранней работы над языками правил и запросов RDF: служба запросов и вывода для RDF. [3]

LIMBER (1999–2001) [ править ]

SKOS основывается на результатах проекта Language-Independent Metadata Browsing of European Resources (LIMBER), финансируемого Европейским сообществом , и является частью программы технологий информационного общества . В проекте LIMBER CCLRC дополнительно разработал формат обмена тезаурусом RDF [4], который был продемонстрирован на Европейском языковом тезаурусе социальных наук (ELSST) в архиве данных Великобритании как многоязычная версия электронного тезауруса гуманитарных и социальных наук на английском языке (HASSET). который планировалось использовать Советом европейских архивов данных по социальным наукам CESSDA.

ЮЗАО-Европа (2002–2004 гг.) [ Править ]

SKOS как отдельная инициатива началась в проекте SWAD-Europe, объединив партнеров из DESIRE, SOSIG (ILRT) и LIMBER (CCLRC), которые работали с более ранними версиями схемы. Он был разработан в рабочем пакете «Тезаурус» в рамках проекта «Продвинутая разработка семантической сети для Европы» (SWAD-Europe). [5] SWAD-Europe финансировался Европейским сообществом и являлся частью программы « Технологии информационного общества ». Проект был разработан для поддержки деятельности W3C в семантической паутине посредством исследований, демонстраций и информационных мероприятий, проводимых пятью партнерами проекта, ERCIM , ILRT в Бристольском университете , HP Labs , CCLRC.и Стило. Первый выпуск SKOS Core и SKOS Mapping был опубликован в конце 2003 года вместе с другими результатами по RDF-кодированию многоязычных тезаурусов [6] и отображению тезаурусов. [7]

Семантическая сеть (2004–2005) [ править ]

После закрытия SWAD-Europe усилия SKOS были поддержаны W3C Semantic Web Activity [8] в рамках Рабочей группы по передовому опыту и развертыванию. [9] В этот период основное внимание уделялось как консолидации SKOS Core, так и разработке практических рекомендаций по портированию и публикации тезаурусов для семантической сети.

Разработка в соответствии с рекомендациями W3C (2006–2009) [ править ]

Основные опубликованные документы SKOS - Базовое руководство SKOS, [10] Спецификация базового словаря SKOS [11] и Краткое руководство по публикации тезауруса в семантической сети [12] - были разработаны в процессе рабочего проекта W3C. Главными редакторами SKOS были Алистер Майлз, [13] первоначально Дэн Брикли и Шон Бечхофер.

Рабочая группа по развертыванию семантической сети [14], учрежденная на два года (май 2006 г. - апрель 2008 г.), включила в свой устав продвижение SKOS по треку рекомендаций W3C . В дорожной карте SKOS прогнозировался как кандидат в рекомендацию к концу 2007 года и как предлагаемая рекомендация в первом квартале 2008 года. Основные проблемы, которые необходимо было решить, заключались в определении его точной области использования и его совместимости с другими языками и стандартами RDF, используемыми в библиотеки (например, Dublin Core ). [15] [16]

Официальный выпуск (2009 г.) [ править ]

18 августа 2009 г. W3C выпустил новый стандарт, который наводит мост между миром систем организации знаний, включая тезаурусы, классификации, предметные рубрики, таксономии и народные классификации, и сообществом связанных данных , принося пользу обоим. Библиотеки, музеи, газеты, правительственные порталы, предприятия, приложения для социальных сетей и другие сообщества, которые управляют большими коллекциями книг, исторических артефактов, новостных отчетов, бизнес-глоссариев, записей в блогах и других предметов, теперь могут использовать SKOS [17] для использования мощность связанных данных.

Исторический обзор компонентов [ править ]

SKOS изначально разрабатывался как модульное и расширяемое семейство языков, организованное как SKOS Core, SKOS Mapping и SKOS Extensions, а также метамодель. Теперь вся спецификация завершена в пространстве имен http://www.w3.org/2004/02/skos/core# .

Обзор [ править ]

Помимо самой ссылки, SKOS Primer (примечание рабочей группы W3C) резюмирует Простую систему организации знаний.

SKOS [18] определяет классы и свойства, достаточные для представления общих функций, обнаруженных в стандартном тезаурусе. Он основан на концептуально-ориентированном взгляде на словарь, где примитивные объекты - это не термины, а абстрактные понятия, представленные терминами. Каждая концепция SKOS определяется как ресурс RDF . К каждой концепции могут быть прикреплены свойства RDF, в том числе:

  • один или несколько предпочтительных терминов индекса (не более одного на каждом естественном языке)
  • альтернативные термины или синонимы
  • определения и примечания с указанием их языка

Понятия могут быть организованы в иерархии с использованием более широких и более узких отношений или связаны неиерархическими (ассоциативными) отношениями. Концепции могут быть собраны в концептуальные схемы, чтобы обеспечить последовательные и структурированные наборы концепций, представляющие весь или часть контролируемого словаря.

Категории элементов [ править ]

Основные категории элементов SKOS - это концепции, метки, обозначения, документация, семантические отношения, свойства сопоставления и коллекции. Соответствующие элементы перечислены в таблице ниже.

Концепции [ править ]

Словарь SKOS основан на концепциях. Концепции - это единицы мышления - идеи, значения или объекты и события (экземпляры или категории), которые лежат в основе многих систем организации знаний. Таким образом, концепции существуют в сознании как абстрактные сущности, которые не зависят от терминов, используемых для их обозначения. В SKOS a Concept(на основе OWL Class) используется для представления элементов в системе организации знаний (термины, идеи, значения и т. Д.) Или концептуальной или организационной структуры такой системы.

A ConceptSchemeаналогичен словарю, тезаурусу или другому способу организации понятий. SKOS не ограничивает концепцию внутри конкретной схемы и не предоставляет никакого способа объявить полную схему - невозможно сказать, что схема состоит только из определенных элементов. TopConcept - это (одно из) верхнее понятие (концепции) в иерархической схеме.

Ярлыки и примечания [ править ]

Каждая SKOS labelпредставляет собой строку символов Unicode , необязательно с языковыми тегами, которые связаны с концепцией. Это prefLabelпредпочтительная строка, удобочитаемая человеком (максимум одна для каждого языкового тега), хотя altLabelможет использоваться для альтернативных строк и hiddenLabelможет использоваться для строк, которые полезны для связывания, но не предназначены для чтения людьми.

SKOS notationпохож на метку, но эта буквальная строка имеет тип данных, например integer, float или date; тип данных можно даже придумать (см. 6.5.1 Обозначения, типизированные литералы и типы данных в Справочнике SKOS). Обозначение полезно для кодов классификации и других строк, не распознаваемых как слова.

Документация [ править ]

Свойства Documentation или Note предоставляют основную информацию о концепциях SKOS. Все концепции считаются типом skos:note; они просто предоставляют более конкретную информацию. Свойство definition, например, должно содержать полное описание тематического ресурса. При желании в расширении SKOS можно определить более конкретные типы заметок. Запрос для <A> skos:note ?получит все примечания об <A>, включая определения, примеры и объем, историю и изменения, а также редакционную документацию.

Любое из этих свойств документации SKOS может относиться к нескольким типам объектов: литералу (например, строке); узел ресурса, который имеет свои собственные свойства; или ссылка на другой документ, например, с использованием URI. Это позволяет документации иметь собственные метаданные , такие как дата создания и дата создания.

Конкретное руководство по свойствам документации SKOS можно найти в Документальных заметках SKOS Primer.

Семантические отношения [ править ]

Семантические отношения SKOS предназначены для предоставления способов объявления отношений между концепциями в рамках схемы концептов. Хотя нет никаких ограничений, исключающих их использование с двумя концепциями из отдельных схем, это не рекомендуется, поскольку, вероятно, будет преувеличено то, что можно знать об этих двух схемах, и, возможно, они будут связаны некорректно.

Свойство relatedпросто устанавливает связь между двумя концепциями; никаких отношений иерархии или общности не предполагается. Свойства broaderи narrowerиспользуются для утверждения прямой иерархической связи между двумя концепциями. Значение может быть неожиданным; это отношение <A> broader <B>означает, что A имеет более широкое понятие, называемое B - следовательно, B шире, чем A. Более узкий следует по той же схеме.

Хотя случайный читатель может ожидать, что более широкие и узкие будут транзитивными свойствами, SKOS не объявляет их как таковые. Скорее, свойства broaderTransitiveи narrowerTransitiveопределяются как переходные сверхсвойства более широкого и узкого. Эти суперсвойства (по соглашению) не используются в декларативных операторах SKOS. Вместо этого, когда в тройке используется более широкое или более узкое отношение, также сохраняется соответствующее транзитивное суперсвойство; и транзитивные отношения могут быть выведены (и запрошены) с использованием этих суперсвойств.

Отображение [ править ]

Свойства отображения SKOS предназначены для выражения соответствия (точного или нечеткого) концептов из одной схемы концептов с другой и по соглашению используются только для соединения концепций из разных схем. Понятия relatedMatch, broadMatchи narrowMatchявляются удобство, с тем же значением, что и семантические свойства related, broaderи narrower. (См. Предыдущий раздел относительно значений слова «широкий» и «узкий».)

Свойство relatedMatchсоздает простую ассоциативную связь между двумя понятиями. Когда понятия настолько тесно связаны, что обычно могут использоваться взаимозаменяемо, exactMatchэто подходящее свойство ( exactMatchотношения транзитивны, в отличие от любых других отношений Match). closeMatchСвойство , которое указывает на то, что понятия лишь иногда могут быть использованы взаимозаменяемо, и поэтому она не является транзитивным свойством.

Коллекции концептов [ править ]

Коллекции концептов ( Collection, orderedCollection) представляют собой помеченные и / или упорядоченные ( orderedCollection) группы концепций SKOS. Коллекции могут быть вложенными и могут иметь определенные URI или нет (это называется пустым узлом). Ни SKOS, Conceptни a не ConceptSchemeмогут быть Коллекцией, и наоборот; и семантические отношения SKOS могут использоваться только с концепцией (но не с коллекцией). Элементы коллекции не могут быть связаны с другими концепциями SKOS через узел коллекции; индивидуальные отношения должны быть определены к каждому Концепту в Коллекции.

Сообщество и участие [ править ]

Вся работа по разработке выполняется через список рассылки, который представляет собой полностью открытый и общедоступный [19] список рассылки, посвященный обсуждению вопросов, связанных с системами организации знаний, поиском информации и семантической сетью. Любой желающий может неформально участвовать в разработке SKOS, присоединившись к обсуждениям по адресу [email protected] - неформальное участие приветствуется. Любой, кто работает в организации-члене W3C, может официально участвовать в процессе разработки, присоединившись к Рабочей группе по развертыванию семантической паутины - это дает людям право редактировать спецификации и голосовать за решения о публикации.

Приложения [ править ]

  • Некоторые важные словари были перенесены в формат SKOS и доступны в открытом доступе, включая EuroVoc , AGROVOC и GEMET . Предметные рубрики Библиотеки Конгресса (LCSH) также поддерживают формат SKOS. [20]
  • SKOS использовался в качестве языка тезаурусов, используемых в Экологическом справочнике SWED [21], разработанном в рамках проекта SWAD-Europe.
  • Способ преобразования тезаурусов в SKOS [22] с примерами, включая тезаурус MeSH , был предложен Vrije Universiteit Amsterdam .
  • Предметная классификация с использованием DITA и SKOS была разработана IBM . [23]
  • SKOS используется для представления типов географических объектов в онтологии GeoNames .

Инструменты [ править ]

  • Unilexicon [24] - это веб-визуальный редактор и менеджер таксономии для создания контролируемых словарей с интеграцией тегов и JSON API. Его первичная визуализация использует гиперболическое дерево .
  • ThesauRex - это веб-редактор SKOS с открытым исходным кодом. Он ограничен более широкими / более узкими отношениями между концепциями и предлагает взаимодействие на основе дерева, а также с тезаурусами и созданием новых тезаурусов методом перетаскивания и опускания на основе основного тезауруса. [25]
  • Intelligent Topic Manager (ITM) Mondeca - это полнофункциональное SKOS-совместимое решение для управления таксономиями, тезаурусами и другими контролируемыми словарями.
  • Opentheso - это веб-система управления тезаурусом с открытым исходным кодом, соответствующая стандартам ISO 25964: 2011 и ISO 25964-2: 2012 (Информация и документация. Тезаурусы и взаимодействие с другими словарями). Он предлагает экспорт и импорт SKOS и CSV, веб-службы REST и SOAP и управляет постоянными идентификаторами (ARK). Он был разработан Французским национальным центром научных исследований с 2007 года. В настоящее время он используется французской сетью археологических библиотек Frantiq, исследовательскими группами и Hospices Civils de Lyon в качестве инструмента для совместного управления тезаурусом. Его можно скачать на github. [26]
  • OpenSKOS - это основанный на веб-сервисах подход к публикации, управлению и использованию словарных данных, которые могут быть сопоставлены с SKOS. Его исходный код доступен на GitHub. Он включает CRUD- операции, подобные RESTful, для концепций SKOS и веб-редактор для поиска и редактирования концепций. Он был разработан Picturae при финансовой поддержке голландского фонда CATCHPlus.
  • TemaTres Vocabulary Server [27] - это словарный веб-сервер с открытым исходным кодом для управления контролируемыми словарями, таксономиями, тезаурусами и другими формальными представлениями знаний. TemaTres обеспечивает полный экспорт словарей в ядро ​​SKOS в дополнение к Zthes, TopicMaps, MADS, Dublin Core, VDEX, BS 8723, SiteMap, SQL и текст.
  • ThManager [28] - это Java - приложение с открытым исходным кодом для создания и визуализации словарей SKOS.
  • W3C предоставляет экспериментальную услугу онлайн-проверки. [29]
  • Vocbench [30] - это веб-редактор RDF / OWL / SKOS / SKOS-XL с открытым исходным кодом, разработанный в сотрудничестве между Продовольственной и сельскохозяйственной организацией Объединенных Наций (ФАО), Римским университетом Тор Вергата и малазийской исследовательский центр MIMOS . Он поддерживает многоязычный сельскохозяйственный тезаурус ФАО AGROVOC , а также другие ресурсы ФАО и Европейского сообщества.
  • Файлы SKOS также можно импортировать и редактировать в редакторах RDF-OWL, таких как Protégé , SKOS Shuttle и TopBraid Composer.
  • Синонимы SKOS могут быть преобразованы из формата WordNet RDF с помощью таблицы стилей XSLT ; см. W3C RDF
  • PoolParty [31] - это система управления тезаурусом коммерческого качества и редактор SKOS для семантической сети, включая функции анализа текста и возможности связанных данных .
  • qSKOS [32] - это инструмент с открытым исходным кодом для выполнения оценки качества словарей SKOS путем проверки по каталогу проблем качества.
  • SKOSEd [33] - это подключаемый модуль с открытым исходным кодом для редактора онтологий Protégé 4 [34] OWL, который поддерживает создание словарей SKOS. SKOSEd имеет сопутствующий SKOS API [35], написанный на Java, который можно использовать для создания приложений на основе SKOS.
  • Model Futures SKOS Exporter [36] для Microsoft Excel позволяет разрабатывать простые словари в виде таблиц Excel с отступом и экспортировать как SKOS RDF. Бета-версия.
  • Lexaurus [37] - это система управления корпоративным тезаурусом и многоформатный редактор. Его обширный API включает полное управление версиями. SKOS - один из многих поддерживаемых форматов.
  • SKOS Shuttle [38] - это служба управления тезаурусом, которая позволяет пользователям импортировать, поддерживать, обрабатывать и синхронизировать тезаурусы в SKOS, используя также специальные расширения SKOS.
  • TopBraid Enterprise Vocabulary Net (EVN) [39] и TopBraid Enterprise Data Governance (EDG) - это веб-решения, которые поддерживают разработку и управление взаимосвязанными контролируемыми словарями, такими как таксономии, тезаурусы, бизнес-глоссарии и онтологии. Поддерживаются SKOS и SKOS-XL.
  • Thesaurus Master, предназначенный для создания, разработки и поддержки таксономий и тезаурусов, является частью линейки программного обеспечения для управления знаниями Data Harmony от Access Innovations. Он предлагает экспорт в соответствии с SKOS.
  • Fluent Editor 2014 - редактор онтологий, который позволяет пользователям работать и редактировать непосредственно аннотации OWL и SKOS. Аннотации будут обрабатываться также для ссылочных онтологий, а также импортироваться / экспортироваться в OWL / RDF и могут обрабатываться на сервере.
  • Smartlogic Semaphore Ontology Editor - редактор онтологий на основе SKOS и SKOS-XL, позволяющий создавать модели строго по стандартам SKOS.

Данные [ редактировать ]

Существуют общедоступные источники данных SKOS.

  • Вики по наборам данных SKOS [40] W3C рекомендует использовать этот список общедоступных источников данных SKOS. Большинство данных в этой вики можно использовать в коммерческих и исследовательских целях.

Отношения с другими стандартами [ править ]

Метамодель [ править ]

Метамодель SKOS в целом совместима с моделью данных ISO 25964-1 - Тезаурусы для поиска информации. Эту модель данных можно просмотреть и загрузить с веб-сайта ISO 25964 . [41]

Семантическая модель информационных элементов SKOS

Стандарты тезауруса [ править ]

В разработке SKOS участвовали эксперты как из RDF, так и из библиотечного сообщества, и SKOS намеревается обеспечить легкую миграцию тезаурусов, определенных такими стандартами, как NISO Z39.19 - 2005 [42] или ISO 25964 . [41]

Другие стандарты семантической сети [ править ]

SKOS призвана предоставить способ сделать наследие концептуальных схем доступным для приложений семантической паутины, более простым, чем более сложный язык онтологий, OWL . OWL предназначен для выражения сложных концептуальных структур, которые можно использовать для создания обширных метаданных и поддержки инструментов вывода. Однако создание полезных веб-онтологий требует опыта, усилий и затрат. Во многих случаях этот тип усилий может быть излишним или не соответствовать требованиям, и SKOS может быть лучшим выбором. Расширяемость RDF делает возможным дальнейшее включение или расширение словарей SKOS в более сложные словари, включая онтологии OWL.

См. Также [ править ]

  • Глоссарий
  • Представление знаний
  • Реестр метаданных

Ссылки [ править ]

  1. Desire: развитие европейской службы информации по исследованиям и образованию , Desire Consortium, 7 августа 2000 г., архивировано с оригинала 25 июля 2011 г.
  2. ^ Желание: Исследование Deliverables: D3.1 , Дезире консорциум, заархивированный с оригинала на 9 мая 2008
  3. ^ «Служба запросов и вывода для RDF» . www.w3.org .
  4. ^ Миллер, Кен; Мэтьюз, Брайан (24 января 2006 г.). «Правильные связи: проект LIMBER» . Журнал цифровой информации . 1 (8).
  5. ^ "Расширенное развитие семантической паутины для Европы (SWAD-Европа)" . www.w3.org .
  6. ^ "SWAD-Europe Deliverable 8.3: RDF-кодирование многоязычных тезаурусов" . Архивировано из оригинала на 2006-06-16.
  7. ^ «SWAD-Europe Deliverable 8.4: Inter-Thesaurus Mapping» . Архивировано из оригинала на 2006-04-30.
  8. ^ "W3C Semantic Web Activity Homepage" . www.w3.org .
  9. ^ «Целевая группа по переносу тезаурусов (PORT) / Рабочая группа по передовому опыту и развертыванию семантической сети / Деятельность W3C по семантической сети» . www.w3.org .
  10. ^ SKOS Core Guide W3C Рабочий проект 2 ноября 2005 г.
  11. ^ SKOS Core Vocabulary Specification W3C Working Draft 2 ноября 2005 г.
  12. Краткое руководство по публикации тезауруса в семантической сети. Рабочий проект W3C 17 мая 2005 г.
  13. ^ «Алистер Майлз» . purl.org .
  14. ^ "Рабочая группа W3C по развертыванию семантической сети" . www.w3.org .
  15. ^ SKOS: Требования к стандартизации . Документ Алистера Майлза, представленный в октябре 2006 года на Международной конференции по Дублинскому ядру и приложениям метаданных.
  16. ^ Поиск и семантическая сеть, включая теорию поиска с использованием структурированных словарей . Диссертация Алистера Майлза по теории поиска с использованием структурированных словарей.
  17. ^ "Справочник по простой системе организации знаний SKOS" . www.w3.org .
  18. ^ "Справочник по простой системе организации знаний SKOS" . www.w3.org .
  19. Интернет-архив ^ [email protected] . Архивы рассылки, используемые для разработки SKOS.
  20. ^ «О библиотеке Конгресса властей» . Архивировано из оригинала на 2010-01-03.
  21. ^ "Экологический каталог Семантической паутины" . Архивировано из оригинала на 2006-08-30.
  22. ^ «Метод преобразования тезаурусов в SKOS» . thesauri.cs.vu.nl .
  23. ^ Тематическая классификация с использованием DITA и SKOS от IBM developerWorks.
  24. ^ Веб-редактор визуальной таксономии Unilexicon
  25. ^ "eScienceCenter / ThesauRex" . GitHub . 22 марта 2020.
  26. ^ «Opentheso - Авторское право» .
  27. ^ TemaTres - это словарный веб-сервер с открытым исходным кодом для управления контролируемыми словарями, таксономиями и тезаурусами.
  28. ^ ThManager Инструмент с открытым исходным кодом для создания и визуализации словарей SKOS RDF.
  29. ^ "Службы валидации - Простая система организации знаний SKOS" . www.w3.org .
  30. ^ "VocBench: Совместная система управления для SKOS-XL Thesauri" . Vocbench.uniroma2.it .
  31. ^ PoolParty - это система управления тезаурусом и редактор SKOS для Semantic Web.
  32. ^ qSKOS - это инструмент с открытым исходным кодом для оценки качества словарного запаса SKOS.
  33. ^ Плагин SKOSEd SKOS для Protege 4
  34. ^ Protégé 4 Protégé 4 OWL редактор
  35. ^ SKOS Java API Java API для SKOS
  36. ^ Модель Futures Excel SKOS Exporter
  37. ^ Lexaurus - это система управления корпоративным тезаурусом и многоформатный редактор.
  38. ^ Риччи, Semweb LLC, Фабио. «СКОС Шаттл» . skosshuttle.ch .
  39. ^ "TopBraid Enterprise Vocabulary Net - TopQuadrant, Inc" .
  40. ^ «SKOS / Datasets - стандарты семантической сети» . www.w3.org .
  41. ^ a b «ISO 25964 - международный стандарт для тезаурусов и взаимодействия с другими словарями - веб-сайт NISO» . www.niso.org .
  42. ^ Стандарты NISO Z39.19 - 2005: Руководство по созданию, формату и управлению одноязычными контролируемыми словарями

Внешние ссылки [ править ]

  • Справочник по системе простой организации знаний SKOS
  • Домашняя страница W3C SKOS
  • Учебник по системе простой организации знаний W3C
  • Презентация SKOS на конференции XTech 2005
  • W3C приглашает к внедрению SKOS (Простая система организации знаний) Справочник; Букварь также опубликован
  • SKOS Validator и Zthes Converter