Простая система организации знаний ( SKOS ) - это рекомендация W3C, разработанная для представления тезаурусов , классификационных схем , таксономий , систем предметных заголовков или любого другого типа структурированного контролируемого словаря . SKOS является частью семейства стандартов семантической паутины, основанных на RDF и RDFS , и его основная цель - облегчить публикацию и использование таких словарей в качестве связанных данных .
Простая система организации знаний | |
Статус | Опубликовано ( рекомендация W3C ) |
---|---|
Год начался | 1997 |
Последняя версия | Core , Reference , RDF , Primer, август 2009 г., стр . 18 |
Организация | Консорциум World Wide Web (W3C) |
Комитет | Рабочая группа по развертыванию семантической сети |
Авторы | Алистер Майлз , Шон Беххофер |
Базовые стандарты | RDF |
Связанные стандарты | RDFa , OWL , ISO 25964 , Дублинское ядро |
Домен | Семантическая сеть |
Сокращение | SKOS |
Веб-сайт | WWW |
История
Проект DESIRE II (1997–2000)
Самым прямым предшественником SKOS была работа над RDF Thesaurus, проведенная во второй фазе проекта EU DESIRE [1] [ необходима цитата ] . В связи с необходимостью улучшения пользовательского интерфейса и удобства использования мультисервисного просмотра и поиска [2] был создан базовый словарь RDF для тезаурусов. Как отмечалось позже в рабочем плане SWAD-Europe, работа DESIRE была принята и доработана в проектах SOSIG и LIMBER. Версия реализации DESIRE / SOSIG была описана на семинаре W3C QL'98, что послужило стимулом для ранней работы над языками правил и запросов RDF: служба запросов и вывода для RDF. [3]
LIMBER (1999–2001)
SKOS основывается на результатах проекта Language-Independent Metadata Browsing of European Resources (LIMBER), финансируемого Европейским сообществом , и является частью программы технологий информационного общества . В проекте LIMBER CCLRC дополнительно разработал формат обмена тезаурусом RDF [4], который был продемонстрирован в Европейском языковом тезаурусе социальных наук (ELSST) в архиве данных Великобритании как многоязычная версия электронного тезауруса по гуманитарным и социальным наукам на английском языке (HASSET). который планировалось использовать Советом европейских архивов данных по социальным наукам CESSDA.
ЮЗАО-Европа (2002–2004 гг.)
SKOS как отдельная инициатива началась в проекте SWAD-Europe, объединив партнеров из DESIRE, SOSIG (ILRT) и LIMBER (CCLRC), которые работали с более ранними версиями схемы. Он был разработан в рабочем пакете «Тезаурус» в рамках проекта «Продвинутая разработка семантической паутины для Европы» (SWAD-Europe). [5] SWAD-Europe финансировался Европейским сообществом и являлся частью программы « Технологии информационного общества ». Проект был разработан для поддержки деятельности W3C по семантической паутине посредством исследований, демонстраций и информационно-пропагандистских мероприятий, проводимых пятью партнерами проекта, ERCIM , ILRT в Бристольском университете , HP Labs , CCLRC и Stilo. Первый выпуск SKOS Core и SKOS Mapping был опубликован в конце 2003 года вместе с другими результатами по RDF-кодированию многоязычных тезаурусов [6] и отображению тезаурусов. [7]
Семантическая сеть (2004–2005)
После закрытия SWAD-Europe усилия SKOS были поддержаны W3C Semantic Web Activity [8] в рамках Рабочей группы по передовому опыту и развертыванию. [9] В течение этого периода основное внимание уделялось как консолидации SKOS Core, так и разработке практических руководств по портированию и публикации тезаурусов для семантической сети.
Разработка в соответствии с рекомендациями W3C (2006–2009)
Основные опубликованные документы SKOS - Базовое руководство SKOS, [10] Спецификация базового словаря SKOS, [11] и Краткое руководство по публикации тезауруса в семантической сети [12] - были разработаны в процессе рабочего проекта W3C. Главными редакторами SKOS были Алистер Майлз, [13] первоначально Дэн Брикли и Шон Бечхофер.
Рабочая группа по развертыванию семантической сети [14], учрежденная на два года (май 2006 г. - апрель 2008 г.), включила в свой устав продвижение SKOS по треку рекомендаций W3C . Дорожная карта предусматривала SKOS как кандидат в рекомендацию к концу 2007 года и как предлагаемую рекомендацию в первом квартале 2008 года. Основные проблемы, которые необходимо было решить, заключались в определении его точной области использования и его совместимости с другими языками и стандартами RDF, используемыми в библиотеки (например, Dublin Core ). [15] [16]
Официальный выпуск (2009 г.)
18 августа 2009 г. W3C выпустил новый стандарт, который наводит мост между миром систем организации знаний, включая тезаурусы, классификации, предметные заголовки, таксономии и народные учения, и сообществом связанных данных , принося пользу обоим. Библиотеки, музеи, газеты, правительственные порталы, предприятия, приложения для социальных сетей и другие сообщества, которые управляют большими коллекциями книг, исторических артефактов, новостных отчетов, бизнес-глоссариев, записей в блогах и других элементов, теперь могут использовать SKOS [17] для использования мощность связанных данных.
Исторический взгляд на компоненты
SKOS изначально разрабатывался как модульное и расширяемое семейство языков, организованное как SKOS Core, SKOS Mapping, SKOS Extensions и Metamodel. Теперь вся спецификация завершена в пространстве имен http://www.w3.org/2004/02/skos/core# .
Обзор
Помимо самой ссылки, SKOS Primer (примечание рабочей группы W3C) резюмирует Простую систему организации знаний.
SKOS [18] определяет классы и свойства, достаточные для представления общих функций, обнаруженных в стандартном тезаурусе. Он основан на концептуально-ориентированном взгляде на словарь, где примитивные объекты - это не термины, а абстрактные понятия, представленные терминами. Каждая концепция SKOS определяется как ресурс RDF . К каждой концепции могут быть прикреплены свойства RDF, в том числе:
- один или несколько предпочтительных терминов индекса (не более одного на каждом естественном языке)
- альтернативные термины или синонимы
- определения и примечания с указанием их языка
Понятия могут быть организованы в иерархии с использованием более широких и более узких отношений или связаны неиерархическими (ассоциативными) отношениями. Концепции могут быть собраны в концептуальные схемы, чтобы обеспечить последовательные и структурированные наборы концепций, представляющие весь или часть контролируемого словаря.
Категории элементов
Основные категории элементов SKOS - это концепции, метки, обозначения, документация, семантические отношения, свойства сопоставления и коллекции. Связанные элементы перечислены в таблице ниже.
Концепции | Этикетки и обозначения | Документация | Семантические отношения | Сопоставление свойств | Коллекции |
---|---|---|---|---|---|
Концепция | prefLabel | Примечание | шире | BroadMatch | Коллекция |
КонцепцияСхема | altLabel | changeNote | уже | узкое соответствие | OrderCollection |
inScheme | hiddenLabel | определение | связанные с | relatedMatch | член |
hasTopConcept | обозначение | редакционная заметка | широкий | closeMatch | Список членов |
topConceptOf | пример | уже | точное совпадение | ||
историяПримечание | семантическое отношение | mappingRelation | |||
scopeNote |
Концепции
Словарь SKOS основан на концепциях. Концепции - это единицы мышления - идеи, значения или объекты и события (экземпляры или категории), которые лежат в основе многих систем организации знаний. Таким образом, концепции существуют в сознании как абстрактные сущности, которые не зависят от терминов, используемых для их обозначения. В SKOS a Concept
(на основе OWL Class
) используется для представления элементов в системе организации знаний (термины, идеи, значения и т. Д.) Или концептуальной или организационной структуры такой системы.
A ConceptScheme
аналогичен словарю, тезаурусу или другому способу организации понятий. SKOS не ограничивает концепцию внутри конкретной схемы и не предоставляет никакого способа объявить полную схему - нет способа сказать, что схема состоит только из определенных элементов. TopConcept - это (одно из) верхнее понятие (концепции) в иерархической схеме.
Этикетки и обозначения
Каждая SKOS label
представляет собой строку символов Unicode , необязательно с языковыми тегами, которые связаны с концепцией. Это prefLabel
предпочтительная строка, удобочитаемая человеком (максимум одна для каждого языкового тега), хотя altLabel
может использоваться для альтернативных строк и hiddenLabel
может использоваться для строк, которые полезны для связывания, но не предназначены для чтения людьми.
SKOS notation
похож на метку, но эта буквальная строка имеет тип данных, например integer, float или date; тип данных можно даже придумать (см. 6.5.1 Обозначения, типизированные литералы и типы данных в Справочнике по SKOS). Обозначение полезно для кодов классификации и других строк, не распознаваемых как слова.
Документация
Свойства Documentation или Note предоставляют основную информацию о концепциях SKOS. Все концепции считаются типом skos:note
; они просто предоставляют более конкретную информацию. Свойство definition
, например, должно содержать полное описание тематического ресурса. При желании в расширении SKOS можно определить более конкретные типы заметок. Запрос для skos:note ?
получит все примечания об , включая определения, примеры и объем, историю и изменения, а также редакционную документацию.
Любое из этих свойств документации SKOS может относиться к нескольким типам объектов: литералу (например, строке); узел ресурса, имеющий свои собственные свойства; или ссылка на другой документ, например, с использованием URI. Это позволяет документации иметь собственные метаданные , такие как создатель и дата создания.
Конкретное руководство по свойствам документации SKOS можно найти в Документальных заметках SKOS Primer.
Семантические отношения
Семантические отношения SKOS предназначены для предоставления способов объявления отношений между концепциями в рамках схемы концептов. Хотя нет никаких ограничений, исключающих их использование с двумя концепциями из отдельных схем, это не рекомендуется, поскольку, вероятно, будет преувеличено то, что можно знать об этих двух схемах, и, возможно, они будут связаны некорректно.
Свойство related
просто устанавливает связь между двумя концепциями; никаких отношений иерархии или общности не предполагается. Свойства broader
и narrower
используются для утверждения прямой иерархической связи между двумя концепциями. Значение может быть неожиданным; это отношение broader
означает, что A имеет более широкое понятие, называемое B - следовательно, B шире, чем A. Более узкий следует по той же схеме.
Хотя случайный читатель может ожидать, что более широкие и узкие будут транзитивными свойствами, SKOS не объявляет их как таковые. Скорее, свойства broaderTransitive
и narrowerTransitive
определяются как переходные суперсвойства более широкого и узкого. Эти суперсвойства (по соглашению) не используются в декларативных операторах SKOS. Вместо этого, когда в тройке используется более широкое или более узкое отношение, также сохраняется соответствующее транзитивное суперсвойство; и транзитивные отношения могут быть выведены (и запрошены) с использованием этих суперсвойств.
Картография
Свойства отображения SKOS предназначены для выражения соответствия (точного или нечеткого) концептов из одной схемы концептов с другой и по соглашению используются только для соединения концептов из разных схем. Понятия relatedMatch
, broadMatch
и narrowMatch
являются удобство, с тем же значением, что и семантические свойства related
, broader
и narrower
. (См. Предыдущий раздел относительно значений слова «широкий» и «узкий».)
Свойство relatedMatch
создает простую ассоциативную связь между двумя концепциями. Когда понятия настолько тесно связаны, что обычно могут использоваться взаимозаменяемо, exactMatch
это подходящее свойство ( exactMatch
отношения транзитивны, в отличие от любых других отношений Match). closeMatch
Свойство , которое указывает на то, что понятия лишь иногда могут быть использованы взаимозаменяемо, и поэтому она не является транзитивным свойством.
Концептуальные коллекции
Коллекции концептов ( Collection
, orderedCollection
) представляют собой orderedCollection
группы SKOS с пометками и / или упорядоченные ( ). Коллекции могут быть вложенными и иметь определенные URI или нет (это называется пустым узлом). Ни SKOS, Concept
ни a не ConceptScheme
могут быть Коллекцией, и наоборот; и семантические отношения SKOS могут использоваться только с концепцией (не коллекцией). Элементы в коллекции не могут быть связаны с другими концепциями SKOS через узел коллекции; индивидуальные отношения должны быть определены к каждому Концепту в Коллекции.
Сообщество и участие
Вся работа по разработке выполняется через список рассылки, который представляет собой полностью открытый и публично архивный [19] список рассылки, посвященный обсуждению вопросов, касающихся систем организации знаний, поиска информации и Семантической сети. Любой желающий может неформально участвовать в разработке SKOS, присоединившись к обсуждениям по адресу [email protected] - неформальное участие тепло приветствуется. Любой, кто работает в организации-члене W3C, может официально участвовать в процессе разработки, присоединившись к Рабочей группе по развертыванию семантической паутины - это дает людям право редактировать спецификации и голосовать за решения о публикации.
Приложения
- Некоторые важные словари были перенесены в формат SKOS и доступны в открытом доступе, включая EuroVoc , AGROVOC и GEMET . Предметные рубрики Библиотеки Конгресса (LCSH) также поддерживают формат SKOS. [20]
- SKOS использовался в качестве языка тезаурусов, используемых в Экологическом справочнике SWED [21], разработанном в рамках проекта SWAD-Europe.
- Способ преобразования тезауруса в SKOS [22] с примерами, включая тезаурус MeSH , был предложен Vrije Universiteit Amsterdam .
- Предметная классификация с использованием DITA и SKOS была разработана IBM . [23]
- SKOS используется для представления типов географических объектов в онтологии GeoNames .
Инструменты
- Unilexicon [24] - это веб-визуальный редактор и менеджер таксономии для создания контролируемых словарей с интеграцией тегов и JSON API. Его первичная визуализация использует гиперболическое дерево .
- ThesauRex - это веб-редактор SKOS с открытым исходным кодом. Он ограничен более широкими / более узкими отношениями между концепциями и предлагает взаимодействие на основе дерева, а также с тезаурусами и созданием новых тезаурусов с помощью перетаскивания и перетаскивания на основе основного тезауруса. [25]
- Intelligent Topic Manager (ITM) от Mondeca - это полнофункциональное SKOS-совместимое решение для управления таксономиями, тезаурусами и другими контролируемыми словарями.
- Opentheso - это веб-система управления тезаурусом с открытым исходным кодом, соответствующая стандартам ISO 25964: 2011 и ISO 25964-2: 2012 (Информация и документация. Тезаурусы и взаимодействие с другими словарями). Он предлагает экспорт и импорт SKOS и CSV, веб-службы REST и SOAP и управляет постоянными идентификаторами (ARK). Он был разработан Французским национальным центром научных исследований с 2007 года. В настоящее время он используется французской сетью археологических библиотек Frantiq и исследовательскими группами, а также Hospices Civils de Lyon в качестве инструмента для совместного управления тезаурусом. Его можно скачать на гитхабе. [26]
- OpenSKOS - это основанный на веб-сервисе подход к публикации, управлению и использованию словарных данных, которые могут быть сопоставлены с SKOS. Его исходный код доступен на GitHub. Он включает CRUD- операции, подобные RESTful, для концепций SKOS и веб-редактор для поиска и редактирования концепций. Он был разработан Picturae и профинансирован голландским фондом CATCHPlus.
- TemaTres Vocabulary Server [27] - это словарный веб-сервер с открытым исходным кодом для управления контролируемыми словарями, таксономиями, тезаурусами и другими формальными представлениями знаний. TemaTres обеспечивает полный экспорт словарей в ядро SKOS в дополнение к Zthes, TopicMaps, MADS, Dublin Core, VDEX, BS 8723, SiteMap, SQL и текст.
- ThManager [28] - это Java - приложение с открытым исходным кодом для создания и визуализации словарей SKOS.
- W3C предоставляет экспериментальную услугу онлайн-проверки. [29]
- Vocbench [30] - это веб-редактор RDF / OWL / SKOS / SKOS-XL с открытым исходным кодом, разработанный в сотрудничестве между Продовольственной и сельскохозяйственной организацией Объединенных Наций (ФАО), Римским университетом Тор Вергата и малазийской исследовательский центр MIMOS . Он поддерживает многоязычный сельскохозяйственный тезаурус ФАО AGROVOC , а также другие ресурсы ФАО и Европейского сообщества.
- Файлы SKOS также можно импортировать и редактировать в редакторах RDF-OWL, таких как Protégé , SKOS Shuttle и TopBraid Composer.
- Синонимы SKOS могут быть преобразованы из формата WordNet RDF с помощью таблицы стилей XSLT ; см. W3C RDF
- PoolParty [31] - это система управления тезаурусом коммерческого качества и редактор SKOS для семантической сети, включая функции анализа текста и возможности связанных данных .
- qSKOS [32] - это инструмент с открытым исходным кодом для выполнения оценки качества словарей SKOS путем проверки по каталогу проблем качества.
- SKOSEd [33] - это подключаемый модуль с открытым исходным кодом для редактора онтологий Protégé 4 [34] OWL, который поддерживает создание словарей SKOS. SKOSEd имеет сопутствующий SKOS API [35], написанный на Java, который можно использовать для создания приложений на основе SKOS.
- Model Futures SKOS Exporter [36] для Microsoft Excel позволяет разрабатывать простые словари в виде таблиц Excel с отступом и экспортировать как SKOS RDF. Бета-версия.
- Lexaurus [37] - это система управления корпоративным тезаурусом и многоформатный редактор. Его обширный API включает полное управление версиями. SKOS - один из многих поддерживаемых форматов.
- SKOS Shuttle [38] - это служба управления тезаурусом, которая позволяет пользователям импортировать, поддерживать, обрабатывать и синхронизировать тезаурусы в SKOS, используя также специальные расширения SKOS.
- TopBraid Enterprise Vocabulary Net (EVN) [39] и TopBraid Enterprise Data Governance (EDG) - это веб-решения, которые поддерживают разработку и управление взаимосвязанными контролируемыми словарями, такими как таксономии, тезаурусы, бизнес-глоссарии и онтологии. Поддерживаются SKOS и SKOS-XL.
- Thesaurus Master, предназначенный для создания, разработки и поддержки таксономий и тезаурусов, является частью линейки программного обеспечения для управления знаниями Data Harmony от Access Innovations. Он предлагает экспорт в соответствии с SKOS.
- Fluent Editor 2014 - редактор онтологий, который позволяет пользователям работать и редактировать непосредственно аннотации OWL и SKOS. Аннотации будут обрабатываться также для ссылочных онтологий, а также импортироваться / экспортироваться в OWL / RDF и могут обрабатываться на сервере.
- Smartlogic Semaphore Ontology Editor - редактор онтологий на основе SKOS и SKOS-XL, который позволяет создавать модели, основанные строго на стандартах SKOS.
Данные
Существуют общедоступные источники данных SKOS.
- SKOS Datasets wiki [40] W3C рекомендует использовать этот список общедоступных источников данных SKOS. Большинство данных, содержащихся в этой вики, можно использовать для коммерческих и исследовательских целей.
Отношения с другими стандартами
Метамодель
Метамодель SKOS в целом совместима с моделью данных ISO 25964-1 - Тезаурусы для поиска информации. Эту модель данных можно просмотреть и загрузить с веб-сайта ISO 25964 . [41]
Стандарты тезауруса
В разработке SKOS участвовали эксперты как из RDF, так и из библиотечного сообщества, и SKOS намеревается обеспечить легкую миграцию тезаурусов, определенных такими стандартами, как NISO Z39.19 - 2005 [42] или ISO 25964 . [41]
Другие стандарты семантической сети
SKOS призван предоставить способ сделать наследие концептуальных схем доступным для приложений семантической паутины, более простым, чем более сложный язык онтологий, OWL . OWL предназначен для выражения сложных концептуальных структур, которые можно использовать для создания обширных метаданных и поддержки инструментов вывода. Однако создание полезных веб-онтологий требует опыта, усилий и затрат. Во многих случаях этот тип усилий может быть излишним или не соответствовать требованиям, и SKOS может быть лучшим выбором. Расширяемость RDF делает возможным дальнейшее включение или расширение словарей SKOS в более сложные словари, включая онтологии OWL.
Смотрите также
- Глоссарий
- Представление знаний
- Реестр метаданных
Рекомендации
- ↑ Desire: развитие европейской службы информации по исследованиям и образованию , Desire Consortium, 7 августа 2000 г., архивировано с оригинала 25 июля 2011 г.
- ^ Желание: Результаты исследований: D3.1 , Консорциум Желаний, архивировано с оригинала 9 мая 2008 г.
- ^ «Служба запросов и вывода для RDF» . www.w3.org .
- ^ Миллер, Кен; Мэтьюз, Брайан (24 января 2006 г.). «Правильные связи: проект LIMBER» . Журнал цифровой информации . 1 (8).
- ^ "Продвинутая разработка семантической паутины для Европы (SWAD-Европа)" . www.w3.org .
- ^ «Результат 8.3 SWAD-Europe: RDF-кодирование многоязычных тезаурусов» . Архивировано из оригинала на 2006-06-16.
- ^ "SWAD-Europe Deliverable 8.4: Inter-Thesaurus Mapping" . Архивировано из оригинала на 2006-04-30.
- ^ "Домашняя страница активности семантической сети W3C" . www.w3.org .
- ^ «Целевая группа по переносу тезаурусов (PORT) / Рабочая группа по передовому опыту и развертыванию семантической паутины / деятельность W3C по семантической паутине» . www.w3.org .
- ^ SKOS Core Guide W3C Working Draft 2 ноября 2005 г.
- ^ SKOS Core Vocabulary Specification W3C Working Draft 2 ноября 2005 г.
- ^ Краткое руководство по публикации тезауруса в семантической паутине Рабочий проект W3C 17 мая 2005 г.
- ^ «Алистер Майлз» . purl.org .
- ^ «Рабочая группа W3C по развертыванию семантической сети» . www.w3.org .
- ^ SKOS: Требования к стандартизации . Доклад Алистера Майлза, представленный в октябре 2006 года на Международной конференции по Дублинскому ядру и приложениям метаданных.
- ^ Поиск и семантическая сеть, включая теорию поиска с использованием структурированных словарей . Диссертация Алистера Майлза по теории поиска с использованием структурированных словарей.
- ^ «Справочник по системе простой организации знаний SKOS» . www.w3.org .
- ^ «Справочник по системе простой организации знаний SKOS» . www.w3.org .
- Интернет-архив ^ [email protected] . Архивы рассылки, использованные для разработки SKOS.
- ^ «Об органах власти Библиотеки Конгресса США» . Архивировано из оригинала на 2010-01-03.
- ^ "Экологический каталог семантической паутины" . Архивировано из оригинала на 2006-08-30.
- ^ «Метод преобразования тезаурусов в SKOS» . thesauri.cs.vu.nl .
- ^ Тематическая классификация с использованием DITA и SKOS от IBM developerWorks.
- ^ Веб-редактор визуальной таксономии Unilexicon
- ^ «Электронный научный центр / ThesauRex» . GitHub . 22 марта 2020.
- ^ «Opentheso - Авторское право» .
- ^ TemaTres - это словарный веб-сервер с открытым исходным кодом для управления контролируемыми словарями, таксономиями и тезаурусами.
- ^ ThManager Инструмент с открытым исходным кодом для создания и визуализации словарей SKOS RDF.
- ^ «Услуги по валидации - Простая система организации знаний SKOS» . www.w3.org .
- ^ "VocBench: Совместная система управления тезаурусами SKOS-XL" . Vocbench.uniroma2.it .
- ^ PoolParty - это система управления тезаурусом и редактор SKOS для семантической сети.
- ^ qSKOS - это инструмент с открытым исходным кодом для оценки качества словарного запаса SKOS.
- ^ Плагин SKOSEd SKOS для Protege 4
- ^ Protégé 4 Protégé 4 OWL редактор
- ^ SKOS Java API Java API для SKOS
- ^ Модель Futures Excel SKOS Exporter
- ^ Lexaurus - это система управления корпоративным тезаурусом и многоформатный редактор.
- ^ Риччи, ООО «Семвеб», Фабио. «СКОС Шаттл» . skosshuttle.ch .
- ^ "TopBraid Enterprise Vocabulary Net - TopQuadrant, Inc" .
- ^ «SKOS / Datasets - стандарты семантической сети» . www.w3.org .
- ^ а б «ISO 25964 - международный стандарт для тезаурусов и взаимодействия с другими словарями - веб-сайт NISO» . www.niso.org .
- ^ Стандарты NISO Z39.19 - 2005: Руководство по созданию, формату и управлению одноязычными контролируемыми словарями
Внешние ссылки
- Справочник по системе простой организации знаний SKOS
- Домашняя страница W3C SKOS
- Учебник по системе простой организации знаний W3C
- Презентация SKOS на конференции XTech 2005
- W3C предлагает реализацию справочной системы SKOS (Простая система организации знаний); Букварь также опубликован
- Валидатор SKOS и конвертер Zthes