Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Semantic Web является расширением World Wide Web по стандартам , установленным World Wide Web Consortium (W3C). [1] Цель семантической паутины - сделать данные Интернета машиночитаемыми.

Чтобы включить кодирование семантики с данными, используются такие технологии, как Resource Description Framework (RDF) [2] и Web Ontology Language (OWL) [3] . Эти технологии используются для формального представления метаданных . Например, онтология может описывать концепции, отношения между сущностями и категории вещей. Эта встроенная семантика предлагает значительные преимущества, такие как анализ данных и работа с разнородными источниками данных. [4]

Эти стандарты продвигают общие форматы данных и протоколы обмена в Интернете, в основном RDF. Согласно W3C, «Семантическая сеть Web обеспечивает общую структуру, которая позволяет совместно использовать и повторно использовать данные в рамках приложений, предприятий и сообществ». [5] Таким образом, семантическая сеть Web рассматривается как интегратор для различных приложений и систем контента и информации.

Этот термин был придуман Тимом Бернерсом-Ли для обозначения сети данных (или сети данных ) [6], которая может обрабатываться машинами [7], то есть такой, в которой большая часть значения является машиночитаемой . В то время как его критики ставят под сомнение его осуществимость, сторонники утверждают, что приложения в библиотеке и информатике, промышленности, биологии и исследованиях гуманитарных наук уже доказали обоснованность первоначальной концепции. [8]

Бернерс-Ли первоначально выразил свое видение Семантической паутины в 1999 году следующим образом:

У меня есть мечта о сети [в которой компьютеры] смогут анализировать все данные в сети - контент, ссылки и транзакции между людьми и компьютерами. «Семантическая сеть», которая делает это возможным, еще не появилась, но когда она появится, повседневные механизмы торговли, бюрократии и нашей повседневной жизни будут управляться машинами, разговаривающими с машинами. " Интеллектуальные агенты ", которых люди веками рекламировали, наконец, материализуются. [9]

В статье Бернерса-Ли, Хендлера и Лассилы в Scientific American 2001 г. описана ожидаемая эволюция существующей Сети в Семантическую сеть. [10] В 2006 году Бернерс-Ли и его коллеги заявили, что: «Эта простая идея… остается в значительной степени нереализованной». [11] В 2013 году более четырех миллионов веб-доменов (из примерно 250 миллионов) содержали разметку семантической сети. [12]

Пример [ править ]

В следующем примере текст «Пауль Шустер родился в Дрездене» на веб-сайте будет снабжен аннотацией, связывающей человека с местом его рождения. Следующий фрагмент HTML показывает, как описывается небольшой граф в RDFa -синтаксисе с использованием словаря schema.org и идентификатора Викиданных :

< div  vocab = "https://schema.org/"  typeof = "Person" >  < span  property = "name" > Пол Шустер </ span > родился в < span  property = "BirthPlace"  typeof = "Place"  href = "https://www.wikidata.org/entity/Q1731" >  < span  property = "name" > Дрезден </ span > . </ диапазон > </div >
График, полученный из примера RDFa

В примере определены следующие пять троек (показаны в синтаксисе Turtle ). Каждая тройка представляет одно ребро в результирующем графе: первый элемент тройки ( субъект ) - это имя узла, с которого начинается ребро, второй элемент ( предикат ) - тип ребра, а последний и третий элемент. ( объект ) либо имя узла, на котором заканчивается край, либо буквальное значение (например, текст, число и т. д.).

Результатом троек является график, показанный на данном рисунке .

График, полученный из примера RDFa, обогащенный дополнительными данными из Интернета

Одним из преимуществ использования универсальных идентификаторов ресурсов (URI) является то, что их можно разыменовать с помощью протокола HTTP . Согласно так называемым принципам связанных открытых данных , такой разыменованный URI должен привести к документу, который предлагает дополнительные данные о данном URI. В этом примере всех идентификаторы URI, как для ребер и узлы (например http://schema.org/Person, http://schema.org/birthPlace, http://www.wikidata.org/entity/Q1731) может быть разыменовываются и приведет к дальнейшим графам RDF, описывающий URI, например , что Дрезден это город в Германии, или что человек, в том смысле , этот URI может быть вымышленным.

На втором графике показан предыдущий пример, но теперь он дополнен несколькими тройками из документов, которые являются результатом разыменования https://schema.org/Person(зеленый край) и https://www.wikidata.org/entity/Q1731(синие края).

В дополнение к краям, явно указанным в задействованных документах, можно автоматически вывести края: тройной

из исходного фрагмента RDFa и тройной

из документа в https://schema.org/Person(зеленый край на рисунке) позволяют вывести следующую тройку с учетом семантики OWL (красная пунктирная линия на втором рисунке):

Фон [ править ]

Концепция семантической сетевой модели была сформирована в начале 1960-х такими исследователями, как когнитивист Аллан М. Коллинз , лингвист М. Росс Куиллиан и психолог Элизабет Ф. Лофтус как форма для представления семантически структурированного знания. При применении в контексте современного Интернета он расширяет сеть гиперссылок, удобочитаемых человеком веб-страниц, путем вставки машиночитаемых метаданных о страницах и о том, как они связаны друг с другом. Это позволяет автоматическим агентам получать более интеллектуальный доступ к Интернету и выполнять больше задач от имени пользователей. Термин «Semantic Web» был придуман Тим Бернерс-Ли , [7]изобретатель Всемирной паутины и директор Консорциума Всемирной паутины (« W3C »), который курирует разработку предлагаемых стандартов семантической паутины. Он определяет семантическую сеть как «сеть данных, которые могут прямо или косвенно обрабатываться машинами».

Многие из технологий, предложенных W3C, уже существовали до того, как были размещены под зонтиком W3C. Они используются в различных контекстах, особенно в тех, которые имеют дело с информацией, которая охватывает ограниченную и определенную область, и где совместное использование данных является общей необходимостью, например, в научных исследованиях или обмене данными между предприятиями. Кроме того, появились другие технологии с аналогичными целями, например микроформаты .

Ограничения HTML [ править ]

Многие файлы на обычном компьютере также можно условно разделить на удобочитаемые документы и машиночитаемые данные . Такие документы, как почтовые сообщения, отчеты и брошюры, читают люди. Данные, такие как календари, адресные книги, списки воспроизведения и электронные таблицы, представлены с помощью прикладной программы, которая позволяет их просматривать, искать и комбинировать.

В настоящее время Всемирная паутина основана в основном на документах, написанных на языке гипертекстовой разметки ( HTML ), соглашении о разметке, которое используется для кодирования основной части текста, перемежающейся с мультимедийными объектами, такими как изображения и интерактивные формы. Теги метаданных предоставляют метод, с помощью которого компьютеры могут классифицировать содержимое веб-страниц. В приведенных ниже примерах названиям полей «ключевые слова», «описание» и «автор» присвоены такие значения, как «вычисления», «дешевые виджеты для продажи» и «Джон Доу».

< meta  name = "keywords"  content = "вычисления, компьютерные исследования, компьютер"  /> < meta  name = "description"  content = "Недорогие виджеты для продажи"  /> < meta  name = "author"  content = "John Doe"  / >

Благодаря этой маркировке и категоризации метаданных другие компьютерные системы, которые хотят получить доступ к этим данным и поделиться ими, могут легко идентифицировать соответствующие значения.

С помощью HTML и инструмента для его визуализации (возможно, программного обеспечения веб-браузера , возможно, другого пользовательского агента ) можно создать и представить страницу со списком товаров для продажи. HTML-код этой страницы каталога может содержать простые утверждения на уровне документа, такие как «заголовок этого документа -« Супермаркет виджетов ».", но в самом HTML нет возможности однозначно утверждать, что, например, товар с номером X586172 является Acme Gizmo с розничной ценой 199 евро или что это потребительский продукт. Скорее, HTML может только сказать, что фрагмент текста «X586172» - это то, что следует расположить рядом с «Acme Gizmo» и «199 евро» и т. д. Невозможно сказать «это каталог» или даже установить, что «Acme Gizmo» - это своего рода название или что «199 евро» - это цена. Также невозможно выразить, что эти части информации связаны вместе при описании отдельного элемента, отличного от других элементов, которые, возможно, перечислены на странице.

Семантический HTML относится к традиционной HTML-практике разметки по замыслу, а не к непосредственному указанию деталей макета. Например, использование <em>обозначения «акцент», а не <i>, которое указывает курсив . Детали макета оставлены на усмотрение браузера в сочетании с каскадными таблицами стилей . Но эта практика не позволяет определить семантику таких объектов, как товары для продажи или цены.

Микроформаты расширяют синтаксис HTML для создания машиночитаемой семантической разметки об объектах, включая людей, организации, события и продукты. [13] Подобные инициативы включают RDFa, Microdata и Schema.org.

Решения семантической паутины [ править ]

Семантическая сеть развивает решение. Он включает публикацию на языках, специально разработанных для данных: платформа описания ресурсов (RDF), язык веб-онтологий (OWL) и расширяемый язык разметки ( XML ). HTML описывает документы и связи между ними. RDF, OWL и XML, напротив, могут описывать произвольные вещи, такие как люди, собрания или детали самолетов.

Эти технологии объединены для предоставления описаний, дополняющих или заменяющих содержимое веб-документов. Таким образом, контент может проявляться как описательные данные, хранящиеся в базах данных , доступных через Интернет [14], или как разметка в документах (в частности, в Extensible HTML ( XHTML ) с вкраплениями XML, или, что чаще, чисто в XML, с макетом или рендерингом). реплики хранятся отдельно). Машиночитаемые описания позволяют менеджерам контента добавлять смысл к контенту, т. Е. Описывать структуру наших знаний об этом контенте. Таким образом, машина может обрабатывать знания сама, а не текст, используя процессы, аналогичные человеческим дедуктивным рассуждениям и умозаключениям., тем самым получая более значимые результаты и помогая компьютерам выполнять автоматический сбор информации и исследования.

Пример тега, который будет использоваться на несемантической веб-странице:

<item> блог </item>

Кодирование аналогичной информации на семантической веб-странице может выглядеть так:

<item  rdf: about = "https://example.org/semantic-web/" > Семантическая сеть </item>

Тим Бернерс-Ли называет результате сеть связанных данных о Giant Global Graph , в отличие от HTML на основе World Wide Web . Бернерс-Ли утверждает, что если раньше было совместное использование документов, то будущее - это совместное использование данных . Его ответ на вопрос «как» дает три указания. Во-первых, URL-адрес должен указывать на данные. Во-вторых, любой, кто обращается к URL-адресу, должен получить данные обратно. В-третьих, отношения в данных должны указывать на дополнительные URL-адреса с данными.

Web 3.0 [ править ]

Тим Бернерс-Ли описал семантическую сеть как компонент Web 3.0 . [15]

Люди продолжают спрашивать, что такое Web 3.0. Я думаю, что, возможно, когда у вас есть наложение масштабируемой векторной графики - все рябит, складывается и выглядит туманным - в Web 2.0 и доступ к семантической сети, интегрированной в огромное пространство данных, вы получите доступ к невероятному ресурсу данных …

-  Тим Бернерс-Ли, 2006 г.

«Семантическая паутина» иногда используется как синоним «Веб 3.0» [16], хотя определение каждого термина различается. Web 3.0 начал возникать как движение от централизации таких сервисов, как поиск, социальные сети и чат-приложения, функционирование которых зависит от одной организации. [17]

Журналист Guardian Джон Харрис положительно оценилконцепцию Web 3.0 в начале 2019 года и, в частности, работу Бернерс-Ли над проектом Solid , основанным на хранилищах личных данных или «модулях», над которыми отдельные лица сохраняют контроль. [18] Бернерс-Ли основал стартап Inrupt, чтобы продвигать идею и привлекать разработчиков-добровольцев. [19] [20]

Проблемы [ править ]

Некоторые из проблем Семантической паутины включают обширность, расплывчатость, неопределенность, непоследовательность и обман. Автоматизированным системам рассуждений придется иметь дело со всеми этими проблемами, чтобы выполнить обещания Семантической паутины.

  • Обширность: Всемирная паутина содержит много миллиардов страниц. SNOMED CT медицинская терминология онтология одна содержит 370.000 имена классов, и существующая технология до сих пор не в состоянии устранить все семантически дублирующих терминов. Любая автоматизированная система рассуждений должна будет иметь дело с действительно огромными входными данными.
  • Расплывчатость: это неточные понятия, такие как «молодой» или «высокий». Это происходит из-за нечеткости пользовательских запросов, концепций, представленных поставщиками контента, сопоставления условий запроса с условиями поставщика и попытки комбинировать различные базы знаний с частично совпадающими, но слегка разными концепциями. Нечеткая логика - самый распространенный метод борьбы с неопределенностью.
  • Неопределенность: это точные концепции с неопределенными значениями. Например, у пациента может быть набор симптомов, соответствующих ряду различных диагнозов, каждый с разной вероятностью. Вероятностные методы рассуждения обычно используются для устранения неопределенности.
  • Несогласованность: это логические противоречия, которые неизбежно возникают при разработке больших онтологий и при объединении онтологий из разных источников. Дедуктивное рассуждение катастрофически терпит неудачу, когда сталкивается с непоследовательностью, потому что «все следует из противоречия» . Разрешаемое рассуждение и непоследовательное рассуждение - это два метода, которые можно использовать для устранения непоследовательности.
  • Обман: это когда производитель информации намеренно вводит в заблуждение потребителя информации. В настоящее время для устранения этой угрозы используются методы криптографии . Предоставляя средства для определения целостности информации, в том числе той, которая связана с идентификацией лица, которое произвело или опубликовало информацию, однако вопросы достоверности все еще необходимо решать в случаях потенциального обмана.

Этот список проблем является скорее иллюстративным, чем исчерпывающим, и он фокусируется на вызовах уровням «объединяющей логики» и «доказательства» Семантической паутины. Итоговый отчет Группы инкубаторов консорциума World Wide Web (W3C) по обоснованию неопределенности для World Wide Web (URW3-XG) объединяет эти проблемы под одним заголовком «неопределенность». [21] Многие из упомянутых здесь методов потребуют расширения языка веб-онтологий (OWL), например, для аннотирования условных вероятностей. Это область активных исследований. [22]

Стандарты [ править ]

Стандартизация семантической паутины в контексте Web 3.0 находится на попечении W3C. [23]

Компоненты [ править ]

Термин «семантическая сеть Web» часто используется более конкретно для обозначения форматов и технологий, которые его обеспечивают. [5] Сбор, структурирование и восстановление связанных данных обеспечивается технологиями, которые обеспечивают формальное описание концепций, терминов и отношений в рамках данной области знаний . Эти технологии определены как стандарты W3C и включают:

  • Структура описания ресурсов (RDF), общий метод описания информации
  • Схема RDF (RDFS)
  • Простая система организации знаний (SKOS)
  • SPARQL , язык запросов RDF
  • Notation3 (N3), разработанный с учетом удобочитаемости
  • N-Triples , формат для хранения и передачи данных
  • Черепаха (Terse RDF Triple Language)
  • Язык веб-онтологий (OWL), семейство языков представления знаний
  • Rule Interchange Format (RIF), структура диалектов языков веб-правил, поддерживающая обмен правилами в Интернете.
Semantic Web Stack

Semantic Web Stack иллюстрирует архитектуру Semantic Web. Функции и взаимосвязи компонентов можно резюмировать следующим образом: [24]

  • XML обеспечивает элементарный синтаксис для структуры содержимого в документах, но не связывает семантику со смыслом содержимого, содержащегося внутри. XML в настоящее время не является необходимым компонентом технологий семантической паутины в большинстве случаев, поскольку существуют альтернативные синтаксисы, такие как Turtle . Черепаха является стандартом де-факто, но не прошла формального процесса стандартизации.
  • Схема XML - это язык для предоставления и ограничения структуры и содержимого элементов, содержащихся в документах XML.
  • RDF - это простой язык для выражения моделей данных , которые относятся к объектам (« веб-ресурсам ») и их отношениям. Модель на основе RDF может быть представлена ​​в различных синтаксисах, например, RDF / XML, N3, Turtle и RDFa. RDF - это фундаментальный стандарт семантической сети. [25] [26]
  • Схема RDF расширяет RDF и представляет собой словарь для описания свойств и классов ресурсов на основе RDF с семантикой для обобщенных иерархий таких свойств и классов.
  • OWL добавляет дополнительный словарь для описания свойств и классов: среди прочего, отношения между классами (например, дизъюнктность), мощность (например, «ровно один»), равенство, более широкое типирование свойств, характеристики свойств (например, симметрия) и пронумерованные классы.
  • SPARQL - это протокол и язык запросов для источников данных семантической сети.
  • RIF - это формат обмена правилами W3C. Это язык XML для выражения веб-правил, которые могут выполнять компьютеры. RIF предоставляет несколько версий, называемых диалектами. Он включает в себя диалект базовой логики RIF (RIF-BLD) и диалект производственных правил RIF (RIF PRD).

Текущее состояние стандартизации [ править ]

Установленные стандарты:

  • RDF
  • RDFS
  • Формат обмена правил (RIF)
  • SPARQL
  • Юникод
  • Единый идентификатор ресурса
  • Язык веб-онтологий (OWL)
  • XML

Еще не полностью осознано:

  • Объединение слоев логики и проверки
  • Язык правил семантической сети (SWRL)

Приложения [ править ]

Цель состоит в том, чтобы повысить удобство использования и полезность Интернета и его взаимосвязанных ресурсов путем создания семантических веб-сервисов , таких как:

  • Серверы, предоставляющие доступ к существующим системам данных с использованием стандартов RDF и SPARQL. Многие конвертеры в RDF существуют из разных приложений. [27] Реляционные базы данных являются важным источником. Сервер семантической сети подключается к существующей системе, не влияя на ее работу.
  • Документы «размечены» семантической информацией ( расширение HTML- <meta> тегов, используемых на сегодняшних веб-страницах для предоставления информации для поисковых машин, использующих веб-сканеры ). Это может быть машинно-понятная информация о понятном человеку содержании документа (например, создатель, заголовок, описание и т. Д.), Или это могут быть чисто метаданные, представляющие набор фактов (например, ресурсы и услуги в другом месте на сайте. ). Обратите внимание, что все, что может быть идентифицировано с помощью универсального идентификатора ресурса(URI) можно описать, чтобы семантическая сеть могла рассуждать о животных, людях, местах, идеях и т. Д. Существует четыре формата семантических аннотаций, которые можно использовать в документах HTML; Микроформат, RDFa, Микроданные и JSON-LD . [28] Семантическая разметка часто создается автоматически, а не вручную.
  • Общие словари метаданных ( онтологии ) и сопоставления между словарями, которые позволяют создателям документов знать, как размечать свои документы, чтобы агенты могли использовать информацию в предоставленных метаданных (так что Автор в смысле «Автор страницы» победил » (не следует путать с Автором в смысле книги, которая является предметом рецензирования).
  • Автоматизированные агенты для выполнения задач для пользователей семантической сети с использованием этих данных.
  • Веб-службы (часто с собственными агентами) для предоставления информации специально для агентов, например, служба доверия, которую агент может запросить, имеет ли какой-либо интернет-магазин плохое обслуживание или рассылку спама .

Такие сервисы могут быть полезны для общедоступных поисковых систем или могут использоваться для управления знаниями внутри организации. Бизнес-приложения включают:

  • Содействие интеграции информации из смешанных источников
  • Устранение двусмысленности в корпоративной терминологии
  • Улучшение поиска информации, тем самым уменьшая информационную перегрузку и увеличивая детализацию и точность извлекаемых данных [29] [30] [31] [32]
  • Выявление релевантной информации относительно данного домена [33]
  • Поддержка принятия решений

В корпорации существует замкнутая группа пользователей, и руководство может обеспечивать соблюдение руководящих принципов компании, таких как принятие конкретных онтологий и использование семантической аннотации . По сравнению с общедоступной семантической сетью требования к масштабируемости меньше, и в целом можно больше доверять информации, циркулирующей внутри компании; конфиденциальность - меньшая проблема, если не считать обработки данных о клиентах.

Скептические реакции [ править ]

Практическая осуществимость [ править ]

Критики ставят под сомнение базовую осуществимость полного или даже частичного выполнения Семантической паутины, указывая как на трудности в ее настройке, так и на отсутствие универсальной полезности, которая препятствует вложению требуемых усилий. В статье 2003 года Маршалл и Шипман указывают на когнитивные накладные расходы, связанные с формализацией знаний по сравнению с созданием традиционного веб- гипертекста : [34]

Хотя изучение основ HTML относительно несложно, изучение языка или инструмента представления знаний требует, чтобы автор узнал о методах абстракции представления и их влиянии на рассуждения. Например, понимание отношения класс-экземпляр или отношения суперкласс-подкласс - это больше, чем понимание того, что одно понятие является «типом» другого понятия. […] Этим абстракциям преподают компьютерных ученых в целом и инженеров по знаниям в частности, но они не соответствуют аналогичному естественному языковому значению «типа» чего-либо. Эффективное использование такого формального представления требует, чтобы автор стал квалифицированным инженером по знаниям в дополнение к любым другим навыкам, необходимым в предметной области. […] Как только кто-то выучил формальный язык представления,по-прежнему часто требуется гораздо больше усилий для выражения идей в этом представлении, чем в менее формальном представлении […]. Действительно, это форма программирования, основанная на объявлении семантических данных и требующая понимания того, как алгоритмы рассуждений будут интерпретировать созданные структуры.

Согласно Маршаллу и Шипману, неявный и изменчивый характер многих знаний усугубляет проблему инженерии знаний и ограничивает применимость семантической паутины к конкретным доменам. Еще одна проблема, на которую они указывают, - это специфические для домена или организации способы выражения знаний, которые должны быть решены посредством согласия сообщества, а не только техническими средствами. [34] Оказывается, специализированные сообщества и организации для внутрикорпоративных проектов имеют тенденцию принимать технологии семантической паутины в большей степени, чем периферийные и менее специализированные сообщества. [35] Практические ограничения для принятия оказались менее сложными там, где область и сфера применения более ограничены, чем у широкой публики и всемирной паутины.[35]

Наконец, Маршалл и Шипман видят прагматические проблемы в идее интеллектуальных агентов (в стиле « Навигатор знаний» ), работающих в Семантической паутине, в значительной степени контролируемой вручную: [34]

В ситуациях, когда потребности пользователей известны, а распределенные информационные ресурсы хорошо описаны, этот подход может быть очень эффективным; в непредвиденных ситуациях, которые объединяют неожиданный массив информационных ресурсов, подход Google является более надежным. Более того, семантическая сеть Web полагается на более хрупкие цепочки вывода; недостающий элемент цепочки приводит к неспособности выполнить желаемое действие, в то время как человек может восполнить недостающие части в подходе, более похожем на Google. […] Компромисс между затратами и выгодой может работать в пользу специально созданных метаданных Семантической паутины, направленных на объединение разумных, хорошо структурированных информационных ресурсов, специфичных для предметной области; пристальное внимание к потребностям пользователей / клиентов будет способствовать успеху этих федераций.

Критика Кори Доктороу (« метакрап ») исходит с точки зрения человеческого поведения и личных предпочтений. Например, люди могут включать в веб-страницы ложные метаданные, пытаясь ввести в заблуждение механизмы семантической паутины, которые наивно предполагают достоверность метаданных. Этот феномен был хорошо известен благодаря метатегам, которые обманом заставляли алгоритм ранжирования Altavista повышать рейтинг определенных веб-страниц: механизм индексации Google специально ищет такие попытки манипуляции. Питер Гарденфорс и Тимо Хонкела отмечают, что технологии семантической паутины, основанные на логике, охватывают лишь часть значимых явлений, связанных с семантикой. [36] [37]

Цензура и конфиденциальность [ править ]

Энтузиазм по поводу семантической сети может быть смягчен опасениями по поводу цензуры и конфиденциальности . Например, теперь можно легко обойти методы анализа текста , используя другие слова, например, метафоры, или изображения вместо слов. Расширенная реализация семантической сети упростит для правительств контроль над просмотром и созданием онлайн-информации, поскольку эта информация будет намного проще для понимания автоматизированной машиной блокировки контента. Кроме того, также поднимался вопрос о том, что с использованием файлов FOAF и метаданных геолокации, было бы очень мало анонимности, связанной с авторством статей о таких вещах, как личный блог. Некоторые из этих проблем были рассмотрены в проекте «Policy Aware Web» [38], который является активной темой исследований и разработок.

Удвоение выходных форматов [ править ]

Еще одна критика семантической паутины заключается в том, что создание и публикация контента потребует гораздо больше времени, поскольку для одного фрагмента данных потребуется два формата: один для просмотра человеком, а другой - для машин. Однако многие разрабатываемые веб-приложения решают эту проблему, создавая машиночитаемый формат после публикации данных или запроса машины на получение таких данных. Разработка микроформатов была одной из реакций на такого рода критику. Еще один аргумент в защиту возможности семантической сети является вероятно падение цен задач человеческого интеллекта в цифровых рынков труда, таких как Amazon «s Mechanical Turk . [ необходима цитата ]

Такие спецификации, как eRDF и RDFa, позволяют встраивать произвольные данные RDF в HTML-страницы. Механизм GRDDL (Сбор описаний ресурсов из диалектов языка) позволяет автоматически интерпретировать существующий материал (включая микроформаты) как RDF, поэтому издателям нужно использовать только один формат, например HTML.

Исследовательская деятельность по корпоративным приложениям [ править ]

Первой исследовательской группой, явно фокусирующейся на корпоративной семантической сети, была группа ACACIA из INRIA-Sophia-Antipolis , основанная в 2002 году. Результаты их работы включают поисковую машину Corese [39] на основе RDF (S) и применение семантической сети технологии в области распределенного искусственного интеллекта для управления знаниями (например, онтологии и многоагентные системы для корпоративной семантической сети) [40] и электронного обучения . [41]

С 2008 года исследовательская группа корпоративной семантической паутины, расположенная в Свободном университете Берлина , специализируется на строительных блоках: корпоративном семантическом поиске, корпоративном семантическом сотрудничестве и разработке корпоративных онтологий. [42]

Инженерное исследование онтологий включает в себя вопрос о том, как привлечь пользователей, не являющихся экспертами, к созданию онтологий и семантически аннотированного контента [43], а также для извлечения явных знаний из взаимодействия пользователей внутри предприятий.

Будущее приложений [ править ]

Тим О'Рейли , придумавший термин Web 2.0, предложил долгосрочное видение семантической сети как сети данных, в которой сложные приложения манипулируют сетью данных. [44] Сеть данных превращает Всемирную паутину из распределенной файловой системы в распределенную систему баз данных. [45]

См. Также [ править ]

  • АГРИС
  • Управление бизнес-семантикой
  • Вычислительная семантика
  • Кале (продукт Reuters)
  • DBpedia
  • Модель сущность – атрибут – значение
  • Портал открытых данных ЕС
  • Гиперданные
  • Интернет вещей
  • Связанные данные
  • Список новых технологий
  • Nextbio
  • Выравнивание онтологий
  • Изучение онтологий
  • RDF и OWL
  • Семантические вычисления
  • Семантическая геопространственная сеть
  • Семантическая неоднородность
  • Семантическая интеграция
  • Семантическое соответствие
  • Semantic MediaWiki
  • Веб-семантический датчик
  • Семантическая социальная сеть
  • Семантическая технология
  • Семантическая сеть
  • Семантически связанные онлайн-сообщества
  • Смарт-М3
  • Социальная семантическая сеть
  • Веб-инженерия
  • Интернет-ресурс
  • Веб-наука

Ссылки [ править ]

  1. ^ «Временная шкала стандартов XML и семантической сети W3C» (PDF) . 2012-02-04.
  2. ^ «Консорциум World Wide Web (W3C),« Спецификация синтаксиса RDF / XML (пересмотренная) », 10 февраля 2004 г.») .
  3. ^ "Консорциум World Wide Web (W3C)," Обзор языка веб-онтологий OWL ", Рекомендация W3C, 10 февраля 2004 г." .
  4. Перейти ↑ Chung, Seung-Hwa (2018). «Подход MOUSE: отображение онтологий с использованием UML для системных инженеров» . Computer Reviews Journal : 8–29. ISSN 2581-6640 . 
  5. ^ a b «Деятельность W3C по семантической сети» . Консорциум World Wide Web (W3C). 7 ноября 2011 . Проверено 26 ноября 2011 года .
  6. ^ «Вопросы и ответы с Тимом Бернерс-Ли, специальный репортаж» . businessweek.com . Проверено 14 апреля 2018 года .
  7. ^ а б Бернерс-Ли, Тим; Джеймс Хендлер; Ора Лассила (17 мая 2001 г.). «Семантическая сеть» . Scientific American . Проверено 2 июля 2019 года .
  8. Ли Фейгенбаум (1 мая 2007 г.). «Семантическая сеть в действии» . Scientific American . Проверено 24 февраля 2010 года .
  9. ^ Бернерс-Ли, Тим ; Фишетти, Марк (1999). Плетение сети . HarperSanFrancisco . Глава 12 . ISBN 978-0-06-251587-2.
  10. Бернерс-Ли, Тим (17 мая 2001 г.). «Семантическая сеть» (PDF) . Scientific American . S2CID 32015696 . Проверено 13 марта 2008 года .  
  11. ^ Найджел Shadbolt; Венди Холл; Тим Бернерс-Ли (2006). «Возвращение к семантической паутине» (PDF) . Интеллектуальные системы IEEE . Проверено 13 апреля 2007 года .
  12. ^ Раманатан В. Гуха (2013). «Свет в конце туннеля» . Основной доклад Международной конференции по семантической паутине 2013 года . Проверено 8 марта 2015 года .
  13. ^ Allsopp, Джон (март 2007). Микроформаты: расширение возможностей вашей разметки для Web 2.0 . Друзья ЭД . п. 368 . ISBN 978-1-59059-814-6.
  14. ^ Артем Чеботко и Шийонг Лу, «Запросы к семантической паутине: эффективный подход с использованием реляционных баз данных», LAP Lambert Academic Publishing , ISBN 978-3-8383-0264-5 , 2009. 
  15. Шеннон, Виктория (23 мая 2006 г.). «Более революционная сеть» . Интернэшнл Геральд Трибюн . Проверено 26 июня 2006 года .
  16. ^ Шарма, Ахилеш. «Знакомство с концепцией Web 3.0» . Твик и трюк . Проверено 10 января 2017 года .
  17. Ходжсон, Мэтью (9 октября 2016 г.). «Децентрализованная сеть вернет власть людям в сети» . TechCrunch . AOL Inc . Проверено 1 декабря +2016 .
  18. Харрис, Джон (7 января 2019 г.). «Вместе мы можем помешать захвату данных большими технологиями: вот как» . Хранитель . Лондон, Соединенное Королевство. ISSN 0261-3077 . Проверено 7 января 2019 . 
  19. Брукер, Катрина (29 сентября 2018 г.). «Эксклюзив: Тим Бернерс-Ли рассказывает нам о своем радикальном новом плане перевернуть всемирную паутину» . Быстрая компания . США . Проверено 7 января 2019 .
  20. ^ "Главная | прервать" . Прервать . Проверено 7 января 2019 .
  21. ^ «Причина неопределенности для всемирной паутины» . W3.org . Проверено 20 декабря 2018 года .
  22. ^ Лукасевич, Томас; Умберто Страччиа (2008). «Управление неопределенностью и расплывчатостью в логике описания для семантической паутины» (PDF) . Веб-семантика: наука, услуги и агенты во всемирной паутине . 6 (4): 291–308. DOI : 10.1016 / j.websem.2008.04.001 .
  23. ^ «Стандарты семантической сети» . W3.org . Проверено 14 апреля 2018 года .
  24. ^ "Обзор языка веб-онтологий OWL" . Консорциум World Wide Web (W3C). 10 февраля 2004 . Проверено 26 ноября 2011 года .
  25. ^ «Структура описания ресурсов (RDF)» . Консорциум World Wide Web .
  26. ^ Аллеманг, декан; Хендлер, Джеймс; Гандон, Фабьен (3 августа 2020 г.). Семантическая сеть для рабочего онтолога: эффективное моделирование связанных данных, RDFS и OWL (Третье изд.). [Нью-Йорк, Нью-Йорк, США]: ACM Books; 3-е издание. ISBN 978-1450376143.
  27. ^ "ConverterToRdf - W3C Wiki" . W3.org . Проверено 20 декабря 2018 года .
  28. ^ Сикос, Лесли Ф. (2015). Освоение структурированных данных в семантической сети: от микроданных HTML5 до связанных открытых данных . Апресс. п. 23. ISBN 978-1-4842-1049-9.
  29. Омар Алонсо и Уго Сарагоса. 2008. Использование семантических аннотаций в поиске информации: ESAIR '08. SIGIR Forum 42, 1 (июнь 2008 г.), 55–58. DOI : 10,1145 / 1394251,1394262
  30. Яап Кампс, Юсси Карлгрен и Ральф Шенкель. 2011. Отчет о третьем семинаре по использованию семантических аннотаций в поиске информации (ESAIR). СИГИР Форум 45, 1 (май 2011 г.), 33–41. DOI : 10,1145 / 1988852,1988858
  31. Яап Кампс, Юсси Карлгрен , Питер Мика и Ванесса Мердок. 2012. Пятый семинар по использованию семантических аннотаций в поиске информации: ESAIR '12). В материалах 21-й международной конференции ACM по управлению информацией и знаниями (CIKM '12). ACM, Нью-Йорк, Нью-Йорк, США, 2772–2773. DOI : 10,1145 / 2396761,2398761
  32. Омар Алонсо, Яап Кампс и Юсси Карлгрен . 2015. Отчет о седьмом семинаре по использованию семантических аннотаций в поиске информации (ESAIR '14). SIGIR Forum 49, 1 (июнь 2015), 27–34. DOI : 10,1145 / 2795403,2795412
  33. ^ Kuriakose, Джон (сентябрь 2009). «Понимание и применение технологии семантической паутины» . Cutter IT Journal . CUTTER INFORMATION CORP. 22 (9): 10–18.
  34. ^ a b c Маршалл, Кэтрин С .; Шипман, Фрэнк М. (2003). Какая семантическая сеть? (PDF) . Proc. ACM Conf. по гипертексту и гипермедиа. С. 57–66.
  35. ^ а б Иван Герман (2007). Состояние семантической сети (PDF) . Семантические дни 2007 . Проверено 26 июля 2007 года .
  36. ^ Gärdenfors, Питер (2004). Как сделать семантическую сеть более семантической . Формальная онтология в информационных системах: материалы третьей международной конференции (FOIS-2004) . IOS Press. С. 17–34.
  37. ^ Хонкела, Тимо; Könönen, Ville; Линд-Кнуутила, Тийна; Пауккери, Мари-Санна (2008). «Моделирование процессов формирования концепций и коммуникации». Журнал экономической методологии . 15 (3): 245–259. DOI : 10.1080 / 13501780802321350 .
  38. ^ "Политический веб-проект" . Policyawareweb.org . Проверено 14 июня 2013 .
  39. ^ Корби, Оливье; Дьенг-Кунц, Роуз; Цукер, Кэтрин Фарон; Гандон, Фабьен (NaN). «Поиск в семантической сети: приблизительная обработка запросов на основе онтологий» . Интеллектуальные системы IEEE . 21 : 20–27. DOI : 10.1109 / MIS.2006.16 . S2CID 11488848 .  Проверить значения даты в: |date=( помощь )
  40. ^ Гандон, Фабьен (7 ноября 2002). «Распределенный искусственный интеллект и управление знаниями: онтологии и многоагентные системы для корпоративной семантической сети» . Университет Ниццы Софии Антиполис.
  41. ^ Буффа, Мишель; Деорс, Сильвен; Фарон-Цукер, Кэтрин; Сандер, Питер (2005). «На пути к корпоративному семантическому веб-подходу в разработке обучающих систем: обзор проекта пробных решений» (PDF) . Международный семинар по применению технологий семантической паутины для электронного обучения . Амстердам, Голландия. С. 73–76.
  42. ^ "Корпоративная семантическая сеть - Главная" . Corporate-semantic-web.de . Проверено 14 апреля 2018 года .
  43. ^ Hinze, Анника; Хиз, Ральф; Лучак-Рёш, Маркус; Пашке, Адриан (2012). «Семантическое обогащение неспециалистами: удобство использования ручных инструментов аннотации» (PDF) . ISWC'12 - Труды 11-й международной конференции по Семантической паутине . Бостон, США. С. 165–181.
  44. ^ Мэтисон, SA (6 апреля 2006). «Распространите слово и присоединитесь к нему» . Хранитель . Проверено 14 апреля 2018 года .
  45. ^ Спивак, Nova (18 сентября 2007). «Семантическая сеть, коллективный разум и гиперданные» . novaspivack.typepad.com/nova_spivacks_weblog [Этот блог перемещен на NovaSpivack.com] . Проверено 14 апреля 2018 года .

Дальнейшее чтение [ править ]

  • Лиянг Ю (14 декабря 2014 г.). Руководство разработчика по семантической сети, 2-е изд . Springer. ISBN 978-3-662-43796-4.
  • Программируемая сеть Аарона Шварца: незаконченная работа, подаренная издательством Morgan & Claypool после смерти Аарона Шварца в январе 2013 года.
  • Григорис Антониу, Франк ван Хармелен (31 марта 2008 г.). Учебник по семантической паутине, 2-е издание . MIT Press . ISBN 978-0-262-01242-3.
  • Аллеманг, декан; Хендлер, Джеймс; Гандон, Фабьен (3 августа 2020 г.). Семантическая сеть для рабочего онтолога: эффективное моделирование связанных данных, RDFS и OWL (Третье изд.). [Нью-Йорк, Нью-Йорк, США]: ACM Books; 3-е издание. ISBN 978-1450376143.
  • Паскаль Хитцлер ; Маркус Крётч; Себастьян Рудольф (25 августа 2009 г.). Основы технологий семантической паутины . CRCPress. ISBN 978-1-4200-9050-5.
  • Томас Б. Пассин (1 марта 2004 г.). Руководство исследователя по семантической сети . Публикации Мэннинга. ISBN 978-1-932394-20-7.
  • Джеффри Т. Поллок (23 марта 2009 г.). Семантическая сеть для чайников . Для чайников. ISBN 978-0-470-39679-7.

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • Прорывный анализ: пространство данных для информационного сосуществования