В представлении знаний и рассуждениях , граф знаний является базой знаний , которая использует граф структурированной модели данных или топологию для интеграции данных. Графы знаний часто используются для хранения взаимосвязанных описаний сущностей - объектов, событий, ситуаций или абстрактных концепций - с семантикой произвольной формы. [1]
С момента развития семантической паутины графы знаний часто ассоциируются со связанными проектами открытых данных , уделяя особое внимание связям между концепциями и сущностями. [2] [3] Они также активно связаны с такими поисковыми системами, как Google , Bing и Yahoo , и используются ими ; механизмы знаний и службы ответов на вопросы, такие как WolframAlpha , Apple Siri и Amazon Alexa ; и социальные сети, такие как LinkedIn и Facebook .
История
Этот термин был придуман еще в 1972 году при обсуждении того, как создавать модульные системы обучения для курсов. [4] В конце 1980-х годов университеты Гронингена и Твенте совместно начали проект под названием « Графы знаний», сфокусированный на разработке семантических сетей с ребрами, ограниченными ограниченным набором отношений, чтобы упростить использование алгебр на графе. В последующие десятилетия различия между семантическими сетями и графами знаний были размыты.
Некоторые графики ранних знаний были тематическими. В 1985 году была основана Wordnet , улавливающая семантические отношения между словами и значениями - применение этой идеи к самому языку. В 2005 году Марк Вирк основал Geonames, чтобы фиксировать взаимосвязи между различными географическими названиями, местами и связанными с ними объектами. В 1998 году Эндрю Эдмондс из Science in Finance Ltd в Великобритании создал систему под названием ThinkBase, которая предлагала рассуждения на основе нечеткой логики в графическом контексте. [5]
В 2007 году и DBpedia, и Freebase были основаны как хранилища знаний общего назначения на основе графов. DBpedia сосредоточилась исключительно на данных, извлеченных из Википедии, в то время как Freebase также включала ряд общедоступных наборов данных. Ни те, ни другие не называли себя «графом знаний», но разработали и описали связанные концепции.
В 2012 году Google представила свой Graph знаний , [6] здание на DBpedia и Freebase среди других источников. Позже они включили RDFa , Microdata , контент JSON-LD, извлеченный из проиндексированных веб-страниц, включая CIA World Factbook , Wikidata и Wikipedia . [6] [7] Типы сущностей и отношений, связанные с этим графом знаний, были дополнительно организованы с использованием терминов из словаря schema.org [8] . Сеть знаний Google стала успешным дополнением к поиску на основе строк в Google, а его популярность в Интернете привела к более широкому использованию этого термина. [8]
С тех пор несколько крупных транснациональных корпораций рекламировали использование графов знаний, что еще больше популяризировало этот термин. К ним относятся Facebook , LinkedIn , Airbnb , Microsoft , Amazon , Uber и eBay . [9]
В 2019 году IEEE объединил свои ежегодные международные конференции по теме «Большие знания» и «Интеллектуальный анализ данных и интеллектуальные вычисления» в Международную конференцию по графу знаний. [10]
Определения
Нет единого общепринятого определения графа знаний. Большинство определений рассматривают тему через призму семантической паутины и включают следующие особенности: [11]
- Гибкие отношения между знаниями в тематических областях: граф знаний (i) определяет абстрактные классы и отношения сущностей в схеме, (ii) в основном описывает сущности реального мира и их взаимосвязи, организованные в виде графа, (iii) допускает потенциально взаимосвязь произвольных объекты друг с другом, и (iv) охватывает различные тематические области. [12]
- Общая структура : сеть сущностей, их семантические типы, свойства и отношения. [13] [14]
- Обоснование рассуждений по предполагаемым онтологиям : граф знаний собирает и интегрирует информацию в онтологию и применяет логику рассуждений для получения новых знаний. [2]
Однако существует множество представлений графов знаний, для которых некоторые из этих функций не актуальны. Для таких графов знаний более полезным может оказаться более простое определение:
- Цифровая структура, которая представляет знания как концепции и отношения между ними (факты). Граф знаний может включать в себя онтологию, которая позволяет людям и машинам понимать его содержимое и рассуждать о нем. [15]
Реализации
В дополнение к приведенным выше примерам этот термин использовался для описания проектов открытых знаний, таких как YAGO и Wikidata ; федерации, такие как облако связанных открытых данных; [16] ряд коммерческих инструментов поиска, в том числе Spark, помощник по семантическому поиску Yahoo, Knowledge Graph от Google и Satori от Microsoft; и диаграммы сущностей LinkedIn и Facebook. [2] Этот термин также все чаще используется в приложениях для создания заметок, позволяющих пользователю построить свой личный граф знаний.
Использование графа знаний для анализа данных
Граф знаний формально представляет семантику, описывая сущности и их отношения. Графы знаний могут использовать онтологии в качестве слоя схемы. Делая это, они позволяют логический вывод для извлечения неявных знаний, а не разрешают только запросы, запрашивающие явные знания. [17]
Чтобы разрешить использование графов знаний в различных задачах машинного обучения, было разработано несколько методов получения представлений скрытых функций для сущностей и отношений. Эти вложения графов знаний позволяют подключать их к методам машинного обучения, которым требуются векторы функций, такие как вложения слов . Это может дополнять другие оценки концептуального сходства. [18] [19]
Смотрите также
- Онтология (информатика)
- Семантическая сеть
- Семантическая технология
- ЯГО (база данных)
Рекомендации
- ^ "Что такое сеть знаний?" . 2018.
- ^ а б в Эрлингер, Лиза; Весс, Вольфрам (2016). К определению графов знаний (PDF) . SEMANTiCS2016. Лейпциг: совместные материалы трека плакатов и демонстраций 12-й Международной конференции по семантическим системам - SEMANTiCS2016 и 1-го Международного семинара по семантическим изменениям и эволюции семантики (SuCCESS16). С. 13–16.
- ^ Сойлу, Ахмет (2020). «Улучшение государственных закупок в Европейском Союзе посредством построения и использования интегрированной сети знаний» . Труды Международной конференции по семантической паутине (ISWC 2020) : 430–446. DOI : 10.1007 / 978-3-030-62466-8_27 .
- ^ Эдвард В. Шнайдер. 1973. Прикладная модуляризация курса: интерфейсная система и ее значение для управления последовательностью и анализа данных. В Ассоциации разработки учебных систем (ADIS), Чикаго, Иллинойс, апрель 1972 г.
- ^ «Торговая марка США № 75589756» .
- ^ а б Сингхал, Амит (16 мая 2012 г.). «Знакомство с сетью знаний: вещи, а не строки» . Официальный блог Google . Проверено 21 марта 2017 года .
- ^ Шварц, Барри (17 декабря 2014 г.). "Бесплатная база Google закрывается после перехода на Викиданные: влияние на сеть знаний?" . Круглый стол по поисковым системам . Проверено 10 декабря 2017 года .
- ^ а б Маккаскер, Джеймс П .; МакГиннес, Дебора Л. "Что такое граф знаний?" . www.authorea.com . Проверено 21 марта 2017 года .
- ^ "Предприятия сети знаний" . 2020.
- ^ «Международная конференция IEEE 2021 по сети знаний (ICKG) *» . KMedu Hub . 2017-07-09 . Проверено 22 марта 2021 .
- ^ Хоган, Эйдан; Бломквист, Ева; Кочез, Майкл; д'Амато, Клаудиа; де Мело, Жерар; Гутьеррес, Клаудио; Лабра Гайо, Хосе Эмилио; Кирран, Сабрина; Ноймайер, Себастьян; Поллерес, Аксель; Навильи, Роберто; Нгонга Нгомо, Аксель-Сирилл; Рашид, Саббир М .; Рула, Аниса; Schmelzeisen, Lukas; Секеда, Хуан; Стааб, Штеффен; Циммерманн, Антуан (2021-01-24). «Графики знаний». arXiv : 2003.02320 [ cs.AI ].
- ^ Паульхейм, Хайко (2017). «Уточнение графа знаний: обзор подходов и методов оценки» (PDF) . Семантическая сеть : 489–508 . Проверено 21 марта 2017 года .
- ^ Крёч, Маркус; Вейкум, Герхард. «Редакция специального выпуска о графах знаний» . Проверено 10 февраля 2021 года . Цитировать журнал требует
|journal=
( помощь ) - ^ «Что такое сеть знаний? | Онтекст» . Онтекст . Проверено 1 июля 2020 .
- ^ «Сеть знаний о графах знаний» . 2020.
- ^ «Связанное облако открытых данных» . lod-cloud.net . Проверено 30 июня 2020 .
- ^ "Каковы преимущества Панели знаний Google?" . GKP Maker . 2020-10-06 . Проверено 28 октября 2020 .
- ^ Хунвэй Ван (октябрь 2018 г.). «RippleNet: распространение пользовательских предпочтений в сети знаний для рекомендательных систем». Международная конференция ACM по управлению информацией и знаниями : 417–426. arXiv : 1803.03467 . DOI : 10.1145 / 3269206.3271739 . S2CID 3766110 .
- ^ «Встраиваемые модели для пополнения графа знаний» .
Внешние ссылки
- Уилл Дуглас Хевен (4 сентября 2020 г.). «Этот всезнайка ИИ учится, непрерывно читая всю сеть» . Обзор технологий Массачусетского технологического института . Дата обращения 5 сентября 2020 .
Diffbot строит крупнейший в истории граф знаний, применяя распознавание изображений и обработку естественного языка для миллиардов веб-страниц.