Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Семантическая аналитика , также называемая семантической связью , - это использование онтологий для анализа содержимого веб-ресурсов . Эта область исследований сочетает в себе текстовую аналитику и технологии семантической паутины, такие как RDF . Семантическая аналитика измеряет взаимосвязь различных онтологических концепций.

Некоторые академические исследовательские группы, которые ведут активные проекты в этой области, включают, в частности, Центр Kno.e.sis в Государственном университете Райта .

История [ править ]

Важная веха в зарождении семантической аналитики произошла в 1996 году, хотя историческое развитие этих алгоритмов в значительной степени субъективно. В своей фундаментальной публикации исследования Филип Резник установил, что компьютеры обладают способностью подражать человеческим суждениям. Охватывая публикации нескольких журналов, улучшения точности общих семантических аналитических вычислений претендовали на революцию в этой области. Однако отсутствие стандартной терминологии в конце 1990-х было причиной многих недопониманий. Это побудило Буданицкий и Херст стандартизировать предмет в 2006 г. с резюме, которое также установило основу для современного анализа орфографии и грамматики. [1]

На заре семантической аналитики было сложно получить достаточно большие надежные базы знаний. В 2006 году Strube & Ponzetto продемонстрировали, что Википедия может использоваться в семантических аналитических вычислениях. [2] Использование большой базы знаний, такой как Википедия, позволяет повысить точность и применимость семантической аналитики.

Методы [ править ]

Учитывая субъективный характер области, различные методы, используемые в семантической аналитике, зависят от области применения. Никакие отдельные методы не считаются правильными, однако одним из наиболее эффективных и применимых методов является явный семантический анализ (ESA). [3] ESA был разработан Евгением Габриловичем и Шаулем Марковичем в конце 2000-х годов. [4] Он использует методы машинного обучения для создания семантического интерпретатора, который извлекает фрагменты текста из статей в отсортированный список. Фрагменты отсортированы по степени их отношения к окружающему тексту.

Скрытый семантический анализ (LSA) - еще один распространенный метод, который не использует онтологии, а рассматривает только текст в пространстве ввода.

Приложения [ править ]

Применение методов семантического анализа обычно оптимизирует организационные процессы любой системы управления знаниями. Академические библиотеки часто используют предметно-ориентированные приложения для создания более эффективной организационной системы. Классифицируя научные публикации с использованием семантики и Википедии, исследователи помогают людям быстрее находить ресурсы. Поисковые системы, такие как Semantic Scholar, предоставляют организованный доступ к миллионам статей.

См. Также [ править ]

  • Извлечение отношений
  • Семантическое сходство
  • Текстовая аналитика

Ссылки [ править ]

  1. ^ Budanitsky, Александр, и Graeme Херст. «Оценка показателей лексико-семантического родства на основе WordNet». Comput. Лингвист. 32, нет. 1 (март 2006 г.): 13–47. DOI : 10,1162 / coli.2006.32.1.13
  2. ^ Strube, Майкл и Симоне Паоло Понцетто. «WikiRelate! Вычисление семантического родства с использованием Википедии . В материалах 21-й Национальной конференции по искусственному интеллекту, том 2 , 1419–1424. AAAI'06. Бостон, Массачусетс: AAAI Press, 2006.
  3. ^ Z. Zhang, AL Gentile, и F. Ciravegna, " Последние достижения в методах лексической семантической взаимосвязи - обзор ", Natural Language Engineering , vol. 19, нет. 04, стр. 411–479, октябрь 2013 г.
  4. Евгений Габрилович и Шауль Маркович. 2007. «Вычисление семантической взаимосвязи с использованием явного семантического анализа на основе Википедии» . В IJcAI, 1606–1611 гг. Проверено 9 октября, 2016.

Внешние ссылки [ править ]

  • Семантический ученый