Арнетмайнер


ArnetMiner (также AMiner) — это бесплатный онлайн-сервис, используемый для индексации, поиска и добычи больших научных данных .

ArnetMiner (AMiner) предназначен для поиска и выполнения операций интеллектуального анализа данных по академическим публикациям в Интернете с использованием анализа социальных сетей для выявления связей между исследователями, конференциями и публикациями. [1] Это позволяет ему предоставлять такие услуги, как поиск экспертов, географический поиск, анализ тенденций, рекомендации рецензентов, поиск ассоциаций, поиск курсов, оценка академической успеваемости и тематическое моделирование.

ArnetMiner был создан как исследовательский проект в области анализа социального влияния, ранжирования в социальных сетях и извлечения данных из социальных сетей. В ходе разработки системы был опубликован ряд рецензируемых статей. Он работает уже более трех лет и проиндексировал 130 000 000 исследователей и более 265 миллионов публикаций. [2] Исследование финансировалось Китайской национальной программой исследований и разработок в области высоких технологий и Национальным научным фондом Китая .

ArnetMiner обычно используется в академических кругах для выявления взаимосвязей между исследованиями и исследователями и построения статистических корреляций. Он привлек более 10 миллионов независимых IP-доступов из 220 стран и регионов. Продукт использовался на платформе Elsevier SciVerse [3] и на научных конференциях, таких как SIGKDD, ICDM, PKDD, WSDM.

ArnetMiner автоматически извлекает профиль исследователя из Интернета. Он собирает и идентифицирует соответствующие страницы, а затем использует единый подход для извлечения данных из идентифицированных документов. Он также извлекает публикации из онлайновых цифровых библиотек, используя эвристические правила.

Он объединяет извлеченные профили исследователей и извлеченные публикации. В качестве идентификатора используется имя исследователя. Была предложена вероятностная структура для решения проблемы неоднозначности имени при интеграции. Интегрированные данные хранятся в базе знаний исследовательской сети (RNKB).