Научные индексы и влияние

Эта статья может потребовать очистки, чтобы соответствовать стандартам качества Википедии . Конкретная проблема: статью нужно сделать WP: MOS- совместимой; содержит неточности (библиометрические данные - это больше, чем научные указатели и т. д.), утверждения без источников и т. д. Пожалуйста, помогите улучшить эту статью, если можете. ( Апрель 2012 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Индексы ученых используются для измерения вклада ученых в области их исследований. С 2005 года бумаги Jorge E. Hirsch , ^[1] использование индексов ученых увеличилось.

Определение [ править ]

Индексы для ученых, которые иногда называют библиометрией , представляют собой математические и статистические инструменты, которые измеряют значимость вклада ученых в их область исследований. Научные индексы могут включать в себя другие оценки, такие как отслеживание цитирования и рейтинг журналов.

Создание [ править ]

Любой агрегатор цитат и ссылок может, при наличии времени, денег и склонности, создать свой собственный набор научных указателей. Издатели, известные в этой области, включают Elsevier и Thomson Reuters .

Сейчас доступно коммерческое программное обеспечение, использующее парсеры и поисковые машины для создания наборов научных указателей или индивидуальных результатов. Примеры: опубликовать или погибнуть ; ^[2] ' ScholarIndex '; ^[3] « Scopus » ^[4] и « Google Scholar ». ^[5]

Каждый поставщик программного обеспечения в первую очередь использует свои собственные данные, а также журналы, публикации, авторитетные файлы, индексы и предметные категории для создания наборов научных указателей.

В то время как некоторые компании предоставляют данные и оцененные метрики в виде бесплатных загрузок, другие требуют подписки для покрытия затрат на производство и содержание эффективного анализатора, поисковой системы и базы данных документов.

Используйте [ редактировать ]

Научные индексы позволяют выбирать коллекции журналов, использовать исследовательские фонды, ранжировать журналы и определять значимых участников в предметной области. ^[6]^[7]

Сторонники научных индексов рекомендуют использовать их в таких областях, как службы связи, справочные материалы, обучение и управление коллекциями. ^[8]

Критики использования индексов ученых ссылаются на их ограничения, связанные с вопросами точности, достоверности и применимости, и обсуждают их применение при найме, сроках пребывания в должности, финансировании, присуждении наград и решениях о членстве.

Хотя научные индексы могут не полностью описывать влияние работы отдельного исследователя, некоторые ученые сами определяют свои научные индексы, чтобы включать их, например, в рекламные материалы и биографические данные. Другие могут изучать свои научные индексы просто ради них самих.

Те, кто интересуется научными индексами, могут найти результаты, например, проекты визуализации данных, захватывающими.

Типы [ править ]

К настоящему времени разработан ряд научных указателей. Одним из них является «индекс Хирша », введенный Хорхе Э. Хиршем в августе 2005 года. Хирш описал индекс Хирша как беспристрастный, поскольку он включает взаимосвязь между объемом опубликованных научных работ и количеством цитирований этих статей, вызывающих меньшую систематическую ошибку, чем либо измерять в одиночку.

Другой научный индекс - это «g-индекс», который измеряет количество цитирований всех хорошо цитируемых работ за определенный период времени. «М-фактор» был разработан, чтобы ввести ограничение по времени для индекса Хирша, который в противном случае представлял собой постоянно увеличивающуюся величину.

Другие варианты h-индекса, такие как hI-index, e-index ^[9] и другие, находятся в стадии разработки и пересмотра.

Число Эрдёша ^[10] было разработано для измерения цепочки публикаций, начатой Полом Эрдёшем.

Все такие научные индексы количественно оценивают вклад исследователя только на основе цитирования их работ. В идеале оценка вклада исследователя в свою область должна включать как научные индексы, так и анализ качества самой работы.

h-index [ править ]

Ч-индекс индекс был предложен Jorge E. Hirsch , в физике на UCSD , в 2005 году ^[1]

Генри Шефер из Университета Джорджии , США, вместе с коллегой Эми Петерсон создали рейтинги в соответствии с индексом Хирша от ISI Web of Science. Хотя веб-приложения могут вычислять h-индексы, Петерсону приходилось проверять орфографические ошибки или повторяющиеся имена.

Индекс Хирша определяется следующим образом:

Ученый имеет индекс h, если h из его или ее N статей имеют не менее h цитирований каждая, а другие ( N - h ) статьи имеют не более h цитирований каждая.

Для расчета индекса Хирша статьи, написанные академиком, располагаются в порядке убывания количества цитирований. Индекс Хирша - это когда количество статей равно количеству цитирований (начиная с статьи с наибольшим количеством цитирований).

Хотя индекс Хирша широко используется, он не учитывает качество документов; другие статьи, цитирующие научные публикации; количество соавторов и место автора в списке авторов. Кроме того, всем полям присваивается одинаковое значение.

Еще одно ограничение заключается в том, что индекс Хирша не меняется со временем ^{[ необходима цитата ]} . Например, Эварист Галуа имел индекс Хирша 2, в то время как Клод Шеннон имел индекс Хирша 7, ^[11] увеличился до 62 в 2020 году ^[12].

m-фактор [ править ]

В то время как h-индекс не зависит от даты академической карьеры, m-фактор направлен на взвешивание периода академических усилий, чтобы уменьшить предвзятость в пользу ученых с более длительной карьерой.

Таким образом, если n = количество лет, прошедших с момента публикации первой статьи ученого, m-фактор = h-index / n .

Однако m-фактор может стабилизироваться только на более позднем этапе карьеры ученого. для исследователей на начальном этапе своей карьеры, у которых низкие индексы h, небольшие изменения h-индекса могут привести к большим изменениям m-фактора. Хирш предполагает, что первая опубликованная статья исследователя не всегда может быть подходящей отправной точкой, особенно если это был незначительный вклад, опубликованный задолго до академического периода устойчивой продуктивности.

Хотя m-фактор добавляет время в качестве весового коэффициента, он не учитывает основные недостатки h-индекса, включая качество публикации и качество цитирования.

g-index [ править ]

g-index - это вариант h-индекса , который учитывает изменение цитируемости наиболее цитируемых статей с течением времени.

Набор статей имеет g-индекс g, если g - это наивысший ранг, такой, что лучшие статьи g вместе имеют не менее g ^ 2 цитирований.

Другими словами, g-индекс g - это наибольший ранг (где статьи расположены в порядке убывания количества полученных ими цитирований), так что первые статьи g имеют (вместе) не менее g ^ 2 цитирований.

Можно доказать, что для любого набора статей g-индекс всегда существует и единственен. ^[13]

${\ displaystyle g = \ left ({\ frac {\ alpha -1} {\ alpha -2}} \ right) ^ {\ frac {\ alpha -1} {\ alpha}} {\ frac {1} {T ^ {\ alpha}}}}$

где показатель Лоткаяна, а T - общее количество источников.

Поскольку , ${\ Displaystyle ч = Т ^ {1 / \ альфа}}$ ${\ displaystyle g = \ left ({\ frac {\ alpha -1} {\ alpha -2}} \ right) ^ {\ frac {\ alpha -1} {\ alpha}} h> h}$

Например, если 2 ученых имеют индекс Хирша 4, может случиться так, что один из них опубликовал 4 статьи, которые имеют 4 или более цитирования, в то время как другой ученый может опубликовать 10 статей, из которых 3 имеют более 100 цитирований, а 4-е. В статье 4 цитирования, а в остальных - менее 4 цитирований.

В попытке предложить более высокий вес второму ученому, который в совокупности получил более 304 ссылок на 10 статей, был предложен g-индекс . Таким образом, в нашем примере у первого ученого g-index = 4, а у второго ученого g-index значительно выше.

Число Эрдеша [ править ]

Число Эрдеша измеряет совместное расстояние между человеком и математиком Полом Эрдешом, измеряемое авторством математических статей.

Принимая во внимание, что Пол Эрдёш имеет индекс = 0, люди, которые были соавторами с ним, имеют индекс = 1, соавторы этих соавторов имеют индекс = 2 и так далее. Таким образом, чтобы вычислить свое число Эрдеша, добавьте 1 к числу Эрдеша любого соавтора с наименьшим числом Эрдеша. В рамках проекта Erds-Number в Оклендском университете поддерживается веб-сайт, отслеживающий количество ученых по всему миру, связанных с Erds.

Одно предостережение заключается в том, что большинство зарегистрированных до сих пор чисел Эрдеша составляют до 13, но среднее значение меньше 5, и почти каждый с конечным числом Эрдеша имеет число меньше 8.

Индексы Hubs и Authority [ править ]

Оценка полного вклада ученого в область своих исследований может быть оценена двояко. Один из них заключается в учете количества цитирований, полученных ученым. Другой - за счет учета качества ссылок, на которые ссылается ученый.

В то время как сильная цитируемость делает ученого сильным авторитетом в своей области, наличие сильных ссылок делает ученого сильным центром, который знает всю значительную работу в этой области. Расчет индексов хаба и авторитета требует знания отношений между цитируемыми или упоминаемыми учеными.

Для вычисления этих индексов можно использовать алгоритм Hubs and Authorities. Алгоритм выполняет анализ ссылок в данной сети и присваивает каждому узлу две оценки: концентратор и орган; ^[14]^[15]

На ценный и информативный узел в сети обычно указывает большое количество ссылок, то есть он имеет большую степень (см. Рис. 1). Такой узел называется авторитетом. ^[16]

Узел, указывающий на множество авторитетных узлов, сам по себе является полезным ресурсом и называется концентратором. Хаб обычно имеет большую исходящую степень. В контексте цитирования литературы хаб - это обзорная статья, в которой цитируется множество оригинальных статей, а авторитетная - это оригинальная основополагающая статья, на которую ссылаются многие статьи. ^[17]

Рис. 1. При рассмотрении соединения зеленого узла S , узлы у указывают на степень , в-и узлы в х указывают затраченной степень узла S .

Сеть может быть построена из узлов, представляющих авторов, и ссылок, указывающих ссылки на опубликованные статьи. Исходящие ссылки показывают, кого цитировал автор, а входящие ссылки указывают, кто цитировал автора.

Оценка исследователя - это сумма оценок авторов, чьи работы цитируются. Оценка авторитета исследователя - это сумма оценок авторов, которые ссылались на работу исследователя.

Оценка хаба увеличивается, если автор цитирует статьи, опубликованные авторами с высокими авторитетными оценками. Рейтинг авторитета увеличивается, когда опубликованные статьи цитируются авторами с высоким рейтингом.

$h(x)\leftarrow \sum _{x\rightarrow y}a(y)$

$a(x)\leftarrow \sum _{y\rightarrow x}h(y)$

Уравнения можно переписать в матрично-векторном виде. Пусть A - матрица смежности сети, а векторы h и a содержат оценки всех узлов и органов власти соответственно. Затем баллы можно рассчитать по следующим формулам. ^[18]

${\vec {h}}=(1/\lambda _{h})AA^{T}{\vec {h}}$

${\vec {a}}=(1/\lambda _{a})A^{T}A{\vec {a}}$

Реализация алгоритма концентраторов и индекса полномочий [ править ]

Индексы хабов и авторитетных источников требуют знания взаимосвязей между учеными, которые ссылаются на работы друг друга и цитируют их. Поскольку не всегда возможно точно получить эти шаблоны связности, можно оценить матрицу смежности (A), касающуюся связей ученого.

Например, у ученого есть оценочная матрица локальной связи. Это комбинация работ, на которые он ссылается, и работ, которые он цитирует. После того , как сеть смежности оценивается, ступиц и полномочия индексов определяются Собственные разложения из (A.A ') и (A'.A) соответственно. Шаги, выполняемые для этой конкретной реализации, следующие:

Шаг 1: Пусть ученый будет оцениваться В S . Этого ученого ищут в Scopus, и общее количество полученных им ссылок = c , а общее количество использованных им ссылок = r .
Шаг 2: список ученых , которые цитируемые произведения S записаны как множество Y . Список ученых , которые были переданы на S записывается как X . Выбор членов X и Y производится в порядке убывания цитирования в Scopus. Поскольку оценки матрицы смежности A было достаточно, мы записали элементы X и Y с цитированием более 100 в Scopus. Пусть количество значимых цитат = c _s , а количество значимых ссылок = r _s . Для каждого значимого члена X иУ , один оценивает отношение (число ссылок / число ссылок) в качестве весов матрицы A .
Шаг 3: После вычисления весов, соответствующих значимым элементам X и Y , веса не столь значимых элементов оцениваются случайным образом. Таким образом, случайные веса генерируются для C - Ĉ _сек цитаты для членов Y и г - R _сек ссылки для членов X . Таким образом, матрица A создается как:

А	Столбец	S	Икс
Индекс строки	S	0	1
	Икс	0	0
	Y	1	0

Где блоки X и блоки Y заменяют единицы. Связь соответствует рисунку 2.

Рис. 2. Данное изображение иллюстрирует связь между S , X , Y для генерации матрицы смежности A . Только S соединен с X, а Y соединен с S , все остальные соединения равны 0. A - это однонаправленная матрица смежности.

Шаг 4: Начальный вектор концентратора вычисляется как первичный собственный вектор (с наивысшим собственным значением) A.A ' и нормализуется между [0,1]. Начальный авторитетный вектор является первичным собственным вектором A'.A и также нормализован. Поскольку эти индексы взаимосвязаны, вектор концентратора становится начальным вектором полномочий A *, а вектор полномочий становится вектором начального концентратора A '*. Поскольку ученый 'S' был первой записью матрицы A, следовательно, первое значение векторов узловой и авторитетной точек является индексами узловой власти для ученого S. Псевдокод для того же самого выглядит следующим образом: S - ученый, чей узловой индекс - h, а индекс авторитета - a .

Псевдокод [ править ]

1 $h_{i}\leftarrow principal~eigen~vector(AA^{T})$

2 $a_{i}\leftarrow principal~eigen~vector(A^{T}A)$

3 $h=A*a_{i}$

4 $a=A^{T}*h_{i}$

Пример 1. Научные индексы известных ученых [ править ]

Ученый	h-index (с использованием Publish или Perish) ^[2]	g-index (с использованием Publish или Perish) ^[2]	индекс Хирша (с использованием Scopus ) ^[4]	Индекс концентратора (на 10 ^ 2) ^[4]	Индекс авторитета ^[4]
Ньюман, MEJ	65	210	51	210,54	129,3687
Эйнштейн, Альберт	92	231	N / A (после 1995 года ничего не представлено)	0	99,9586
Шеннон, CE	44 год	228	N / A (после 1995 года ничего не представлено)	0	15,9117
Эрдеш, Пол	76	142	8	0,406490	77,8040
Шенкер, Скотт	105	253	36	29,173	171,1167
Хирш, Хорхе Э.	31 год	70	21 год	78,938	151,5361
Попл, Джон	87	293	29	123,7993	355,6553

В таблице Scopus используется только в качестве поисковой системы, а матрица смежности является оценкой, поэтому приведенные выше результаты представляют собой чрезвычайно агрегированные версии, и их не следует путать с абсолютными индексами. Более точная оценка матрицы смежности может привести к вариациям в индексах. Кроме того, Scopus отслеживает статьи только после 1995 г., так что это дополнительное ограничение. (Все индексы оценены по состоянию на 12 декабря 2011 г.)

Из этой таблицы видно, что разные поисковые системы дают разные h-индексы. Возможно, что ученый с высоким индексом Хирша может быть сильным авторитетом, но не обязательно сильным центром. Действительность поисковых систем оценивается, поскольку документы до 1995 года недоступны. Количество публикаций конкретного автора в конкретной базе данных влияет на индексы хаба-авторитета. Междисциплинарная работа может быть хорошо оценена индексом авторитетности хаба в отличие от других индексов.

Пример 2: Прогнозируемые индексы авторитетности хаба с учетом времени (игрушечный пример) [ править ]

Это пример для понимания взаимодействия различных научных индексов.

Новый ученый, начавший свою академическую карьеру в 2009 году, опубликовал 3 статьи. Две статьи имеют по 2 ссылки каждая, а третья статья не цитируется. Она сослалась на 60 статей с 17 сильными ссылками из 60. У одного из ее соавторов самое низкое число Эрдеша 3. Ее научные индексы по состоянию на декабрь 2011 года:

h-index = 2
g-index = 2
m-частное = 2/2 = 1
Число Эрдёша = 3 + 1 = 4
Индекс HUB (на 10 ^ 2) = 11,702
Индекс AUTHORITY = 0,1061

Через год она публикует еще одну статью с 20 новыми ссылками, так что теперь у нее в совокупности 31 сильная ссылка, 4 статьи с 2 цитированием для 2 статей и 0 цитирований для других 2 статей. Индексы ее хаб-авторитета меняются:

Индекс HUB = 12,668

Индекс AUTHORITY = 0,1061

Через год ее количество цитирований 3 статей увеличилось до 10, и она продолжает иметь 60 ссылок с 17 сильными ссылками:

Индекс HUB = 11,568

Индекс AUTHORITY = 0,3241

Через год ее количество цитирований увеличивается до 10, и она пишет еще одну статью, в которой количество ссылок достигает 80 (с 31 сильной):

Индекс HUB = 12,694

Индекс AUTHORITY = 0,3284

Таким образом, для этого игрушечного примера наблюдаются следующие индексы хаба-авторитета.

Пример	Кол-во цитат	Кол-во ссылок	HUB (на 10 ^ 2)	ВЛАСТЬ
В настоящее время	4	60	11,702	0,1061
Если ссылки увеличиваются	4	80	12,668	0,1061
Если цитирования увеличиваются	10	60	11,568	0,3241
Если количество цитирований и ссылок увеличится	10	80	12,694	0,3284

Код Matlab для примеров примеров 1 и Toy в примере 2 прикреплен как файл 1.

Файл 1. Пример кода MATLAB для индексов хаб-авторитета для известных ученых и пример игрушки в Примере 1 и Примере 2.

Эти примеры демонстрируют важность индексов хаба-авторитета в количественной оценке вклада ученого в полную академическую карьеру.

Критика [ править ]

У научных указателей есть ограничения, в том числе отсутствие точности, достоверности и применимости. Хотя точность индексов ученых сомнительна из-за разницы в написании, разницы в синтаксическом анализаторе, поисковых системах и базах данных документов, поддерживаемых различными онлайн-источниками, можно было бы решить проблемы с точностью, если бы каждому автору был присвоен уникальный идентификатор. вместо того, чтобы полагаться на имена при поиске. Кроме того, каждый раз, когда публикуются эти индексы, необходимо упоминать используемые методы и поисковые системы, чтобы избежать двусмысленности, насколько это возможно.

Достоверность научных индексов является ограничением, поскольку они не взвешивают области разной важности. Например, Джон Попл , химик-теоретик, получивший Нобелевскую премию, плохо справляется с наборами h-индексов.

Применимость научных индексов имеет ограничения, когда ученые делают акцент на практическом продвижении в определенной области, а не на публикации статей. Также трудно задокументировать работы более раннего десятилетия в виде онлайн-документов, что снижает их влияние в онлайн-режиме . Например, Scopus - это онлайн-база данных, которая рассчитывает индексы ученых для документов, найденных только после 1995 года. Более ранние работы не документируются и не оцениваются.

Хорхе Э. Хирш предположил, что индекс Хирша должен информировать комитеты по найму, продвижению по службе, финансированию, срокам пребывания, наградам и общественным комитетам для принятия разумных решений. Однако из-за их ограничений на них лучше всего смотреть сбалансированно.

Ссылки [ править ]

^ a b Макдональд, Ким (8 ноября 2005 г.). «Физик предлагает новый способ ранжирования научных результатов» . PhysOrg . Проверено 13 мая 2010 года .
^ a b c Perish Software Harzing, AW (2007) Publish or Perish, доступно по адресу http://www.harzing.com/pop.htm
^ http://www.cs.odu.edu/~mln/pubs/2007-10-09-h-index.html
^ а б в г https://www.scopus.com/home.url
^ https://scholar.google.com/
^ Мохаммад Хамдака и А. Хаму-Лхадж, "Анализ цитирования: подход к облегчению понимания и анализа нормативных документов соответствия", In Proc. 6-й Международной конференции по информационным технологиям, Лас-Вегас, США
^ Кеар, Робин и Кольбер-Льюис, Даниэль (2011). «Цитирование и библиометрические измерения» . Новости колледжей и исследовательских библиотек . 72 (8): 470–474. DOI : 10,5860 / crln.72.8.8620 .
^ Аманда Л. Werhane, UW-Madison. «Индекс Хирша научных результатов: новая мера, продолжающиеся дебаты» (PDF) . Проверено 22 апреля 2014 года .
Перейти ↑ Zhang, CT (2009). «Электронный индекс, дополняющий h-индекс избыточных цитирований» . PLoS ONE . 4 (5): e5429. DOI : 10.1371 / journal.pone.0005429 . PMC 2673580 . PMID 19415119 .
^ Проект числа Эрдеша. http://www.oakland.edu/enp/
^ http://arnetminer.org/viewperson.do?aid=833230&name=C.%20E.%20Shannon (h-индекс Шеннона)
^ https://scholar.google.it/citations?hl=it&user=2M6S-aAAAAAJ
^ LEO EGGHE (2006). «Теория и практика g-индекса». Наукометрия . 69 (1): 131–152. DOI : 10.1007 / s11192-006-0144-7 . hdl : 1942/981 .
^ Центры и органы власти. http://nlp.stanford.edu/IR-book/html/htmledition/hubs-and-authorities-1.html
^ Центры и органы власти. http://www.cs.ucr.edu/~vagelis/classes/CS172/publications/kleinberg98authoritative.pdf
^ Справочная терминология
^ Иерархический анализ ссылок для ранжирования веб-данных. http://renaud.delbru.fr/doc/pub/eswc2010-ding-slides.pdf
^ Алгоритм HITS - Центры и органы в Интернете. http://www.math.cornell.edu/~mec/Winter2009/RalucaRemus/Lecture4/lecture4.html

[McDonald2005-1] Макдональд, Ким (8 ноября 2005 г.). «Физик предлагает новый способ ранжирования научных результатов» . PhysOrg . Проверено 13 мая 2010 года .

[PP-2] Perish Software Harzing, AW (2007) Publish or Perish, доступно по адресу http://www.harzing.com/pop.htm

[SI-3] ttp://www.cs.odu.edu/~mln/pubs/2007-10-09-h-index.html

[Scopus-4] а б в г https://www.scopus.com/home.url

[GS-5] ttps://scholar.google.com/

[6] Мохаммад Хамдака и А. Хаму-Лхадж, "Анализ цитирования: подход к облегчению понимания и анализа нормативных документов соответствия", In Proc. 6-й Международной конференции по информационным технологиям, Лас-Вегас, США

[npnas-7] Кеар, Робин и Кольбер-Льюис, Даниэль (2011). «Цитирование и библиометрические измерения» . Новости колледжей и исследовательских библиотек . 72 (8): 470–474. DOI : 10,5860 / crln.72.8.8620 .

[8] Аманда Л. Werhane, UW-Madison. «Индекс Хирша научных результатов: новая мера, продолжающиеся дебаты» (PDF) . Проверено 22 апреля 2014 года .

[9] Перейти ↑ Zhang, CT (2009). «Электронный индекс, дополняющий h-индекс избыточных цитирований» . PLoS ONE . 4 (5): e5429. DOI : 10.1371 / journal.pone.0005429 . PMC 2673580 . PMID 19415119 .

[10] Проект числа Эрдеша. http://www.oakland.edu/enp/

[11] ttp://arnetminer.org/viewperson.do?aid=833230&name=C.%20E.%20Shannon (h-индекс Шеннона)

[12] ttps://scholar.google.it/citations?hl=it&user=2M6S-aAAAAAJ

[g-13] LEO EGGHE (2006). «Теория и практика g-индекса». Наукометрия . 69 (1): 131–152. DOI : 10.1007 / s11192-006-0144-7 . hdl : 1942/981 .

[14] Центры и органы власти. http://nlp.stanford.edu/IR-book/html/htmledition/hubs-and-authorities-1.html

[15] Центры и органы власти. http://www.cs.ucr.edu/~vagelis/classes/CS172/publications/kleinberg98authoritative.pdf

[16] Справочная терминология

[17] Иерархический анализ ссылок для ранжирования веб-данных. http://renaud.delbru.fr/doc/pub/eswc2010-ding-slides.pdf

[18] Алгоритм HITS - Центры и органы в Интернете. http://www.math.cornell.edu/~mec/Winter2009/RalucaRemus/Lecture4/lecture4.html

[1]