Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Ранжирования является связь между набором элементов таким образом , что для любых двух элементов, первый либо «более высокий ранг , чем», «занимает меньше , чем» или «ранг равен» второй. [1] В математике это называется слабым порядком или полным предварительным порядком объектов. Это не обязательно полный порядок объектов, потому что два разных объекта могут иметь одинаковый рейтинг. Сами рейтинги полностью упорядочены. Например, материалы полностью упорядочены по твердости , а степени твердости - полностью заказаны. Если два предмета имеют одинаковый ранг, это считается ничьей.

Сводя подробные меры к последовательности порядковых номеров , рейтинги позволяют оценивать сложную информацию по определенным критериям. [2] Таким образом, например, поисковая машина в Интернете может ранжировать найденные страницы в соответствии с оценкой их релевантности , позволяя пользователю быстро выбирать страницы, которые он, вероятно, захочет увидеть.

Анализ данных, полученных путем ранжирования, обычно требует непараметрической статистики .

Стратегии присвоения рейтинга [ править ]

Не всегда возможно однозначно присвоить рейтинг. Например, в гонке или соревновании два (или более) участника могут претендовать на место в рейтинге. [3] При вычислении порядкового измерения две (или более) ранжируемых величины могут быть равными. В этих случаях может быть принята одна из приведенных ниже стратегий для присвоения рейтингов. Распространенный сокращенный способ отличить эти стратегии ранжирования - это числа ранжирования, которые будут получены для четырех элементов, при этом первый элемент занимает первое место по сравнению со вторым, а третий (которые сравниваются одинаково), которые оба занимают место выше четвертого. Эти имена также показаны ниже.

Стандартный рейтинг конкурса (рейтинг "1224") [ править ]

В соревновательном рейтинге элементы, которые сравниваются с равными, получают один и тот же ранговый номер, а затем в ранжируемых числах остается пробел. Количество номеров ранжирования, оставленных в этом промежутке, на единицу меньше, чем количество сравниваемых элементов, равных. Эквивалентно, номер ранжирования каждого элемента равен 1 плюс количество элементов, ранжированных выше него. Эта стратегия ранжирования часто применяется для соревнований, так как это означает, что если два (или более) спортсмена имеют одинаковые позиции в рейтинге, положение всех тех, кто занимает место ниже, не изменяется (т. Е. Участник занимает второе место только в том случае, если ровно один человек набирает больше, чем они, третье, если ровно два человека набрали больше, чем они, четвертое, если ровно три человека набирают больше, чем они, и т.

Таким образом, если A занимает место впереди B и C (которые сравниваются одинаково), которые оба занимают место выше D, тогда A получает рейтинг номер 1 ("первый"), B получает рейтинг номер 2 ("совместный второй"), C также получает рейтинг номер 2 («совместный второй») и D получает рейтинг 4 («четвертый»).

Модифицированный рейтинг конкурса (рейтинг «1334») [ править ]

Иногда для ранжирования на соревнованиях оставляют пробелы в номерах ранжирования перед наборами элементов равного ранга (а не после них, как при стандартном ранжировании на соревнованиях). [ где? ] Число ранжируемых номеров, оставленных в этом промежутке, остается на единицу меньше числа сравниваемых элементов, равных. Эквивалентно, номер ранжирования каждого элемента равен количеству элементов, ранжированных равным ему или выше. Этот рейтинг гарантирует, что участник занимает второе место только в том случае, если он набирает больше всех своих противников, кроме одного, третье, если он набирает больше, чем все, кроме двух своих противников, и т. Д.

Таким образом, если A занимает место впереди B и C (которые сравниваются одинаково), которые оба занимают первое место в D, тогда A получает рейтинг номер 1 ("первый"), B получает рейтинг номер 3 ("совместная третья"), C также получает рейтинг номер 3 («совместный третий») и D получает рейтинг 4 («четвертый»). В этом случае никто не получит рейтинг 2 («второй»), и это останется как пробел.

Плотный рейтинг (рейтинг "1223") [ править ]

При плотном ранжировании элементы, которые сравниваются в равной степени, получают один и тот же ранговый номер, а следующий (ые) элемент (ы) получает следующий за ним ранговый номер. Эквивалентно, номер ранжирования каждого элемента равен 1 плюс количество элементов, ранжированных выше него, которые различаются по порядку ранжирования.

Таким образом, если A занимает место впереди B и C (которые сравниваются одинаково), которые оба занимают место выше D, тогда A получает рейтинг номер 1 ("первый"), B получает рейтинг номер 2 ("совместный второй"), C также получает рейтинг номер 2 («совместный второй»), а D получает рейтинг 3 («Третий»).

Порядковый рейтинг (рейтинг "1234") [ править ]

При порядковом ранжировании все элементы получают различные порядковые номера, включая элементы, которые сравниваются одинаково. Присвоение различных порядковых номеров элементам, которые сравниваются одинаково, может выполняться случайным образом или произвольно, но обычно предпочтительнее использовать произвольную, но последовательную систему, поскольку это дает стабильные результаты, если ранжирование выполняется несколько раз. Примером произвольной, но последовательной системы может быть включение других атрибутов в порядок ранжирования (таких как алфавитный порядок имени участника), чтобы гарантировать, что никакие два элемента не совпадают в точности.

С этой стратегией, если A занимает место впереди B и C (которые сравнивают равные), которые оба занимают место выше D, тогда A получает рейтинг номер 1 («первый»), а D получает рейтинг номер 4 («четвертый»), и либо B получает номер рейтинга 2 («второй»), а C получает номер рейтинга 3 («третий») или C получает номер рейтинга 2 («второй»), а B получает номер рейтинга 3 («третий»).

При компьютерной обработке данных порядковое ранжирование также называется «нумерацией строк».

Дробное ранжирование (рейтинг «1 2,5 2,5 4») [ править ]

Элементы, которые сравнивают равные, получают одинаковый номер рейтинга, который является средним значением того, что они имели бы в порядковом рейтинге. Эквивалентно, номер ранжирования, равный 1, плюс количество элементов, ранжированных выше, плюс половина количества элементов, равных ему. Эта стратегия обладает тем свойством, что сумма номеров ранжирования такая же, как и при порядковом ранжировании. По этой причине он используется при вычислении количества Борда и в статистических тестах (см. Ниже).

Таким образом, если A опережает B и C (которые в сравнении равны), которые оба занимают место впереди D, то A получает рейтинг 1 («первый»), B и C получают каждый рейтинг 2,5 (среднее «совместное второе / третье место»). ") и D получает рейтинг 4 (" четвертый ").

Вот пример: Предположим, у вас есть набор данных 1.0, 1.0, 2.0, 3.0, 3.0, 4.0, 5.0, 5.0, 5.0.

Порядковые ранги: 1, 2, 3, 4, 5, 6, 7, 8, 9.

Для v = 1,0 дробный ранг - это среднее значение порядковых рангов: (1 + 2) / 2 = 1,5. Аналогичным образом для v = 5,0 дробный ранг равен (7 + 8 + 9) / 3 = 8,0.

Таким образом, дробные ранги следующие: 1.5, 1.5, 3.0, 4.5, 4.5, 6.0, 8.0, 8.0, 8.0.

Рейтинг в статистике [ править ]

В статистике ранжирование - это преобразование данных, при котором числовые или порядковые значения заменяются их рангом при сортировке данных. Например, наблюдаются числовые данные 3.4, 5.1, 2.6, 7.3, ранги этих элементов данных будут 2, 3, 1 и 4 соответственно. Например, порядковые данные горячий, холодный, теплый будут заменены на 3, 1, 2. В этих примерах ранги присваиваются значениям в порядке возрастания. (В некоторых других случаях используются нисходящие ранги.) Ранги связаны с индексированным списком упорядоченной статистики , который состоит из исходного набора данных, переставленного в порядке возрастания.

Некоторые виды статистических тестов используют вычисления на основе рангов. Примеры включают:

  • Тест Фридмана
  • Тест Краскала – Уоллиса
  • Рейтинг продуктов
  • Коэффициент ранговой корреляции Спирмена
  • Тест суммы рангов Вилкоксона
  • Знаковый ранговый тест Вилкоксона
  • Тест Ван дер Вардена

Распределение значений в порядке убывания ранга часто представляет интерес, когда значения сильно различаются по масштабу; это распределение рангового размера (или рангово-частотное распределение), например, для размеров городов или частотности слов. Они часто подчиняются степенному закону .

Некоторые ранги могут иметь нецелые значения для связанных значений данных. Например, когда имеется четное количество копий одного и того же значения данных, вышеописанный дробный статистический ранг связанных данных заканчивается на 1/2.

Функция ранжирования в Excel [ править ]

Microsoft Excel предоставляет две функции ранжирования: функцию Rank.EQ, которая присваивает рейтинги конкурентам («1224»), и функцию Rank.AVG, которая назначает дробные ранги («1 2,5 2,5 4»), как описано выше. Функции имеют аргумент порядка [4], который по умолчанию имеет значение по убыванию , т. Е. Наибольшее число будет иметь ранг 1. Это обычно необычно для статистики, где ранжирование обычно в порядке возрастания, где наименьшее число имеет ранг. ранг 1.

Сравнение рейтингов [ править ]

Ранговая корреляция может быть использована для сравнения два рейтинга для того же набор объектов. Например, коэффициент ранговой корреляции Спирмена полезен для измерения статистической зависимости между рейтингами спортсменов в двух турнирах. А коэффициент ранговой корреляции Кендалла другой подход. В качестве альтернативы подходы, основанные на пересечении / наложении, предлагают дополнительную гибкость. Одним из примеров является подход «гипергеометрическое перекрытие рангов и рангов» [5], который разработан для сравнения ранжирования генов, находящихся на «вершине» двух упорядоченных списков дифференциально экспрессируемых генов. Похожий подход используется в «Перекрытии смещения рангов (RBO)», [6]который также реализует регулируемую вероятность p для настройки веса, назначаемого на желаемой глубине ранжирования. Эти подходы имеют преимущества обращения с непересекающимися наборами , наборами разного размера и верхним весом (с учетом абсолютного ранжирования, которое можно игнорировать в стандартных подходах с невзвешенной ранговой корреляцией).

Рейтинг и социально-экономическая оценка [ править ]

Методология ранжирования, основанная на некоторых конкретных индексах, является одной из наиболее распространенных систем, используемых политиками и международными организациями для оценки социально-экономического контекста стран. Вот несколько ярких примеров: Индекс человеческого развития (ООН), Индекс ведения бизнеса (Всемирный банк), Индекс восприятия коррупции (Transparency International) и Индекс экономической свободы (Фонд наследия). Например, Индикатор «Ведение бизнеса» Всемирного банка измеряет правила ведения бизнеса и их соблюдение в 190 странах. Страны ранжируются по 10 показателям, которые синтезируются для получения окончательного рейтинга. Каждый индикатор состоит из подиндикаторов; например, индикатор регистрации собственности состоит из 4 субпоказателей, измеряющих время, процедуры, затраты и качество системы регистрации земли.Очевидно, что такие ранги основаны на субъективных критериях присвоения баллов. Иногда принятые параметры могут приводить к несоответствиям с эмпирическими наблюдениями, поэтому при применении этих критериев могут возникнуть потенциальные ошибки и парадокс.[7]

Рейтинг как социальная игра [ править ]

Соревнование - это сама природа человека. Желание достичь более высокого социального статуса может восприниматься как движущая сила человека. Проще говоря, мы хотим знать, кто самый богатый, самый умный, самый красивый или самый красивый. Иногда нас также оценивают другие: наши руководители, наши соседи, и мы сравниваем наш статус в обществе с положением других. Неизбежный вопрос: насколько объективны или субъективны эти рейтинги? Многие ранжированные списки основаны на субъективной категоризации. Мы даже можем задать вопрос: всегда ли мы хотим, чтобы нас видели объективно, или, скорее, не против иметь лучший имидж, чем мы того заслуживаем? Конечно, есть определенные трудности в измерении общества.Чтобы найти свое место в реальных и виртуальных сообществах, нам необходимо понимать проблемы, возникающие при переходе между объективностью и субъективностью путем объединения человеческого и искусственного интеллекта. Набор предметов для рассмотрения этой темы включает сравнение, ранжирование, рейтинг, выбор, законы, рейтинговые игры, борьбу за репутацию и т. Д. (См. Péter Érdi).[8]


1.   [i] Эрди, Петер «Рейтинг - неписаные правила социальной игры, в которую мы все играем», Oxford University Press (2020), ISBN  978-0-19-093546-7

Примеры ранжирования [ править ]

  • В политике рейтинги сосредоточены на сравнении экономических, социальных, экологических и управленческих показателей стран, см. Список международных рейтингов .
  • Во многих видах спорта отдельные лица или команды получают рейтинг, как правило, руководящим органом спорта .
    • В футболе (футбол), сборные ранжируются в FIFA World Rankings , то Женской мировом рейтинге и, неофициально, в World Football Elo Ratings .
    • На Олимпийских играх каждая страна-член ( НОК ) оценивается на основе количества золотых, серебряных и бронзовых медалей в рейтинге олимпийских медалей .
    • В баскетболе , сборные ранжируются в ФИБА мировом рейтинге и в Женской мировом рейтинге .
    • В бейсболе и софтболе национальные команды входят в мировой рейтинг WBSC .
    • По хоккею с шайбой национальные сборные входят в Мировой рейтинг ИИХФ .
    • В гольфе лучшие мужчины-гольфисты оцениваются с использованием Официального мирового рейтинга гольфа , а лучшие женщины-гольфисты оцениваются с использованием Всемирного рейтинга женского гольфа .
    • В снукере игроки ранжируются на основе мировых рейтингов снукера .
    • В теннисе , мужские и женские игроки ранжируются с помощью ATP Rankings и WTA рейтинга соответственно, в то время как рейтинг ITF используется для национальных Кубка Дэвиса и Кубок Федерации команд.
    • В шоссейных велосипедных гонках мужчины-велосипедисты ранжируются с использованием Мирового рейтинга UCI с 2016 года, ранее они оценивались с использованием Мирового рейтинга UCI Road с 1984 по 2004 год. Женщины-велосипедисты составлялись с использованием Мирового рейтинга женских шоссейных гонок UCI с 1994 года.
    • В трековом велоспорте гонщики и страны оцениваются с использованием мирового рейтинга UCI Track Cycling.
    • В шахматах игроки ранжируются с использованием Мирового рейтинга ФИДЕ .
    • В парусном спорте лодки оцениваются напрямую с использованием суммы рейтинга.
    • В мостике , Matchpoint скоринг использует дробный рейтинг присвоить балл.
  • Что касается кредитоспособности , рейтинг ценной бумаги относится к тому, где эта конкретная ценная бумага будет стоять в результате ликвидации компании-эмитента, то есть ее старшинству в структуре капитала компании . Например, векселя - это субординированные ценные бумаги; в случае ликвидации они окажутся позади старшего долга. Другими словами, держатели основного долга будут выплачены до того, как держатели субординированного долга получат какие-либо средства.
  • Поисковые системы ранжируют веб-страницы по их ожидаемой релевантности запросу пользователя, используя комбинацию методов, зависящих от запроса и независимых от него. Независимые от запросов методы пытаются измерить оценочную важность страницы, независимо от того, насколько хорошо она соответствует конкретному запросу. Ранжирование, не зависящее от запросов, обычно основывается на анализе ссылок; Примеры включают алгоритм HITS , PageRank и TrustRank . Методы, зависящие от запроса, пытаются измерить степень соответствия страницы определенному запросу независимо от важности страницы. Ранжирование в зависимости от запроса обычно основывается на эвристике.которые учитывают количество и расположение совпадений различных слов запроса на самой странице, в URL-адресе или в любом тексте привязки, относящемся к странице.
  • В Webometrics можно ранжировать учреждения в соответствии с их присутствием в сети (количество веб-страниц) и влиянием этого контента (внешние ссылки = цитирование сайтов), например, рейтинг Webometrics Ranking of World Universities.
  • В видеоиграх игрокам может быть присвоен рейтинг. Для того, чтобы « рангом до », чтобы достичь более высокого ранжирования по отношению к другим игрокам, особенно со стратегиями , которые не зависят от мастерства игрока.
  • Система ранжирования TrueSkill - это система ранжирования на основе навыков для Xbox Live, разработанная в Microsoft Research.
  • Bibliogram занимает общие фразы существительного в части текста.
  • На языке - статус элемента (обычно посредством так называемого «понижения» или «смещения ранга») по отношению к самому верхнему рангу в предложении; например, в предложении «Я хочу съесть торт, который вы испекли сегодня», «съесть» стоит на самом верхнем уровне, но «сделанный» понижается в рейтинге как часть номинальной группы «торт, который вы испекли сегодня»; эта номинальная группа ведет себя так, как если бы это было одно существительное (т. е. я хочу съесть это ), и поэтому глагол в ней («сделал») оценивается иначе, чем «есть».
  • Академические журналы иногда ранжируются по импакт-фактору ; количество более поздних статей, в которых цитируются статьи в данном журнале.

См. Также [ править ]

  • Таблица рейтингов
  • Порядковые данные
  • Рейтинг (значения)

Ссылки [ править ]

  1. ^ http://www.merriam-webster.com/dictionary/ranking
  2. ^ Малара, Збигнев; Мишко, Рафал; Сулич, Адам. «Карьерный путь выпускников Вроцлавского технологического университета» . Цитировать журнал требует |journal=( помощь )
  3. ^ Сулич, Адам. «Рынок труда молодежи и кризис интеграции в Евросоюз» . Архивировано 4 марта 2017 года . Проверено 4 марта 2017 .
  4. ^ «Справка Excel RANK.AVG» . Офисная поддержка . Microsoft . Проверено 21 января 2021 года .
  5. ^ Plaisier, Seema B .; Ташеро, Ричард; Вонг, Джастин А .; Грэбер, Томас Г. (сентябрь 2010 г.). «Ранг-ранг гипергеометрического перекрытия: идентификация статистически значимого перекрытия между сигнатурами экспрессии генов» . Исследования нуклеиновых кислот . 38 (17): e169. DOI : 10.1093 / NAR / gkq636 . PMC 2943622 . PMID 20660011 .  
  6. ^ Уэббер, Уильям; Моффат, Алистер; Зобель, Джастин (ноябрь 2010 г.). «Мера сходства для неопределенных рейтингов». ACM-транзакции в информационных системах . 28 (4). DOI : 10.1145 / 1852102.1852106 .
  7. ^ RIEDS, Итальянский обзор экономики, демографии и статистики. «Проект Всемирного банка Doing Business и статистические методы на основе рангов: парадокс временного индикатора» . Цитировать журнал требует |journal=( помощь )
  8. ^ Эрди, Петер. Рейтинг: неписаные правила социальной игры, в которую мы все играем . Нью-Йорк, штат Нью-Йорк, США. ISBN 978-0-19-093546-7. OCLC  1102469441 .

Внешние ссылки [ править ]

  • RANKNUM, функция Matlab для вычисления пяти типов рангов
  • Matlab Toolbox с функциями для вычисления рангов
  • Система рейтинга TrueSkill
  • Библиотека рейтинга, написанная на Ruby
  • Список индексов и рейтингов глобального развития