| Эта статья требует дополнительных ссылок для проверки . Пожалуйста, помогите улучшить эту статью , добавив цитаты из надежных источников . Материал, не полученный от источника, может быть оспорен и удален. Найти источники: «Индекс несходства» - новости · газеты · книги · ученый · JSTOR ( июль 2018 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) |
Индекс несходства является демографическим показателем ровности , с которой две групп распределены по компонентным географическим районам , которые составляют большую площадь. Показатель индекса также можно интерпретировать как процент одной из двух групп, включенных в расчет, которой пришлось бы переместиться в разные географические области, чтобы получить распределение, соответствующее распределению в большей области. Индекс несходства может использоваться как мера сегрегации.
Основная формула [ править ]
Основная формула индекса несходства:
где (например, сравнивая черно-белое население):
- a i = население группы A в i- м районе, например, переписной участок
- A = общая численность населения в группе A в крупном географическом объекте, для которого рассчитывается индекс несходства.
- b i = население группы B в i- м районе
- B = общая численность населения в группе B в крупном географическом объекте, для которого рассчитывается индекс несходства.
Индекс несходства применим к любой категориальной переменной (демографической или нет) и благодаря своим простым свойствам полезен для ввода в программы многомерного масштабирования и кластеризации. Он широко использовался при изучении социальной мобильности для сравнения распределения профессиональных категорий происхождения (или назначения).
Перспектива линейной алгебры [ править ]
Формулу индекса несходства можно сделать гораздо более компактной и содержательной, если рассматривать ее с точки зрения линейной алгебры . Предположим, мы изучаем распределение богатых и бедных в городе (например, в Лондоне ). Допустим, в нашем городе есть кварталы:
Создадим вектор, показывающий количество богатых людей в каждом квартале нашего города:
Точно так же давайте создадим вектор, который показывает количество бедных в каждом квартале нашего города:
Теперь -норма вектора - это просто сумма (величина) каждой записи в этом векторе. [1] То есть для вектора у нас есть -норма:
Если мы обозначим как общее количество богатых людей в нашем городе, то компактным способом вычисления будет использование -norm:
Точно так же, если обозначить как общее количество бедных в нашем городе, то:
Когда мы делим вектор на его норму, мы получаем то, что называется нормализованным вектором или единичным вектором :
Нормализуем вектор богатства и вектор бедности :
Наконец, вернемся к формуле для индекса несходства ( ); он просто равен половине нормы разницы между векторами и :
Индекс несходства (в линейной алгебраической записи)
Числовой пример [ править ]
Рассмотрим город, состоящий из четырех кварталов по 2 человека в каждом. Один блок состоит из 2-х богатых людей. Один блок состоит из 2 бедных людей. Два блока состоят из 1 богатого и 1 бедного человека. Каков показатель непохожести этого города?
В нашем вымышленном городе 4 квартала: в одном - 2 богатых человека; в другом - 2 бедных человека; и два блока, содержащие 1 богатого и 1 бедного человека.
Во-первых, давайте найдем богатый вектор и плохой вектор :
Далее посчитаем общее количество богатых и бедных в нашем городе:
Затем давайте нормализуем богатые и бедные векторы:
Теперь мы можем вычислить разницу :
Наконец, найдем индекс несходства ( ):
Эквивалентность формул [ править ]
Мы можем доказать, что линейная алгебраическая формула для идентична основной формуле для . Начнем с формулы линейной алгебры:
Заменим нормализованные векторы и на:
Наконец, из определения -нормы мы знаем, что можем заменить ее суммированием:
Таким образом, мы доказываем, что формула линейной алгебры для индекса несходства эквивалентна основной формуле для него:
Нулевая сегрегация [ править ]
Когда индекс несходства равен нулю, это означает, что в изучаемом нами сообществе отсутствует сегрегация. Например, если мы изучаем сегрегацию богатых и бедных людей в городе, то если это означает, что:
- В городе нет кварталов, которые были бы «богатыми кварталами», и в городе нет кварталов, которые были бы «бедными кварталами».
- Богатые и бедные люди равномерно распределены по всему городу.
Если мы зададим линейную алгебраическую формулу, мы получим необходимое условие для нулевой сегрегации:
Например, предположим, что у вас есть город с двумя кварталами. В каждом блоке 4 богатых и 100 бедных:
Тогда общее количество богатых людей равно , а общее количество бедных людей равно . Таким образом:
Потому что , таким образом, в этом городе отсутствует сегрегация.
В качестве другого примера предположим, что у вас есть город из 3 кварталов:
Значит, в нашем городе есть богатые люди и бедные. Таким образом:
Опять же, потому что , таким образом, в этом городе также отсутствует сегрегация.
Внешние ссылки [ править ]