Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Индекс Тейла - это статистический показатель, который в основном используется для измерения экономического неравенства [1] и других экономических явлений, хотя он также использовался для измерения расовой сегрегации. [2] [3]

Индекс Тейла T T аналогичен избыточности в теории информации, которая представляет собой максимально возможную энтропию данных за вычетом наблюдаемой энтропии. Это частный случай обобщенного индекса энтропии . Его можно рассматривать как меру избыточности, отсутствия разнообразия, изоляции, сегрегации, неравенства, неслучайности и сжимаемости. Он был предложен эконометчиком Анри Тейлом из Университета Эразма в Роттердаме . [3]

Формула [ править ]

Для популяции из N «агентов», каждый с характеристикой x , ситуация может быть представлена ​​списком x i ( i  = 1, ..., N ), где x i - характеристика агента i . Например, если характеристика - доход, то x i - доход агента i .

Индекс Тейла T определяется как [4]

а индекс Тейла L определяется как [4]


где средний доход:

Формула Тейла L представляет собой логарифм среднего геометрического отношения: (средний доход) / (доход i) по всем доходам, включенным в суммирование. ... очевидно, актуальный факт для любого диапазона доходов по одну сторону от среднего дохода. .

... показывая, что эта форма Тейла имеет очевидное, интуитивно понятное, правдоподобное и естественное обоснование, а не только с точки зрения энтропии. .

Поскольку перевод от большего дохода к меньшему изменит коэффициент меньшего дохода больше, чем он изменит коэффициент большего дохода, этот индекс удовлетворяет принципу перевода.

Конечно, при желании весовой коэффициент, такой как (средний доход) / (доход i), может быть включен в условия суммирования (как в приведенной выше формуле Тейла-Т, с инвертированными отношениями доходов), чтобы взвесить индекс в пользу более строгого учета изменений в коэффициентах доходов, в которых доход i отличается от среднего дохода на больший коэффициент.

В Тейле Т каждый логарифм отношения доходов взвешивается коэффициентом, равным собственному значению этого отношения доходов. Итак, если коэффициент дохода равен 2, то на значение индекса влияет, как если бы таких людей было двое. ... разумное взвешивание, если значение каждого коэффициента дохода оценивается как пропорциональное его собственному значению ... коэффициент, на который конкретный доход отличается от среднего дохода.


Эквивалентно, если ситуация характеризуется дискретной функцией распределения f k ( k  = 0, ..., W ), где f k - доля населения с доходом k, а W = - общий доход, тогда и коэффициент Тейла индекс:

где снова средний доход:

Обратите внимание, что в этом случае доход k является целым числом, а k = 1 представляет наименьшее возможное приращение дохода (например, центов).

если ситуация характеризуется непрерывной функцией распределения f ( k ) (поддерживаемой от 0 до бесконечности), где f ( kdk - доля населения с доходом от k до k  +  dk , то индекс Тейла равен:

где среднее значение:

Индексы Тейла для некоторых распространенных непрерывных распределений вероятностей приведены в таблице ниже:

Если у всех одинаковый доход, то T T равно 0. Если один человек имеет весь доход, то T T дает результат , который является максимальным неравенством. Деление T T на может нормализовать уравнение в диапазоне от 0 до 1, но тогда аксиома независимости нарушается: и не квалифицируется как мера неравенства.

Индекс Тейла измеряет энтропийное «расстояние» между населением и эгалитарным государством с одинаковым доходом. Численный результат выражается в отрицательной энтропии, так что большее число указывает на больший порядок, который дальше от полного равенства. Формулировка индекса для представления отрицательной энтропии вместо энтропии позволяет ему быть мерой неравенства, а не равенства.

Связь с индексом Аткинсона [ править ]

Индекс Тейла можно преобразовать в индекс Аткинсона , который имеет диапазон от 0 до 1 (от 0% до 100%), где 0 указывает на полное равенство, а 1 (100%) указывает на максимальное неравенство. (См. Преобразование в Обобщенном индексе энтропии .)

Вывод из энтропии [ править ]

Индекс Тейла выводится из меры информационной энтропии Шеннона , где энтропия - это мера случайности в заданном наборе информации. В теории информации, физике и индексе Тейла общий вид энтропии имеет вид

куда
  • - это отдельный элемент из набора (например, отдельный элемент из совокупности или отдельный байт из компьютерного файла).
  • - вероятность найти из случайной выборки из множества.
  • является константой. [примечание 1]
  • это логарифм с основанием , равным . [заметка 2]

При рассмотрении распределения доходов в населении он равен отношению дохода отдельного человека к общему доходу всего населения. Это дает наблюдаемую энтропию популяции:

куда
  • доход конкретного человека.
  • общий доход всего населения, с
  • количество особей в популяции.
  • («x bar») - средний доход населения.
  • это натуральный логарифм из : .

Индекс Тейла измеряет, насколько далека наблюдаемая энтропия ( которая представляет, насколько случайным образом распределяется доход) от максимально возможной энтропии ( , [примечание 3], которая представляет доход, максимально распределяемый среди людей в популяции - распределение, аналогичное [наиболее вероятно] результат бесконечного числа случайных подбрасываний монеты: равное распределение орлов и решек). Следовательно, индекс Тейла - это разница между теоретической максимальной энтропией (которая была бы достигнута, если бы доходы каждого человека были равны) минус наблюдаемая энтропия:


Когда выражается в единицах численности населения / вида, это показатель биоразнообразия, который называется индексом Шеннона . Если индекс Тейла используется с x = популяция / вид, это мера неравенства населения среди набора видов или «биоизоляция» в отличие от «изоляции богатства».

Индекс Тейла измеряет то, что в теории информации называется избыточностью . [4] Это оставшееся «информационное пространство», которое не использовалось для передачи информации, что снижает эффективность ценового сигнала . [ оригинальное исследование? ] Индекс Тейла - это показатель избыточности дохода (или другого показателя богатства) у некоторых людей. Избыточность у одних подразумевает дефицит у других. Высокий индекс Тейла указывает на то, что общий доход неравномерно распределяется между людьми, так же как несжатый текстовый файл не имеет аналогичного количества байтовых ячеек, назначенных доступным уникальным байтовым символам.


Разложимость [ править ]

По данным Всемирного банка ,

"Самыми известными показателями энтропии являются T ( ) Тейла и L ( ) Тейла, которые позволяют разложить неравенство на часть, обусловленную неравенством внутри районов (например, город, сельская местность), и часть, обусловленную различиями. между районами (например, разница в доходах между городом и деревней). Обычно по крайней мере три четверти неравенства в стране обусловлено внутригрупповым неравенством, а оставшаяся четверть - межгрупповыми различиями ». [5]

Если население разделено на подгруппы и

  • доля дохода группы ,
  • это общая численность населения и численность группы ,
  • индекс Тейла для этой подгруппы,
  • средний доход в группе , и
  • средний доход населения,

то T-индекс Тейла равен

за

Например, неравенство в Соединенных Штатах - это среднее неравенство в каждом штате, взвешенное по доходу штата, плюс неравенство между штатами.

Примечание . Это изображение не является индексом Тейла для каждой области Соединенных Штатов, а представляет собой вклад в индекс Тейла для США по каждой области. Индекс Тейла всегда положительный, хотя индивидуальные вклады в индекс Тейла могут быть отрицательными или положительными.

Декомпозиция индекса Тейла, который определяет долю, приходящуюся на межрегиональный компонент, становится полезным инструментом для позитивного анализа регионального неравенства, поскольку предполагает относительную важность пространственного измерения неравенства. [6]

Тейла в T по сравнению с Theil в L [ править ]

И Т Тейла, и Тейла L разложимы. Разница между ними основана на той части распределения результатов, для которой каждый из них используется. Индексы неравенства в семействе обобщенной энтропии (GE) более чувствительны к различиям в долях доходов бедных или богатых в зависимости от параметра, определяющего индекс GE. Чем меньше значение параметра для GE, тем он более чувствителен к различиям в нижней части распределения. [7]

GE (0) = L Тейла и более чувствителен к различиям на нижнем конце распределения. Его также называют мерой среднего логарифмического отклонения .
GE (1) = Т Тейла и более чувствителен к различиям в верхней части распределения.

Разложимость - это свойство индекса Тейла, которого не предлагает более популярный коэффициент Джини . Коэффициент Джини более интуитивно понятен для многих людей, поскольку он основан на кривой Лоренца . Однако его нелегко разложить, как Тейла.

Приложения [ править ]

Помимо множества экономических приложений, индекс Тейла применялся для оценки производительности ирригационных систем [8] и распределения показателей программного обеспечения . [9]


См. Также [ править ]

  • Обобщенный индекс энтропии
  • Индекс Аткинсона
  • Коэффициент Джини
  • Индекс Гувера
  • Показатели неравенства доходов
  • Индекс костюмов
  • Конденсация богатства
  • Индекс разнообразия

Заметки [ править ]

  1. ^ Когда это уравнение используется в физике,обычно представляет собой постоянную Больцмана . В теории информации или статистикеобычно равно 1 (например, в индексе Тейла).
  2. ^ В теории информации, когда информация дается в двоичных цифрах, используется двоичный логарифм (равный 2). В физике, а также при вычислении индекса Тейла используется натуральный логарифм (равный e ).
  3. ^ Когда доход каждого человека равен среднему доходу,

Ссылки [ править ]

  1. ^ Введение в индекс Тейла от Техасского университета
  2. ^ «Меры по разделению» . www.urban.org . Городской институт . Проверено 5 февраля 2018 .
  3. ^ a b Паркер, Лорен (20 июля 2015 г.). «Расовая и этническая сегрегация: в новостях и на карте политики» . PolicyMap . Проверено 5 февраля 2018 .
  4. ^ a b c http://www.poorcity.richcity.org (Меры избыточности, энтропии и неравенства)
  5. ^ «6. Меры неравенства». Руководство по бедности (pdf) . Всемирный банк . 8 августа 2005 г. с. 95 . Проверено 4 февраля 2018 года .
  6. Перейти ↑ Novotny, J. (2007). «Об измерении регионального неравенства: имеет ли значение пространственное измерение неравенства доходов?» (PDF) . Летопись краеведения . 41 (3): 563–580.
  7. ^ «Меры неравенства» . www.urban.org . Городской институт . Проверено 5 февраля 2018 .
  8. ^ Раджан К. Сампатх. Меры справедливости для оценки эффективности орошения. Уотер Интернэшнл, 13 (1), 1988.
  9. ^ А. Серебреник, М. ван ден Бранд. Индекс Тейла для агрегирования значений показателей программного обеспечения. 26-я Международная конференция IEEE по сопровождению программного обеспечения. Компьютерное общество IEEE.

Внешние ссылки [ править ]

  • Программного обеспечения:
    • Бесплатный онлайн-калькулятор вычисляет коэффициент Джини, строит кривую Лоренца и вычисляет многие другие меры концентрации для любого набора данных.
    • Бесплатный калькулятор: онлайн и загружаемые скрипты ( Python и Lua ) для неравенств Аткинсона, Джини и Гувера
    • Пользователи программного обеспечения для анализа данных R могут установить пакет "ineq", который позволяет вычислять различные индексы неравенства, включая показатели Джини, Аткинсона, Тейла.
    • Пакет MATLAB Inequality Package , включающий код для вычисления индексов Джини, Аткинсона, Тейла и построения кривой Лоренца. Доступно множество примеров.