Из Википедии, бесплатной энциклопедии
  (Перенаправлено из Lincoln Index )
Перейти к навигации Перейти к поиску

Индекс Линкольна - это статистическая мера, используемая в нескольких областях для оценки количества случаев, которые еще не наблюдались, на основе двух независимых наборов наблюдаемых случаев. Описанный Фредериком Чарльзом Линкольном в 1930 году, он также иногда известен как метод Линкольна-Петерсена в честь К.Г. Йоханнеса Петерсена, который первым применил связанный метод метки и повторной поимки . [1]

Приложения [ править ]

Рассмотрим двух наблюдателей, которые по отдельности подсчитывают разные виды растений или животных в данной местности. Если каждый из них возвращается, обнаружив 100 видов, но оба наблюдателя обнаруживают только 5 определенных видов , то каждый наблюдатель явно пропустил по крайней мере 95 видов (то есть 95, которые нашел только другой наблюдатель). Таким образом, мы знаем, что оба наблюдателя многое упускают. С другой стороны, если бы 99 из 100 видов, обнаруженных каждым наблюдателем, были обнаружены обоими, справедливо ожидать, что они обнаружили гораздо более высокий процент от общего числа видов, которые можно было найти.

То же самое относится к метке и повторной поимке . Если некоторые животные в данном районе пойманы и помечены, а затем проводится второй раунд отловов: количество отмеченных животных, обнаруженных во втором раунде, можно использовать для оценки общей популяции. [2]

Другой пример возникает в компьютерной лингвистике для оценки общего словарного запаса языка. Учитывая две независимые выборки, совпадение их словарей позволяет получить полезную оценку того, сколько еще словарных единиц существует, но не оказалось ни в одной из выборок. Аналогичный пример включает оценку количества опечаток, оставшихся в тексте, по подсчетам двух корректоров.

Формулировка [ править ]

Индекс Линкольна формализует это явление. Если E1 и E2 - это количество видов (или слов, или других явлений), наблюдаемых двумя независимыми методами, а S - количество общих наблюдений, то индекс Линкольна просто

Для значений S <10 эта оценка является приблизительной и становится чрезвычайно приблизительной для значений S <5. В случае, когда S = 0 (то есть вообще отсутствует перекрытие), индекс Линкольна формально не определен. Это может возникнуть, если наблюдатели находят лишь небольшой процент реальных видов (возможно, недостаточно внимательно или долго не присматриваясь), если наблюдатели используют методы, которые не являются статистически независимыми (например, если они ищут только крупных существ и другие только для маленьких) или в других обстоятельствах.

Ограничения [ править ]

Индекс Линкольна - это всего лишь оценка. Например, виды в данном районе могут быть либо очень обычными, либо очень редкими, либо их очень трудно или очень легко увидеть. [3] Тогда было бы вероятно, что оба наблюдателя найдут большую долю общих видов, и что оба наблюдателя упустят большую долю редких видов. Такое распределение нарушит последующую оценку. Однако такое распределение необычно для природных явлений, как предполагает закон Ципфа ).

TJ Gaskell и BJ George предлагают усовершенствовать индекс Линкольна, который, как утверждается, снижает предвзятость. [4]

См. Также [ править ]

Дальнейшее чтение [ править ]

  • Линкольн, Фредерик С. (май 1930). Расчет численности водоплавающих птиц на основе доходности кольцевания . Круговой. 118 . Вашингтон, округ Колумбия: Министерство сельского хозяйства США . Проверено 21 мая 2013 года . CS1 maint: обескураженный параметр ( ссылка )
  • Петерсен, CGJ (1896). «Ежегодная иммиграция молодых камбал в Лимфьорд из Немецкого моря», Отчет Датской биологической станции (1895 г.) , 6, 5–84.
  • Т.Дж. Гаскелл; Би Джей Джордж (1972). «Байесовская модификация индекса Линкольна». Журнал прикладной экологии . 9 (2): 377–384. DOI : 10.2307 / 2402438 .

Заметки [ править ]

  1. ^ Саутвуд, TRE и Хендерсон, П. (2000) Экологические методы , 3-е изд. Blackwell Science, Оксфорд.
  2. ^ "Оценка размеров населения методами выборки меток-повторной поимки и удаления" . Техасский университет.
  3. Т. Болин; Б. Сандстрем (1977). «Влияние неравной уловистости на оценки популяции с использованием модели Линкольна и метода удаления, применяемого к электро-ловле рыбы». OIKOS (28): 123–129. JSTOR 3543331 . 
  4. ^ Гаскелл и Джордж (1972)