Проблема Гальтона , названная в честь сэра Фрэнсиса Гальтона , - это проблема вывода выводов из межкультурных данных из-за статистического явления, которое теперь называется автокорреляцией . В настоящее время эта проблема признана общей и применимой ко всем неэкспериментальным исследованиям, а также к планированию экспериментов . Это проще всего описать как проблему внешних зависимостей при проведении статистических оценок, когда выбранные элементы не являются статистически независимыми . Например, если спросить двух человек в одном доме, смотрят ли они телевизор, это не даст вам статистически независимых ответов. Объем выборки, n, для независимых наблюдений в этом случае будет один, а не два. После внесения надлежащих корректировок, касающихся внешних зависимостей, будут применяться аксиомы теории вероятностей, касающиеся статистической независимости. Эти аксиомы важны , например, для получения показателей дисперсии или критериев статистической значимости .
Источник
В 1888 году Гальтон присутствовал, когда сэр Эдвард Тайлор представил доклад в Королевском антропологическом институте. Тайлор собрал информацию об институтах брака и происхождения для 350 культур и изучил корреляции между этими институтами и мерами социальной сложности. Тайлор интерпретировал свои результаты как указание на общую эволюционную последовательность, в которой институты меняют фокус с материнской линии на отцовскую по мере того, как общества становятся все более сложными. Гальтон не согласился, указав, что сходство между культурами могло быть связано с заимствованием, могло быть связано с общим происхождением или могло быть связано с эволюционным развитием; он утверждал, что без учета заимствований и общего происхождения нельзя делать достоверные выводы относительно эволюционного развития. Критика Гальтона стала одноименной проблемой Гальтона , [1] : 175 , как с именем , Раулем Наролл , [2] [3] , который предложил первые статистические решения.
К началу 20-го века однолинейный эволюционизм был оставлен, и вместе с ним пришлось отказаться от прямых выводов из корреляций с эволюционными последовательностями. Однако критика Гальтона оказалась столь же верной для вывода функциональных отношений из корреляций. Проблема автокорреляции осталась.
Решения
Статистик Уильям С. Госсет в 1914 году разработал методы устранения ложной корреляции из-за того, как положение во времени или пространстве влияет на сходство. Сегодняшние избирательные опросы имеют аналогичную проблему: чем ближе опрос к выборам, тем меньше людей принимают самостоятельные решения и тем выше ненадежность результатов опроса, особенно допустимая погрешность или доверительный интервал . Эффективная п из независимых случаев от их образца падает выборы приближаются. Статистическая значимость падает с меньшим эффективным размером выборки.
Проблема возникает в выборочных опросах, когда социологи хотят сократить время в пути, чтобы провести интервью, и поэтому они делят свою популяцию на локальные кластеры и выбирают кластеры случайным образом, а затем снова выбирают внутри кластеров. Если они опрашивают n человек в кластерах размером m, эффективный размер выборки (efs) будет иметь нижний предел 1 + ( n - 1) / m, если все в каждом кластере идентичны. Когда есть только частичное сходство внутри кластеров, m в этой формуле необходимо соответственно уменьшить. Формула такого типа - 1 + d ( n - 1), где d - внутриклассовая корреляция для рассматриваемой статистики. [4] В общем, оценка соответствующих коэффициентов полезного действия зависит от оцененных статистических данных , таких как, например, среднее значение , хи-квадрат , корреляция , коэффициент регрессии и их дисперсии .
Для кросс-культурных исследований , Мердок и Уайта [5] оценили размер пятна сходства в их выборке из 186 обществ. Четыре проверенные переменные - язык, экономика, политическая интеграция и происхождение - имели участки сходства, которые варьировались от третьего до десятого размера. Очень грубое практическое правило может заключаться в том, чтобы разделить квадратный корень из размеров фрагментов сходства на n , чтобы эффективные размеры выборки для этих фрагментов составили 58 и 107 соответственно. Опять же, статистическая значимость падает с меньшим эффективным размером выборки.
В современном анализе пространственные лаги были смоделированы для оценки степени глобализации современных обществ. [6]
Пространственная зависимость или автокорреляция - фундаментальное понятие в географии. Методы, разработанные географами, которые измеряют и контролируют пространственную автокорреляцию [7] [8], делают гораздо больше, чем просто уменьшают эффективное n для проверки значимости корреляции. Одним из примеров является сложная гипотеза о том, что «присутствие азартных игр в обществе прямо пропорционально наличию коммерческих денег и наличию значительных социально-экономических различий и обратно пропорционально тому, является ли общество кочевым пастушеским обществом». [9] Проверки этой гипотезы на выборке из 60 обществ не смогли отвергнуть нулевую гипотезу. Однако автокорреляционный анализ показал значительный эффект социально-экономических различий. [10]
Насколько распространена автокорреляция между переменными, изучаемыми в кросс-культурных исследованиях? Тест Anthon Eff на 1700 переменных в совокупной базе данных для Standard Cross-Cultural Sample , опубликованной в World Cultures , позволил измерить I Морана для пространственной автокорреляции (расстояние), лингвистической автокорреляции (общее происхождение) и автокорреляции в культурной сложности (основная эволюция). ). «Результаты показывают, что ... было бы разумно проверить пространственную и филогенетическую автокорреляцию при проведении регрессионного анализа со стандартной межкультурной выборкой». [11] Использование тестов автокорреляции в исследовательском анализе данных проиллюстрировано, показывая, как все переменные в данном исследовании могут быть оценены на предмет независимости случаев с точки зрения расстояния, языка и культурной сложности. Затем объясняются и проиллюстрированы методы оценки этих эффектов автокорреляции для обычной регрессии методом наименьших квадратов с использованием снова меры значимости автокорреляции Морана I.
Когда присутствует автокорреляция, ее часто можно удалить, чтобы получить несмещенные оценки коэффициентов регрессии и их дисперсий, построив повторно заданную зависимую переменную, которая "отстает" от весовых коэффициентов зависимой переменной в других местах, где веса являются степенью взаимосвязи. Эта зависимая переменная с запаздыванием является эндогенной, и для оценки требуются либо двухэтапные методы наименьших квадратов, либо методы максимального правдоподобия . [12]
Ресурсы
Публичный сервер, если он используется извне по адресу http://SocSciCompute.ss.uci.edu , предлагает этнографические данные, переменные и инструменты для вывода со сценариями R от Dow (2007) и Eff and Dow (2009) в поддерживаемых NSF Galaxy ( http://getgalaxy.org ) ( https://www.xsede.org ) для преподавателей, студентов и исследователей для моделирования кросс-культурного исследования "Галактика CoSSci" с элементами управления для проблемы Гальтона с использованием переменных Стандартной кросс-культурной выборки на https://web.archive.org/web/20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook.txt .
Возможности
В антропологии, где проблема Тайлора была впервые признана статистиком Гальтоном в 1889 году, до сих пор не широко признано, что существуют стандартные статистические поправки для проблемы пятен сходства в наблюдаемых случаях и возможности для новых открытий с использованием методов автокорреляции. Некоторые межкультурные исследователи (см., Например, Korotayev and de Munck 2003) [13] начали понимать, что свидетельства распространения, исторического происхождения и других источников сходства между родственными обществами или отдельными людьми следует переименовывать скорее в «Возможности Гальтона» и «Актив Гальтона». чем проблема Гальтона. В настоящее время исследователи регулярно используют анализ продольных, межкультурных и региональных вариаций для анализа всех конкурирующих гипотез: функциональных взаимосвязей, распространения , общего исторического происхождения, полилинейной эволюции , совместной адаптации с окружающей средой и сложной динамики социального взаимодействия . [14]
Споры
В антропологии проблема Гальтона часто используется как повод для полного отказа от сравнительных исследований. Поскольку проблема носит общий характер, присуща наукам и статистическим выводам в целом, эта конкретная критика кросс-культурных или сравнительных исследований - а их много - с логической точки зрения равносильно отрицанию науки и статистики в целом. Любые данные, собранные и проанализированные, например, этнографами, в равной степени подвержены проблеме Гальтона, понимаемой в самом общем смысле. Критика антисравнительной критики не ограничивается статистическим сравнением, поскольку она применима также и к анализу текста. То есть анализ и использование текста в аргументации подлежат критике с точки зрения доказательной основы вывода. Опора исключительно на риторику не защищает от критики в отношении обоснованности аргумента и его доказательной базы.
Однако нет никаких сомнений в том, что сообщество кросс-культурных исследователей упустило игнорирование проблемы Гальтона. Экспертное исследование этого вопроса показывает результаты, которые «убедительно свидетельствуют о том, что обширное сообщение о наивных тестах независимости хи-квадрат с использованием наборов кросс-культурных данных за последние несколько десятилетий привело к неправильному отклонению нулевых гипотез на уровнях, намного превышающих ожидаемые 5% показатель." [15] : 247 Исследователь заключает, что «неверные теории, которые были« спасены »с помощью наивных тестов хи-квадрат со сравнительными данными, могут быть еще более тщательно проверены в другой день». [15] : 270 И снова скорректированная дисперсия кластерной выборки дается как единица, умноженная на 1 + d ( k + 1), где k - средний размер кластера, а для дисперсии корреляции таблицы непредвиденных обстоятельств с r строками и c столбцами. С тех пор, как в 1993 году была опубликована эта критика и другие подобные, все больше авторов начали принимать поправки к проблеме Гальтона, но большинство в кросс-культурной области этого не сделали. Следовательно, большая часть опубликованных результатов, которые основаны на наивных тестах значимости и которые принимают стандарт P <0,05, а не стандарт P <0,005, вероятно, будут ошибочными, потому что они более подвержены ошибке типа I , которая должна отвергать нулевое значение. гипотеза, когда она верна.
Некоторые межкультурные исследователи отвергают серьезность проблемы Гальтона, поскольку, по их мнению, оценки корреляций и средних значений могут быть несмещенными, даже если присутствует автокорреляция, слабая или сильная. Однако, не исследуя автокорреляцию, они все равно могут неверно оценить статистику, касающуюся взаимосвязей между переменными. В регрессионном анализе , например, изучение моделей автокоррелированных остатков может дать важные ключи к разгадке третьих факторов, которые могут повлиять на отношения между переменными, но которые не были включены в регрессионную модель. Во-вторых, если в выборке есть группы похожих и родственных обществ, показатели дисперсии будут недооценены, что приведет к ложным статистическим выводам. например, преувеличение статистической значимости корреляций. В-третьих, недооценка дисперсии затрудняет проверку репликации результатов из двух разных выборок, поскольку результаты будут чаще отвергаться как схожие.
Смотрите также
- Список культур в стандартном кросс-культурном образце
Рекомендации
- Перейти ↑ Stocking, George W. Jr. (1968). «Эдвард Бернетт Тайлор». Международная энциклопедия социальных наук. Дэвид Л. Силлс, редактор, Нью-Йорк, Mcmillan Company: v.16, pp. 170–177.
- ^ Рауль Наролл (1961). «Два решения проблемы Гальтона». Философия науки . 28 : 15–29. DOI : 10.1086 / 287778 .
- ^ Рауль Нароль (1965). «Проблема Гальтона: логика кросс-культурных исследований». Социальные исследования . 32 : 428–451.
- ^ «Размер образца и эффект дизайна» (PDF) . Архивировано из оригинального (PDF) 14 апреля 2006 года . Проверено 1 ноября 2006 .
- ^ Джордж П. Мердок и Дуглас Р. Уайт (1969). «Стандартный кросс-культурный образец» . Этнология . 9 : 329–369.
- ^ Ян, Детлеф (2006). «Глобализация как проблема Гальтона : недостающее звено в анализе моделей распространения в развитии государства всеобщего благосостояния» (PDF) . Международная организация . 60 (2): 401–431. DOI : 10.1017 / s0020818306060127 . абстрактный
- ^ Клифф, AD, и JK Ord. 1973. Пространственная автокорреляция . Лондон: Пион Пресс.
- ^ Клифф, AD и JK Ord. 1981. Пространственные процессы . Лондон: Пион Пресс.
- ^ Прайор, Фредерик (1976). "Метод возможности диффузии: более общее и простое решение проблемы Гальтона" . Американский этнолог . Американская антропологическая ассоциация. 3 (4): 731–749. DOI : 10,1525 / ae.1976.3.4.02a00100 .
- ^ Малкольм М. Доу, Майкл Л. Бертон, Дуглас Р. Уайт и Карл П. Рейц (1984). «Проблема Гальтона как автокорреляция сети» . Американский этнолог . 11 (4): 754–770. DOI : 10,1525 / ae.1984.11.4.02a00080 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Э. Энтон Эфф (2004). «Есть ли у мистера Гальтона проблема? Автокорреляция в стандартной межкультурной выборке» (PDF) . Мировые культуры . 15 (2): 153–170.
- ^ Анселин, Люк. 1988. Пространственная эконометрика: методы и модели. Дордрехт: Kluwer Academic Publishers.
- ^ Андрей Коротаев и Виктор де Мунк (2003). « Актив Гальтона и проблема цветка : культурные сети и культурные единицы в межкультурных исследованиях» . Американский антрополог . 105 (2): 353–358. DOI : 10.1525 / aa.2003.105.2.353 .
- ^ Мейс, Рут; Пагель, Марк (1994). «Сравнительный метод в антропологии». Современная антропология . 35 (5): 549–564. DOI : 10.1086 / 204317 .
- ^ а б Малкольм М. Доу (1993). «Сохранение теории: на тестах хи-квадрат с данными межкультурного опроса». Межкультурные исследования . 27 (3–4): 247–276. DOI : 10.1177 / 106939719302700305 .
дальнейшее чтение
- Доу, ММ (2007). «Проблема Гальтона как эффекты множественной сетевой автокорреляции» (PDF) . Межкультурные исследования . 41 (4): 336–363. DOI : 10.1177 / 1069397107305452 .
- Эфф, Э. Энтон и Малкольм М. Доу. 2009. «Как справиться с отсутствующими данными и проблемой Гальтона в межкультурных опросах: учебник для Р.» Структура и динамика: электронный журнал антропологических и смежных наук 3 (3): 223–252. https://escholarship.org/uc/item/7cm1f10b
- Озтан, Б. Толга. 2016. Эволюция сотрудничества: сравнительное исследование родственного поведения. Кандидатская диссертация, Калифорнийский университет в Ирвине. Математические поведенческие науки. http://intersci.ss.uci.edu/wiki/pdf/latest/thesisJan2Tolga2015.pdf (подробное описание решения Доу – Эфф для проблемы Гальтона).
- IntersciWiki. 2007. Использование автокорреляции в спецификации модели (включая программное обеспечение и учебник).
- IntersciWiki. 2009. Проблема Гальтона и автокорреляция (библиография).
- Студент (WS Gosset) (1914). «Устранение ложной корреляции из-за положения во времени или пространстве» . Биометрика . 10 (1): 179–181. DOI : 10.2307 / 2331746 . JSTOR 2331746 .
- Тайлор, Эдвард Э. (1889). «О методе исследования развития институтов, применяемых к законам о браке и родстве». Журнал Королевского антропологического института . 18 (3): 245–72. DOI : 10.2307 / 2842423 . hdl : 2027 / hvd.32044097779680 . JSTOR 2842423 .
- Витковски, Стэнли (1974). «Возможности Гальтона - гологеистическое исследование исторических процессов». Исследования в области поведенческих наук . 9 (1): 11–15. DOI : 10.1177 / 106939717400900105 .