Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Полная пространственная случайность ( CSR ) описывает точечный процесс, при котором точечные события происходят в пределах данной области исследования совершенно случайным образом. Это синоним однородного пространственного пуассоновского процесса . [1] Такой процесс моделируется с использованием только одного параметра , то есть плотности точек в заданной области. Термин полная пространственная случайность обычно используется в прикладной статистике в контексте исследования определенных точечных паттернов, тогда как в большинстве других статистических контекстов он относится к концепции пространственного пуассоновского процесса. [1]

Модель [ править ]

Данные в виде набора точек, неравномерно распределенных в определенной области пространства, возникают во многих различных контекстах; Примеры включают расположение деревьев в лесу, птичьих гнезд, ядер в тканях, больных людей из группы риска. Мы называем любой такой набор данных пространственным точечным шаблоном и называем местоположения событиями, чтобы отличить их от произвольных точек рассматриваемого региона. Гипотеза полной пространственной случайности для пространственного точечного паттерна утверждает, что количество событий в любом регионе следует распределению Пуассона с заданным средним числом на однородное подразделение. События паттерна независимо и равномерно распределены в пространстве; Другими словами, события с одинаковой вероятностью произойдут где угодно и не будут взаимодействовать друг с другом.

«Равномерное» используется в смысле следования за равномерным распределением вероятностей по изучаемому региону, а не в смысле «равномерно» распределенных по изучаемому региону. [2] Между событиями нет взаимодействий, так как интенсивность событий не меняется по плоскости. Например, предположение о независимости будет нарушено, если наличие одного события либо стимулировало, либо препятствовало возникновению других событий в окрестностях.

Распространение [ править ]

Таким образом, вероятность найти именно точки в пределах области с плотностью событий составляет :

Первый момент, среднее количество точек в районе, просто . Это значение интуитивно понятно, так как это параметр скорости Пуассона.

Вероятность обнаружения соседа любой заданной точки на некотором радиальном расстоянии равна:

где - количество измерений, - параметр, зависящий от плотности, который задается, и - гамма-функция , которая, когда ее аргумент является целым числом, является просто факториальной функцией.

Ожидаемое значение может быть получено с помощью гамма-функции с использованием статистических моментов. Первый момент - это среднее расстояние между случайно распределенными частицами по размерам.

Приложения [ править ]

Изучение CSR важно для сравнения измеренных точечных данных из экспериментальных источников. Как метод статистического тестирования, тест CSR имеет множество применений в социальных науках и в астрономических исследованиях. [3] КСО часто является стандартом, по которому проверяются наборы данных. В общих чертах описан один из подходов к проверке гипотезы CSR: [4]

  1. Используйте статистику, которая является функцией расстояния от каждого события до следующего ближайшего события.
  2. Сначала сосредоточьтесь на конкретном событии и сформулируйте метод проверки того, являются ли событие и следующее ближайшее событие значительно близкими (или далекими).
  3. Затем рассмотрите все события и сформулируйте метод проверки того, является ли среднее расстояние от каждого события до следующего ближайшего события значительно коротким (или длинным).

В случаях, когда аналитическое вычисление тестовой статистики затруднено, используются численные методы, такие как моделирование методом Монте-Карло , путем моделирования случайного процесса большое количество раз. [4]

Ссылки [ править ]

  1. ^ a b О. Маймон, Л. Рокач, Справочник по интеллектуальному анализу данных и открытию знаний , второе издание, Springer 2010, страницы 851-852
  2. ^ LA Waller, CA Gotway , Applied Пространственная статистика для общественного здравоохранения данных , объем 1 Wiley Чичестер, 2004, стр 119-121, 123-127, 137, 139-141, 146-148, 150-151, 157, 203.
  3. ^ «Статистика Венеры: кратеры и катастрофы» .
  4. ^ a b А. Окабе, К. Сугихара, "Пространственный анализ по сетям - статистические и вычислительные методы", том 1, Вили Чичестер, 2012 г., страницы 135-136

Дальнейшее чтение [ править ]

  • Диггл, П.Дж. (2003). Статистический анализ пространственных паттернов точек (2-е изд.). Нью-Йорк: Academic Press. ISBN 0340740701.

Внешние ссылки [ править ]