GeoDa - это бесплатный программный пакет, который выполняет анализ пространственных данных , геовизуализацию , пространственную автокорреляцию и пространственное моделирование.
Он работает в разных версиях Windows , Mac OS и Linux . Первоначально пакет был разработан Лабораторией пространственного анализа Иллинойского университета в Урбана-Шампейн под руководством Люка Анселина . С 2016 года развитие продолжается в Центре пространственных данных Science (ЧСДП) в Университете Чикаго . [1]
GeoDa обладает мощными возможностями для выполнения пространственного анализа, многомерного исследовательского анализа данных, а также глобальной и локальной пространственной автокорреляции . Он также выполняет базовую линейную регрессию . Что касается пространственных моделей, как пространственная модель лаг и модель пространственной ошибки , как оценивается максимальным правдоподобием , включены.
OpenGeoDa выпущен под лицензией GNU GPL версии 3.0. [2]
История
GeoDa заменила то, что ранее называлось DynESDA, модуль, который работал под старым ArcView 3.x для выполнения исследовательского анализа пространственных данных (или ESDA ). Текущие версии GeoDa больше не зависят от наличия ArcView или других пакетов ГИС в системе.
Функциональность
Проекты в GeoDa в основном состоят из шейп- файла, который определяет данные решетки, и таблицы атрибутов в формате .dbf. Таблицу атрибутов можно редактировать внутри GeoDa.
Пакет специализируется на исследовательском анализе данных и геовизуализации, где он использует методы динамического связывания и чистки . Это означает, что когда у пользователя есть несколько представлений или окон в проекте, выбор объекта в одном из них будет выделять тот же объект во всех других окнах.
GeoDa также способна производить гистограммы , коробку участки , разброс участки для проведения простого поискового анализа данных. Однако наиболее важным является возможность отображать и связывать эти статистические устройства с пространственным распределением явления, которое изучают пользователи.
Динамическое связывание и кисть в GeoDa
Динамическое связывание и чистка являются мощными устройствами, поскольку они позволяют пользователям в интерактивном режиме обнаруживать или подтверждать предполагаемые закономерности пространственного расположения данных или иным образом отвергать их существование. Это позволяет пользователям извлекать информацию из данных в пространственном расположении, что в противном случае может потребовать очень тяжелых компьютерных программ для обработки чисел и получения полезных статистических результатов. Последнее также может стоить пользователям довольно много с точки зрения экспертных знаний и возможностей программного обеспечения.
Диаграмма рассеяния Морана Анселина
- См. Также Индикаторы пространственной ассоциации
Очень интересным устройством, доступным в GeoDa для изучения глобальных закономерностей автокорреляции в пространстве, является диаграмма рассеяния Морана Анселина. Этот график отображает стандартизованную переменную по оси x в зависимости от пространственного запаздывания этой стандартизованной переменной. Пространственное отставание - это не что иное, как сводка эффектов соседних пространственных единиц. Эта сводка получается с помощью матрицы пространственных весов, которая может принимать различные формы, но очень часто используется матрица смежности . Матрица смежности - это массив, который имеет значение единицы в позиции (i, j) всякий раз, когда пространственная единица j смежна с единицей i. Для удобства эта матрица стандартизирована таким образом, что сумма строк равна единице путем деления каждого значения на сумму строк исходной матрицы.
По сути, диаграмма рассеяния Морана Анселина представляет отношение переменной в местоположении i к значениям этой переменной в соседних местоположениях. По построению наклон линии на диаграмме рассеяния эквивалентен коэффициенту I. Последняя является хорошо известной статистикой, которая учитывает глобальную пространственную автокорреляцию. Если этот наклон положительный, это означает, что существует положительная пространственная автокорреляция: высокие значения переменной в местоположении i имеют тенденцию группироваться с высокими значениями той же переменной в местоположениях, которые являются соседями с i , и наоборот. Если наклон диаграммы рассеяния отрицательный, это означает, что у нас есть своего рода узор в виде шахматной доски или своего рода пространственная конкуренция, в которой высокие значения переменной в местоположении i имеют тенденцию совмещаться с более низкими значениями в соседних местоположениях.
На диаграмме рассеяния Морана Анселина наклон кривой рассчитывается и отображается в верхней части графика. В этом случае это значение положительное, что означает, что в районах с высоким уровнем преступности, как правило, есть соседи с высоким уровнем преступности, и наоборот.
Глобальный и локальный анализ в GeoDa
На глобальном уровне мы можем говорить о кластеризации , то есть об общей тенденции кластеризации карты; на локальном уровне мы можем говорить о кластерах, т.е. мы можем точно определить местонахождение кластеров. Последнюю можно оценить с помощью Локальных индикаторов пространственной ассоциации - LISA . LISA- анализ позволяет нам определить, где находятся области с высокими значениями переменной, которые окружены высокими значениями в соседних областях, то есть так называемые кластеры с высокими-высокими значениями. Одновременно из этого анализа также идентифицируются кластеры с низким и низким уровнем.
Другой тип явления, который важно проанализировать в этом контексте, - это наличие выбросов, которые представляют высокие значения переменной в данном месте, окруженные низкими значениями в соседних местах. Эта функция доступна в GeoDa посредством диаграммы рассеяния Морана Анселина. Обратите внимание, однако, что тот факт, что значение является высоким по сравнению со значениями в соседних местоположениях, не обязательно означает, что оно является выбросом, поскольку нам необходимо оценить статистическую значимость этого отношения. Другими словами, мы можем найти области, где кажется, что существует кластеризация, или где могут казаться кластеры, но когда проводятся статистические процедуры, они оказываются статистически не значимыми кластерами или выбросами. Процедуры, используемые для оценки статистической значимости, состоят из моделирования методом Монте-Карло различного расположения данных и построения эмпирического распределения смоделированной статистики. После этого первоначально полученное значение сравнивается с распределением смоделированных значений, и если значение превышает 95-часовой процентиль, говорят, что найденное соотношение является значимым при 5%.
Рекомендации
- ^ "О" . Центр науки о пространственных данных Чикагского университета . Архивировано 7 июля 2016 года . Проверено 23 сентября 2020 года .
- ^ «Релиз ГеоДа» . Центр GeoDa, Чикагский университет . Проверено 23 сентября 2020 года .
дальнейшее чтение
- Анселин, Люк, Сюнь Ли и Юлия Кощински (2021 г.). GeoDa, От рабочего стола к экосистеме для исследования пространственных данных. Препринт
- Анселин, Люк, Ибну Сябри и Юнгин Хо (2006). GeoDa: Введение в анализ пространственных данных. Географический анализ 38, 5-22
- Анселин, Люк, Рей, Серджио Дж. (2014). Современная пространственная эконометрика на практике: руководство по GeoDa, GeoDaSpace и PySAL. GeoDa Press LLC, Чикаго, Иллинойс