Пространственная автокорреляция (Global Moran's I) (Пространственная статистика)
Резюме
Измеряет пространственную автокорреляцию на основе местоположений пространственных объектов и атрибутивных значений, используя статистику общего индекса I Морана.
Доступ к результатам этого инструмента (в том числе дополнительному PDF-файлу отчета) можно получить в окне Результаты (Results). Если отключить фоновую обработку, результаты также будут показаны в диалоговом окне Ход процесса (Progress).
Более подробно о том, как работает Пространственная автокорреляция (Глобальный индекс Морана I)
Рисунок
![]() |
Использование
-
Инструмент Пространственная автокорреляция (Общий индекс I Морана) возвращает 5 значений: Индекс I Морана, Ожидаемый индекс, Дисперсия, z-оценка и p-значение. Эти значения доступны в окне результатов и также передаются в качестве производных выходных данных для потенциального использования в моделях и скриптах. Дополнительно, этот инструмент создаст HTML файл с графическим представлением результатов. Если дважды щелкнуть HTML-файл в окне результатов, данный HTML-файл откроется в установленном по умолчанию браузере. Если щелкнуть правой кнопкой мыши запись Сообщения (Messages) в окне Результаты (Results) и выбрать Вид (View), результаты можно будет просмотреть в диалоговом окне Сообщение (Message). Если инструмент будет работать на переднем плане, выходные значения также будут показаны в диалоговом окне работы инструмента.
Примечание:
- Если данный инструмент является частью пользовательского инструмента моделирования, HTML-ссылка появится в окне Результаты (Results) только в том случае, если перед запуском инструмента это было задано в параметрах модели.
- Для лучшего отображения графики HTML, установите разрешение вашего монитора 96 точек на дюйм.
-
Исходя из предложенного набора объектов и связанных с ними атрибутов, инструмент Пространственной автокорреляции оценивает, имеется ли кластеризация объектов или они распределены рассеянно или случайно. Когда z-оценка или p-значение указывают на статистическую значимость, положительный индекс Морана I свидетельствует о тенденции к кластеризации, в то время как отрицательные значения индекса Морана говорят о тенденции к дисперсному распределению объектов (явлений).
-
Инструмент Общий индекса I Морана (Global Moran's I) также вычисляет z-оценку и p-значение, по которым принимается решение об отклонении нулевой гипотезы. В этом случае, нулевая гипотеза утверждает, что значения объектов случайно распределены по области изучения.
-
z-оценка основана на вычислении гипотезы нулевой рандомизации. Дополнительные сведения о z-оценке см. в разделе Что такое z-оценка? Что такое p-значение?
-
Входное поле (Input Field) должно содержать разные значения. Для математических расчетов, выполняемых в рамках этих статистических операций, требуется, чтобы исходные переменные были разными. Например, анализ не будет выполняться, если все входящие значения равны 1. Если вы хотите использовать данный инструмент для анализа пространственных закономерностей случайных данных, попробуйте агрегировать ваши случайные данные.
-
В расчетах, основанных на Евклидовом или Манхэттенском расстояниях, необходимо использовать данные, спроецированные на плоскость, для точного измерения расстояний.
Этот инструмент при необходимости создает HTML-файл со сводным представлением результатов. HTML-файл не отображается автоматически в окне каталога. Если требуется показать HTML-файлы в окне каталога, откройте приложение ArcCatalog, выберите опцию меню Настройка (Customize), щелкните Опции ArcCatalog (ArcCatalog Options) и выберите вкладку Типы файлов (File Types). Нажмите кнопку Новый тип (New Type) и укажите HTML для параметра Расширение файла (File Extension).
-
Для линейных или полигональных объектов, центроиды используются при расчете расстояний. Для мультиточек, полилиний или полигонов, состоящих их нескольких частей, центроид вычисляется с использованием средневзвешенного центра всех частей объекта. При определении весов точечные объекты имеют равный вес (1). Для линейных объектов это длина сегмента. Для полигональных – площадь.
-
Выбор параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships) должен отражать внутренние отношения между пространственными объектами, которые вы анализируете. Чем более точно вы сможете смоделировать взаимодействие пространственных объектов в пространстве, тем более точные результаты вы получите. Рекомендации см. в разделе Выбор Концептуализации пространственных отношений: рекомендации. Ниже приводится несколько дополнительных советов:
- FIXED_DISTANCE_BAND
Значение по умолчанию для параметра Диапазон расстояний или пороговое расстояние (Distance Band or Threshold Distance) гарантирует, что каждый объект имеет, по крайней мере, одного соседа, и это важно. Но часто значение, заданное по умолчанию, не будет наиболее подходящим расстоянием для вашего анализа. В разделе Выбор фиксированного расстояния приведены стратегии, которые помогут определить значение диапазона расстояний, подходящее для вашего анализа.
- INVERSE_DISTANCE или INVERSE_DISTANCE_SQUARED
Когда для параметра Диапазон расстояний или пороговое расстояние (Distance Band or Threshold Distance) указано значение 0, все объекты считаются соседями всех других объектов. Когда этот параметр остается пустым, применяется пороговое значение по умолчанию.
Веса для расстояний менее 1 становятся не стабильны после обращения. Взвешивание объектов, разделенных менее чем одной единицей расстояния (обычно с проекциями географической системы координат) получают вес 1.
Внимание:
Анализ объектов не рекомендуется выполнять в географической системе координат (Geographic Coordinate System), когда вы выбираете один из методов пространственной концептуализации, основанных на использовании обратных расстояний (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED или ZONE_OF_INDIFFERENCE).
При использовании опции обратного расстояния (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED, or ZONE_OF_INDIFFERENCE) любым двум совпадающим точкам придается значение веса 1 во избежание деления на 0. Это будет гарантировать, что объекты не исключены из анализа.
- FIXED_DISTANCE_BAND
-
Для параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships) при использовании инструментов Построить матрицу пространственных весов (Generate Spatial Weights Matrix) или Построить матрицу пространственных весов для сети (Generate Network Spatial Weights) доступны дополнительные опции, в том числе пространственно-временные отношения. Чтобы эффективно воспользоваться этими дополнительными опциями, с помощью одного из этих инструментов создайте файл с матрицей пространственных весов до выполнения анализа, выберите значение GET_SPATIAL_WEIGHTS_FROM_FILE для параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships), а для параметра Файл матрицы весов (Weights Matrix File) задайте путь к файлу с пространственными весами, который вы создали.
-
Слои карты можно использовать для определения Входного класса объектов (Input Feature Class). Если в слое есть выборка, только выбранные объекты будут включены в анализ.
Примечание:
- Если данный инструмент является частью пользовательского инструмента моделирования, HTML-ссылка появится в окне Результаты (Results) только в том случае, если перед запуском инструмента это было задано в параметрах модели.
- Для лучшего отображения графики HTML, установите разрешение вашего монитора 96 точек на дюйм.
Если предоставлен файл матрицы весов с расширением SWM, этот инструмент ожидает получения файла матрицы весов, созданного с помощью инструмента Построить матрицу пространственных весов (Generate Spatial Weights Matrix) или Построить матрицу пространственных весов для сети (Generate Network Spatial Weights). В противном случае инструмент ожидает файл матрицы весов в формате ASCII. В некоторых случаях, поведение различно в зависимости от типа использованной матрицы весов:
- ASCII-файлы с матрицей пространственных весов:
- Веса используются без изменений. Отсутствующие отношения объект к объекту рассматриваются как нули.
- Если веса нормализованы, то вероятнее всего, что результаты будут непригодны для анализа выбранного набора. Если вам нужно выполнить анализ выбранного набора данных, конвертируйте ASCII-файл с матрицей весов в SWM-файл считав данные ASCII-файла в таблицу, используя опцию CONVERT_TABLE инструмента Построить матрицу пространственных весов (Generate Spatial Weights Matrix).
- Матрица пространственных весов в формате SWM:
- Если веса уже были нормализованы, то они будут нормализованы вновь для выбранного набора данных. В противном случае они будут использоваться без изменений.
Для выполнения анализа с ASCII-файлом с матрицей пространственных весов требуется большой объем памяти. При анализе более 5 000 объектов ASCII-файл с матрицей пространственных весов следует конвертировать в SWM-файл. Сначала вы вставляете ваш ASCII-файл с весами в форматированную таблицу (например, с помощью Excel). Затем запускаете инструмент Построить матрицу пространственных весов (Generate Spatial Weights Matrix), задав значение CONVERT_TABLE для параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships). В результате будет создан SWM-файл с матрицей пространственных весов.
Для полигональных объектов практически всегда необходимо выбирать значение Строка (Row) для параметра Нормализация ряда (Row Standardization). Нормализация ряда (Row Standardization) нивелирует отклонение в ситуациях, когда количество соседей каждого объекта является функцией агрегирования или выборки, нежели отражением реального пространственного распределения анализируемой переменной.
-
Дополнительную информацию о параметрах инструмента см. в справочной статье Моделирование пространственных отношений.

В ArcGIS 10 опция графического вывода результатов больше не является автоматической. Взамен этого, создается HTML файл, содержащий результаты. Чтобы просмотреть результаты, необходимо дважды щелкнуть HTML-файл в окне результатов. Возможно, потребуется перестроить пользовательские скрипты или инструменты моделирования, использующие этот инструмент, если они были созданы в версии ArcGIS более ранней, чем версия 10. Чтобы модифицировать такие инструменты, откройте их, отключите опцию Отображать результаты графически (Display Results Graphically) и сохраните заново.

Во время работы инструмента может обнаружиться нехватка памяти. Так обычно получается, когда вы выбираете Концептуализация пространственных отношений (Conceptualization of Spatial Relationships) и/или Диапазон расстояний или Пороговое расстояние (Distance Band or Threshold Distance), что приводит к тому, что у объектов очень много соседей. Обычно не требуется задавать пространственные отношения, в которых у каждого объекта имеется несколько тысяч соседей. Вы хотите, чтобы все объекты имели как минимум 1 соседа и почти все объекты имели как минимум 8 соседей.

При использовании шейп-файлов, помните, что в них нельзя хранить нулевые (null) значения. Инструменты или другие процедуры, создающие шейп-файлы из прочих входных данных, могут хранить значения NULL в виде 0 или оперировать ими как нулем. В некоторых случаях нули в шейп-файлах хранятся как очень маленькие отрицательные числа. Это может привести к неожиданным результатам. Дополнительные сведения см. в разделе Рекомендации по геообработке выходных данных шейп-файла.

В ArcGIS 9.2 возможность Глобальной стандартизации отсутствовала. Глобальная стандартизация дает такой же результат, что и при ее отсутствии. Для моделей, созданных в предыдущих версиях ArcGIS, которые используют функцию Глобальной стандартизации, может понадобиться перестройка.
Синтаксис
Параметр | Объяснение | Тип данных |
Input_Feature_Class |
Класс объектов, для которого будет рассчитываться пространственная автокорреляция. | Feature Layer |
Input_Field |
Числовое поле, используемое в оценке пространственной автокорреляции. | Field |
Generate_Report (дополнительно) |
| Boolean |
Conceptualization_of_Spatial_Relationships |
Определяет, как концептуализированы пространственные отношения между объектами.
| String |
Distance_Method |
Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.
| String |
Standardization |
Нормализация ряда (Row standardization) рекомендуется, независимо от того, распределены ли объекты потенциально предвзято в зависимости от дизайна примера или от установленной схемы агрегации.
| String |
Distance_Band_or_Threshold_Distance (дополнительно) |
Определяет пороговое значение расстояния для параметров Обратное расстояние и Фиксированное расстояние. Объекты, расположенные вне указанной области, игнорируются при анализе этого объекта. Однако для Зоны индифферентности, влияние объектов, расположенных вне приведенного расстояния сокращается с расстоянием, в то время как влияние тех объектов, которые располагаются в пределах порогового расстояния, распределяется равномерно. Введенное значение расстояния должно соответствовать выходной системе координат. При использовании концептуализации Обратных расстояний для вычисления пространственных отношений, значение 0 обозначает, что пороговое расстояние не применялось; когда данный параметр остается пустым, пороговое значение по умолчанию рассчитывается и применяется при анализе. Значение по умолчанию – это Евклидово расстояние, которое гарантирует каждому объекту как минимум 1 соседа. Этот параметр не эффективен, когда выбраны концептуализации Близость полигонов или Получить пространственные веса из файла. | Double |
Weights_Matrix_File (дополнительно) |
Путь к файлу, который содержит веса, определяющие пространственные и, возможно, временные отношения между объектами. | File |
Пример кода
Следующий скрипт окна Python является примером использования инструмента SpatialAutocorrelation (ПространственнаяАвтокорреляция).
import arcpy
arcpy.env.workspace = r"c:\data"
arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual","NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN DISTANCE", "NONE", "#","euclidean6Neighs.swm")
Следующий автономный скрипт Python является примером использования инструмента SpatialAutocorrelation (ПространственнаяАвтокорреляция).
# Analyze the growth of regional per capita incomes in US
# Counties from 1969 -- 2002 using Ordinary Least Squares Regression
# Import system modules
import arcpy
# Set the geoprocessor object property to overwrite existing outputs
arcpy.gp.overwriteOutput = True
# Local variables...
workspace = r"C:\Data"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.workspace = workspace
# Growth as a function of {log of starting income, dummy for South
# counties, interaction term for South counties, population density}
# Process: Ordinary Least Squares...
ols = arcpy.OrdinaryLeastSquares_stats("USCounties.shp", "MYID",
"olsResults.shp", "GROWTH",
"LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69",
"olsCoefTab.dbf",
"olsDiagTab.dbf")
# Create Spatial Weights Matrix (Can be based off input or output FC)
# Process: Generate Spatial Weights Matrix...
swm = arcpy.GenerateSpatialWeightsMatrix_stats("USCounties.shp", "MYID",
"euclidean6Neighs.swm",
"K_NEAREST_NEIGHBORS",
"#", "#", "#", 6)
# Calculate Moran's I Index of Spatial Autocorrelation for
# OLS Residuals using a SWM File.
# Process: Spatial Autocorrelation (Morans I)...
moransI = arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual",
"NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE",
"EUCLIDEAN_DISTANCE", "NONE", "#",
"euclidean6Neighs.swm")
except:
# If an error occurred when running the tool, print out the error message.
print arcpy.GetMessages()
Параметры среды
- Выходная система координат (Output Coordinate System)
До начала анализа геометрия пространственных объектов проецируется в Выходную систему координат (Output Coordinate System). Во всех математических вычислениях учитывается пространственная привязка Выходной системы координат (Output Coordinate System).