Анализ горячих точек (Пространственная статистика)
Резюме
Приведенный набор взвешенных объектов, определяет статистическую значимость "горячих" точек и "холодных" точек на основе статистического показателя Getis-Ord Gi*.
Подробнее, как работает Анализ горячих точек (Getis-Ord Gi*)
Рисунок
Использование
-
Этот инструмент идентифицирует статистически значимые пространственные кластеры высоких значений (горячих точек) и низких значений (холодных точек). Он создает новый Выходной класс объектов (Output Feature Class) с z-оценкой и p-значением для каждого объекта во Входном классе пространственных объектов (Input Feature Class). Он также возвращает название полей для z-оценки и р -значения для их потенциального использования в пользовательской модели или скриптах.
-
z-оценки и р-значения являются измерениями статистической значимости, которая говорит вам, можно ли отклонить нулевую гипотезу. В действительности, они измеряют, насколько наблюдаемая пространственная кластеризация является чем-то большим, чем случайное распределение тех же значений.
-
Высокая z-оценка и низкое р-значение для объекта свидетельствует о пространственной кластеризации высоких значений. Низкая негативная z-оценка и низкое р-значение для объекта свидетельствуют о пространственной кластеризации низких значений. Чем выше (или ниже) z-оценка, чем сильнее интенсивность кластеризации. Z-оценка около ноля не указывает ни на какое очевидное объединение в кластеры.
-
z-оценка основана на вычислении гипотезы нулевой рандомизации. Дополнительные сведения о z-оценке см. в разделе Что такое z-оценка? Что такое p-значение?
-
В расчетах, основанных на Евклидовом или Манхэттенском расстояниях, необходимо использовать данные, спроецированные на плоскость, для точного измерения расстояний.
-
Для линейных или полигональных объектов, центроиды используются при расчете расстояний. Для мультиточек, полилиний или полигонов, состоящих их нескольких частей, центроид вычисляется с использованием средневзвешенного центра всех частей объекта. При определении весов точечные объекты имеют равный вес (1). Для линейных объектов это длина сегмента. Для полигональных – площадь.
-
Входное поле (Input Field) должно содержать разные значения. Для математических расчетов, выполняемых в рамках этих статистических операций, требуется, чтобы исходные переменные были разными. Например, анализ не будет выполняться, если все входящие значения равны 1. Если вы хотите использовать данный инструмент для анализа пространственных закономерностей случайных данных, попробуйте агрегировать ваши случайные данные.
-
Выбор параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships) должен отражать внутренние отношения между пространственными объектами, которые вы анализируете. Чем более точно вы сможете смоделировать взаимодействие пространственных объектов в пространстве, тем более точные результаты вы получите. Рекомендации см. в разделе Выбор Концептуализации пространственных отношений: рекомендации. Ниже приводится несколько дополнительных советов:
- FIXED_DISTANCE_BAND
Значение по умолчанию для параметра Диапазон расстояний или пороговое расстояние (Distance Band or Threshold Distance) гарантирует, что каждый объект имеет, по крайней мере, одного соседа, и это важно. Но часто значение, заданное по умолчанию, не будет наиболее подходящим расстоянием для вашего анализа. В разделе Выбор фиксированного расстояния приведены стратегии, которые помогут определить значение диапазона расстояний, подходящее для вашего анализа.
- INVERSE_DISTANCE или INVERSE_DISTANCE_SQUARED
Когда для параметра Диапазон расстояний или пороговое расстояние (Distance Band or Threshold Distance) указано значение 0, все объекты считаются соседями всех других объектов. Когда этот параметр остается пустым, применяется пороговое значение по умолчанию.
Веса для расстояний менее 1 становятся не стабильны после обращения. Взвешивание объектов, разделенных менее чем одной единицей расстояния (обычно с проекциями географической системы координат) получают вес 1.
Внимание:Анализ объектов не рекомендуется выполнять в географической системе координат (Geographic Coordinate System), когда вы выбираете один из методов пространственной концептуализации, основанных на использовании обратных расстояний (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED или ZONE_OF_INDIFFERENCE).
При использовании опции обратного расстояния (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED, or ZONE_OF_INDIFFERENCE) любым двум совпадающим точкам придается значение веса 1 во избежание деления на 0. Это будет гарантировать, что объекты не исключены из анализа.
- FIXED_DISTANCE_BAND
-
Для параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships) при использовании инструментов Построить матрицу пространственных весов (Generate Spatial Weights Matrix) или Построить матрицу пространственных весов для сети (Generate Network Spatial Weights) доступны дополнительные опции, в том числе пространственно-временные отношения. Чтобы эффективно воспользоваться этими дополнительными опциями, с помощью одного из этих инструментов создайте файл с матрицей пространственных весов до выполнения анализа, выберите значение GET_SPATIAL_WEIGHTS_FROM_FILE для параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships), а для параметра Файл матрицы весов (Weights Matrix File) задайте путь к файлу с пространственными весами, который вы создали.
Дополнительные сведения о пространственно-временном кластерном анализе см. в документе Пространственно-временной анализ.
-
Слои карты можно использовать для определения Входного класса объектов (Input Feature Class). Если в слое есть выборка, только выбранные объекты будут включены в анализ.
Если предоставлен файл матрицы весов с расширением SWM, этот инструмент ожидает получения файла матрицы весов, созданного с помощью инструмента Построить матрицу пространственных весов (Generate Spatial Weights Matrix) или Построить матрицу пространственных весов для сети (Generate Network Spatial Weights). В противном случае инструмент ожидает файл матрицы весов в формате ASCII. В некоторых случаях, поведение различно в зависимости от типа использованной матрицы весов:
- ASCII-файлы с матрицей пространственных весов:
- Веса используются без изменений. К отсутствующим отношениям объект к объекту относятся как к нулю.
- Вес по умолчанию для самопотенциала — 0, если не указать значение поля Самопотенциал (Self Potential) или точно указать веса самопотенциала.
- Если веса нормализованы, то вероятнее всего, что результаты будут непригодны для анализа выбранного набора данных. Если вам нужно выполнить анализ по выбранному набору данных, конвертируйте ASCII-файл с матрицей весов в SWM-файл считав данные ASCII-файла в таблицу и используя опцию CONVERT_TABLE инструмента Построить матрицу пространственных весов (Generate Spatial Weights Matrix).
- Матрица пространственных весов в формате SWM:
- Если веса уже были нормализованы, то они будут нормализованы вновь для выбранного набора данных. В противном случае они будут использоваться без изменений.
- Вес по умолчанию для самопотенциала — 1, если не указать значение поля Самопотенциала (Self Potential).
- ASCII-файлы с матрицей пространственных весов:
Для выполнения анализа с ASCII-файлом с матрицей пространственных весов требуется большой объем памяти. При анализе более 5 000 объектов ASCII-файл с матрицей пространственных весов следует конвертировать в SWM-файл. Сначала вы вставляете ваш ASCII-файл с весами в форматированную таблицу (например, с помощью Excel). Затем запускаете инструмент Построить матрицу пространственных весов (Generate Spatial Weights Matrix), задав значение CONVERT_TABLE для параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships). В результате будет создан SWM-файл с матрицей пространственных весов.
-
Когда этот инструмент запускается в ArcMap, Выходной класс объектов (Output Feature Class) автоматически добавляется в таблицу содержания с визуализацией z-оценки по умолчанию. Цветовая схема от теплых к холодным тонам определяется файлом слоя в папке <ArcGIS>/Desktop10.x/ArcToolbox/Templates/Layers. Метод отображения по умолчанию, если это необходимо, можно применить заново путем импорта символов слоя шаблона.
Выходной класс объектов содержит поле SOURCE_ID, позволяющее присоединить его к входному классу объектов при необходимости.
-
Дополнительную информацию о параметрах инструмента см. в справочной статье Моделирование пространственных отношений.
При использовании шейп-файлов, помните, что в них нельзя хранить нулевые (null) значения. Инструменты или другие процедуры, создающие шейп-файлы из прочих входных данных, могут хранить значения NULL в виде 0 или оперировать ими как нулем. В некоторых случаях нули в шейп-файлах хранятся как очень маленькие отрицательные числа. Это может привести к неожиданным результатам. Дополнительные сведения см. в разделе Рекомендации по геообработке выходных данных шейп-файла.
До выхода ArcGIS 10.0 выходной класс объектов дублировал входной класс объектов с добавленными значениями z-оценки и p-значения. После выхода ArcGIS 10.0 выходной класс объектов содержит только поля z-оценки p-значений, а также входные поля анализа. Чтобы присоединить другие входные поля к выходному классу объектов, используйте поле SOURCE_ID для добавления полей с помощью инструментов группы инструментов Соединения (Joins).
Нормализация ряда (Row Standardization) не влияет на этот инструмент. Результаты выполнения инструмента Анализ горячих точек (Getis-Ord Gi*) (Hot Spot Analysis (Getis-Ord Gi*)) будут совпадать при запуске со стандартизацией строк и без нее. Этот параметр отключен. Он используется только для обеспечения обратной совместимости инструмента.
Синтаксис
Параметр | Объяснение | Тип данных |
Input_Feature_Class |
Это класс объектов, по которому будет выполняться анализ горячих точек. | Feature Layer |
Input_Field |
Числовое поле (количество жертв, преступлений, мест работы и т.д.), которое должно быть оценено. | Field |
Output_Feature_Class |
Выходной класс объектов для получения результирующих z-оценки и р-значения. | Feature Class |
Conceptualization_of_Spatial_Relationships |
Определяет, как концептуализированы пространственные отношения между объектами.
| String |
Distance_Method |
Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.
| String |
Standardization |
Нормализация ряда (Row Standardization) не влияет на этот инструмент. Результаты выполнения инструмента Анализ горячих точек (Getis-Ord Gi*) (Hot Spot Analysis (Getis-Ord Gi*)) будут совпадать при запуске со стандартизацией строк и без нее. Этот параметр отключен. Он используется только для обеспечения обратной совместимости инструмента.
| String |
Distance_Band_or_Threshold_Distance (дополнительно) |
Определяет пороговое значение расстояния для параметров Обратное расстояние и Фиксированное расстояние. Объекты, расположенные вне указанной области, игнорируются при анализе этого объекта. Однако для Зоны индифферентности, влияние объектов, расположенных вне приведенного расстояния сокращается с расстоянием, в то время как влияние тех объектов, которые располагаются в пределах порогового расстояния, распределяется равномерно. Введенное значение расстояния должно соответствовать выходной системе координат. При использовании концептуализации Обратных расстояний для вычисления пространственных отношений, значение 0 обозначает, что пороговое расстояние не применялось; когда данный параметр остается пустым, пороговое значение по умолчанию рассчитывается и применяется при анализе. Значение по умолчанию – это Евклидово расстояние, которое гарантирует каждому объекту как минимум 1 соседа. Этот параметр не эффективен, когда выбраны концептуализации Близость полигонов или Получить пространственные веса из файла. | Double |
Self_Potential_Field (дополнительно) |
Поле, представляющее собственный потенциал — это расстояние или вес между одним и тем же объектом. | Field |
Weights_Matrix_File (дополнительно) |
Путь к файлу, который содержит веса, определяющие пространственные и, возможно, временные отношения между объектами. | File |
Пример кода
Следующий скрипт в окне Python демонстрирует, как использовать инструмент HotSpotAnalysis.
import arcpy
arcpy.env.workspace = "C:/data"
arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp","GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN_DISTANCE", "NONE","#", "#", "euclidean6Neighs.swm")
Следующий автономный скрипт Python демонстрирует, как использовать инструмент HotSpotAnalysis.
# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Hot-Spot Analysis Tool (Local Gi*)
# Import system modules
import arcpy
# Set geoprocessor object property to overwrite existing output, by default
arcpy.gp.overwriteOutput = True
# Local variables...
workspace = "C:/Data"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Copy the input feature class and integrate the points to snap
# together at 500 feet
# Process: Copy Features and Integrate
cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
"#", 0, 0, 0)
integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")
# Use Collect Events to count the number of calls at each location
# Process: Collect Events
ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")
# Add a unique ID field to the count feature class
# Process: Add Field and Calculate Field
af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
"NON_NULLABLE", "NON_REQUIRED", "#",
"911Count.shp")
cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")
# Create Spatial Weights Matrix for Calculations
# Process: Generate Spatial Weights Matrix...
swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
"euclidean6Neighs.swm",
"K_NEAREST_NEIGHBORS",
"#", "#", "#", 6,
"NO_STANDARDIZATION")
# Hot Spot Analysis of 911 Calls
# Process: Hot Spot Analysis (Getis-Ord Gi*)
hs = arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp",
"GET_SPATIAL_WEIGHTS_FROM_FILE",
"EUCLIDEAN_DISTANCE", "NONE",
"#", "#", "euclidean6Neighs.swm")
except:
# If an error occurred when running the tool, print out the error message.
print arcpy.GetMessages()
Параметры среды
- Выходная система координат (Output Coordinate System)
До начала анализа геометрия пространственных объектов проецируется в Выходную систему координат (Output Coordinate System), поэтому значения параметров Диапазон расстояний или пороговое расстояние (Distance Band/Threshold Distance) должны быть выражены в единицах измерения, заданных в Выходной системе координат. Во всех математических вычислениях учитывается пространственная привязка Выходной системы координат (Output Coordinate System).