Как работает инструмент Анализ горячих точек
Инструмент Анализ горячих точек рассчитывает статистический показатель Getis-Ord Gi* для каждого объекта в наборе данных. Итоговые z-оценки и p-значения говорят вам о том, в какой области пространства кластеризуются объекты с высокими или низкими значениями. Инструмент работает путем анализа каждого объекта в контексте соседних объектов. Объект с высоким значением интересен, но, возможно, не является статистически существенной горячей точкой. Чтобы быть статистически существенной горячей точкой, объект должен иметь высокое значение и быть окружен другими объектами с также высокими значениями. Локальная сумма для объекта и его соседей сравнивается пропорционально с суммой всех объектов; когда локальная сумма очень отличается от ожидаемой локальной суммы, и когда это отличие является слишком большим, чтобы быть результатом случайного процесса, получается статистически значимая z-оценка. Когда применяется коррекция FDR, статистическая значимость настраивается для множественного тестирования и пространственных зависимостей.
Вычисления
Интерпретация
Статистическая величина Gi*, возвращенная для каждого объекта в наборе данных, является z-оценкой. Для статистически значимых положительных z-оценок, чем больше z-оценка, тем более интенсивна кластеризация высоких значений (горячая точка). Для статистически значимых негативных z-оценок, чем меньше z-оценка, тем более интенсивна кластеризация низких значений (холодная точка). Более подробно об определении статистической значимости и корректировки для множественного тестирования и пространственных зависимостей см. в разделе Что такое z-оценка? Что такое p-значение?
Выходные данные
Инструмент создает новый Выходной класс объектов (Output Feature Class) с z-оценкой, p-значением и уровнем достоверности (Gi_Bin) для каждого объекта во Входном классе объектов (Input Feature Class). Если есть выборка, относящаяся к Входному классу объектов, только отобранные объекты будут проанализированы, и только выбранные объекты появятся в Выходном классе объектов.
При запуске инструмента в ArcMap, Выходной класс объектов автоматически добавляется к таблице содержания с методом отображения по умолчанию, примененном к полю Gi_Bin. Применяемое отображение в виде диапазона "от горячей к холодной" определяется файлом слоя в <ArcGIS>/ArcToolbox/Templates/Layers. Метод отображения по умолчанию, если это необходимо, можно применить заново путем импорта символов слоя шаблона.
Рассмотрение Анализа горячих точек
Есть три вещи, которые стоит иметь в виду, предпринимая любой анализ горячей точки:
- Что такое Поле анализа (Входное поле)? Инструмент анализа горячей точки оценивает, кластеризуются ли в пространстве высокие или низкие значения (например, число преступлений, серьезных несчастных случаев). Поле, содержащее эти значения, является вашим Полем анализа. Тем не менее, для точечных данных об инцидентах, вы можете больше интересоваться оценкой интенсивности инцидента, нежели анализом пространственного объединения в кластеры любого значения, связанного с инцидентами. В этом случае Вы должны будете агрегировать свои данные об инциденте до анализа. Существует несколько путей, как сделать это:
- Если у вас есть объекты-полигоны в вашей области исследования, вы можете использовать инструмент Пространственное соединение (Spatial Join), чтобы посчитать количество событий в каждом полигоне. Полученное поле, содержащее количество событий в каждом полигоне, становится Входным полем для анализа.
- Используйте инструмент Построить сетку для создания сетки полигонов поверх ваших точечных объектов. Затем используйте инструмент Пространственное соединение, чтобы посчитать количество событий, попадающих в пределы каждого полигона сетки. Удалите любые полигоны сетки, которыерасполагаются вне области изучения. Также, в случаях, где большое количество полигонов сетки в области исследования содержат нули для числа событий, увеличьте размер сетки полигона, если удастся, или удалите полигоны сетки с нулевыми значениями до анализа.
- Альтернативно, если у вас есть много совпадающих точек или пунктов на небольшом расстоянии друг от друга, вы можете использовать инструменты Интегрировать и Собрать события, чтобы (1) чтобы привязать объекты в пределах указанного расстояния друг от друга вместе и затем (2) создать новый класс объектов, содержащий точку на каждом уникальном местоположении со связанным числовым атрибутом, чтобы идентифицировать количество событий/связанных точек. Используйте полученное поле ICOUNT как Входное поле (Input Field) для анализа. Примечание:
Если вы опасаетесь, что ваши совпадающие точки могут быть избыточными записями, инструмент Найти идентичные может помочь вам найти и удалить дубликаты.
- Какая Определение пространственных взаимоотношений является подходящей? Какое значение Диапазона расстояний или Порогового расстояния подходит наилучшим образом?
Рекомендованная (по умолчанию) Определение пространственных взаимоотношений для Анализа горячих точек – Фиксированный диапазон расстояний. Также могут использоваться такие значения, как Пространственно-временное окно, Зона индифферентности, Примыкание, K Ближайший сосед и Триангуляция Делоне. Для изучения лучших методов и стратегий определения значения расстояния для анализа, смотрите Выбор Концептуализации пространственных отношений и Выбор Фиксированного расстояния. Дополнительные сведения о пространственно-временном анализе горячих точек см. в разделе Пространственно-временной анализ.
- В чем суть вопроса?
Это может казаться очевидным, но то, как вы создаете Входное поле для анализа определяет тип вопросов, которые вы можете задать. Вы заинтересованы в определении мест, где есть много инцидентов, или где высокие/низкие значения для определенного атрибута кластеризуются в пространстве? Если так, запустите Анализ горячих точек по предварительным значениям или по предварительному количеству инцидентов. Этот тип анализа особенно полезен для типа задач распределения ресурсов. Альтернативно (или в добавление), вы можете интересоваться рпоиском областей с неожиданно высокими значениями относительно некоторой другой переменной. Если Вы, например, анализируете потери права выкупа, то вы, вероятно, ожидаете больше потерь права выкупа в местах с большим количеством домов (говоря иначе, на некотором уровне, вы ожидаете, что число потерь права выкупа будет функцией числа домов). Если вы разделите число потерь права выкупа закладной на число домов, и затем запустите инструмент анализа горячих точек для этого соотношения, вы больше не будете спрашивать "Где потери права выкупа закладной происходят в больших количествах?"; вместо этого вы будете спрашивать "Где потери права выкупа закладной происходят в неожиданно больших количествах, учитывая число домов?" Создавая уровень или отношение до анализа, Вы можете управлять определенными ожидаемыми связями (например, число преступлений – функция населения; число потерь права выкупа – функция жилищного фонда), и идентифицируйте неожиданные горячие/холодные пятна.
Практическое применение
- Содержит ли Входной класс объектов (Input Feature Class) по меньшей мере 30 объектов? Результаты ненадежны при использовании менее 30 объектов.
- Подходит ли выбранная вами Определение пространственных взаимоотношений? Для этого инструмента рекомендуется применение метода Диапазон фиксированного расстояния. Для получения дополнительной информации о пространственно-временном анализе горячих точек см. Выбор Концептуализации пространственных взаимоотношений.
- Выбранный вами Диапазон расстояний или пороговое расстояние являются подходящими? См. Выбор Фиксированного расстояния.
- Все объекты должны иметь, по крайней мере, одного соседа.
- Ни один объект не должен иметь в качестве соседей все другие объекты.
- Особенно, если значения в Входном поле (Input Field) искажены, вам потребуется, чтобы у каждого объекта было не менее 8 соседей.
Возможное применение
Применение может быть найдено в анализе преступлений, эпидемиологии, голосовании, экономической географии, розничной торговле, транспортном анализе и демографии. Некоторые примеры включают следующее:
- Где сконцентрирована вспышка болезни?
- Где пожары на кухне составляют высокую долю среди прочих бытовых пожаров?
- Где следует расположить центры эвакуации?
- Где/Когда действительно случаются пики интенсивности?
- Каким местоположениям и на протяжении каких периодов времени мы должны выделять больше наших ресурсов?
Дополнительные ресурсы
Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2.ESRI Press, 2005.
Getis, A. and J.K. Ord. 1992. "The Analysis of Spatial Association by Use of Distance Statistics" (Анализ пространственный взаимосвязей с использованием статистики расстояний) в Geographical Analysis 24(3).
Ord, J.K. and A. Getis. 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" (Статистика местной пространственной автоматической корреляции: вопросы распределения и применения) в Geographical Analysis 27(4).
На странице описания пространственной статистики имеются кроткие видеоролики, учебные пособия, онлайн-семинары, статьи и другие материалы, которые помогут вам начать работу с пространственной статистикой.
Scott, L. and N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools (Расширенный анализ преступности с использованием инструментов пространственной статистики ArcGIS) в ArcUser Online, April–June 2005.