Как работает инструмент Анализ горячих точек (Getis-Ord Gi*)
Инструмент Анализ горячих точек рассчитывает статистический показатель Getis-Ord Gi* для каждого объекта в наборе данных. Итоговые z-оценки и p-значения говорят вам о том, в какой области пространства кластеризуются объекты с высокими или низкими значениями. Инструмент работает путем анализа каждого объекта в контексте соседних объектов. Объект с высоким значением интересен, но, возможно, не является статистически существенной горячей точкой. Чтобы быть статистически существенной горячей точкой, объект должен иметь высокое значение и быть окружен другими объектами с также высокими значениями. Локальная сумма для объекта и его соседей сравнивается пропорционально с суммой всех объектов; когда локальная сумма очень отличается от ожидаемой локальной суммы, и это отличие является слишком большим, чтобы быть результатом случайного процесса, получается статистически значимая z-оценка.
Вычисления
Интерпретация
Статистическая величина Gi*, возвращенная для каждого объекта в наборе данных, является z-оценкой. Для статистически значимых положительных z-оценок, чем больше z-оценка, тем более интенсивна кластеризация высоких значений (горячая точка). Для статистически значимых негативных z-оценок, чем меньше z-оценка, тем более интенсивна кластеризация низких значений (холодная точка). Более подробно об определении статистической значимости см. Что такое z-оценка? Что такое p-значение?
Вывод
Инструмент создает новый Выходной класс объектов (Output Feature Class) с z-оценкой и p-значением для каждого объекта во Входном классе объектов (Input Feature Class). Если есть выборка, относящаяся к Входному классу объектов, только отобранные объекты будут проанализированы, и только выбранные объекты появятся в Выходном классе объектов. Этот инструмент также возвращает название полей для z-оценки и р-значения для их потенциального использования в пользовательской модели или скриптах.
Когда этот инструмент запускается в ArcMap, Выходной класс объектов автоматически добавляется в таблицу содержания с с применением метода отображения z-оценки по умолчанию. Цветовая схема от горячих к холодным точкам определяется файлом слоя в папке <ArcGIS>/ArcToolbox/Templates/Layers. Метод отображения по умолчанию, если это необходимо, можно применить заново путем импорта символов слоя шаблона.
Рассмотрение Анализа опасных районов
Есть три вещи, которые стоит иметь в виду, предпринимая любой анализ горячей точки:
- Что такое Поле анализа (Входное поле)? Инструмент анализа горячей точки оценивает, кластеризуются ли в пространстве высокие или низкие значения (например, число преступлений, серьезных несчастных случаев). Поле, содержащее эти значения, является вашим Полем анализа. Тем не менее, для точечных данных об инцидентах, вы можете больше интересоваться оценкой интенсивности инцидента, нежели анализом пространственного объединения в кластеры любого значения, связанного с инцидентами. В этом случае Вы должны будете агрегировать свои данные об инциденте до анализа. Существует несколько путей, как сделать это:
- Если у вас есть объекты-полигоны в вашей области исследования, вы можете использовать инструмент Пространственное соединение (Spatial Join), чтобы посчитать количество событий в каждом полигоне. Полученное поле, содержащее количество событий в каждом полигоне, становится Входным полем для анализа.
- Используйте инструмент Построить сетку (Create Fishnet) для создания сетки полигона поверх ваших точечных объектов. Затем используйте инструмент Пространственное соединение (Spatial Join), чтобы посчитать количество событий, попадающих в пределы каждого полигона сетки. Удалите любой полигональный грид, который располагается вне области изучения. Также, в случаях, где большое количество полигонов сетки в области исследования содержат нули для числа событий, увеличьте размер сетки полигона, если удастся, или удалите полигоны сетки с нулевыми значениями до анализа.
- Альтернативно, если у вас есть много совпадающих точек или пунктов на небольшом расстоянии друг от друга, вы можете использовать инструменты Интегрировать и Собрать события, чтобы (1) чтобы привязать объекты в пределах указанного расстояния друг от друга вместе и затем (2) создать новый класс объектов, содержащий точку на каждом уникальном местоположении со связанным числовым атрибутом, чтобы идентифицировать количество событий/связанных точек. Используйте получившееся поле ICOUNT как Входное поле для анализа. Примечание:
Если вы опасаетесь, что ваши совпадающие точки могут быть избыточными записями, инструмент Найти идентичные (Find Identical) может помочь вам локализовать и удалить дубликаты.
- Какая Концептуализация пространственных отношений является подходящей? Какое значение Диапазона расстояний или Порогового расстояния подходит наилучшим образом?
Рекомендованная (по умолчанию) Концептуализация пространственных отношений для Анализа горячих точек (Getis-Ord Gi*) — Фиксированный диапазон расстояний. Также могут использоваться такие значения, как Пространственно-временное окно, Зона индифферентности, Примыкание, K Ближайший сосед и Триангуляция Делоне. Для дискуссии о лучших методах и стратегиях определения значения расстояния для анализа, смотрите Выбор Концептуализации пространственных отношений и Выбор Фиксированного расстояния. Дополнительные сведения о пространственно-временном анализе горячих точек см. в разделе Пространственно-временной анализ.
- Какой вопрос?
Это может казаться очевидным, но то, как вы создаете Входное поле для анализа определяет тип вопросов, которые вы можете задать. Интересуетесь ли вы больше зависимостью, где у вас есть много инцидентов, или зависимостью, где высокие/низкие значения для определенного атрибута кластеризуются в пространстве? Если так, запустите Анализ горячих точек по предварительным значениям или по предварительному количеству инцидентов. Этот тип анализа особенно полезен для типов проблем распределения ресурсов. Альтернативно (или в добавление), вы можете интересоваться расположением областей с неожиданно высокими значениями относительно некоторой другой переменной. Если Вы, например, анализируете потери права выкупа, то вы, вероятно, ожидаете больше потерь права выкупа в местоположениях с большим количеством домов (говоря иначе, на некотором уровне, вы ожидаете, что число потерь права выкупа будет функцией числа домов). Если вы разделите число потерь права выкупа закладной на число домов, и затем запустите инструмент анализа горячих точек для этого соотношения, вы больше не будете спрашивать "Где потери права выкупа закладной происходят в больших количествах?"; вместо этого вы будете спрашивать "Где потери права выкупа закладной происходят в неожиданно больших количествах, учитывая число домов?" Создавая уровень или отношение до анализа, Вы можете управлять определенными ожидаемыми связями (например, число преступлений - функция населения; число потерь права выкупа - функция жилищного фонда), и идентифицируйте неожиданные горячие/холодные пятна.
Практическое применение
- Содержит ли Входной класс объектов (Input Feature Class) по меньшей мере 30 объектов? Результаты ненадежны при использовании менее 30 объектов.
- Подходит ли выбранная вами Концептуализация пространственных отношений (Conceptualization of Spatial Relationships)? Для этого инструмента рекомендуется применение метода Диапазон фиксированного расстояния. Для получения дополнительной информации о пространственно-временном анализе горячих точек см. Выбор Концептуализации пространственных взаимоотношений.
- Выбранный вами Диапазон расстояний и Пороговое расстояние (Distance Band or Threshold Distance) подходящий? См. Выбор Фиксированного расстояния (Fixed Distance).
- Все объекты должны иметь, по крайней мере, одного соседа.
- Никакой из объектов не должен иметь всех других объектов в качестве соседей.
- Особенно, если значения в Входном поле (Input Field) искажены, вам потребуется, чтобы у каждого объекта было не менее 8 соседей.
Возможные приложения
Применения могут быть найдены в анализе преступлений, эпидемиологии, голосовании, экономической географии, розничной торговле, транспортном анализе и демографии. Некоторые примеры включают следующее:
- Где сконцентрирована вспышка болезни?
- Где пожары на кухне составляют высокую долю среди прочих бытовых пожаров?
- Где следует расположить центры эвакуации?
- Где/Когда действительно случаются пики интенсивности?
- Каким местоположениям и на протяжении каких периодов времени мы должны выделять больше наших ресурсов?
Дополнительные ресурсы
Энди Митчелл (Mitchell, Andy). The ESRI Guide to GIS Analysis, Volume 2.ESRI Press, 2005.
Getis, A. and J.K. Ord. 1992. "The Analysis of Spatial Association by Use of Distance Statistics" (Анализ пространственный взаимосвязей с использованием статистики расстояний) в Geographical Analysis 24(3).
Ord, J.K. and A. Getis. 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" (Статистика местной пространственной автоматической корреляции: вопросы распределения и применения) в Geographical Analysis 27(4).
Видеоролики, посвященные Анализу горячих точек
- Часть 1: Выбор Концептуализации пространственных отношений
- Часть 2: Выбор подходящего диапазона расстояний
- Часть 3: Понимание Ваших результатов
- Анализ горячих точек в данных о вызовах службы спасения (выберите использование инструментов пространственной статистики)
Scott, L. and N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools (Расширенный анализ преступности с использованием инструментов пространственной статистики ArcGIS) в ArcUser Online, April–June 2005.