Как работает инструмент Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation)

При большом объеме анализируемых пространственных данных очень важен масштаб анализа. Концептуализация пространственных отношений по умолчанию для инструмента Анализ горячих точек районов (Hot Spot Analysis)FIXED_DISTANCE_BAND, при этом требуется указать значение расстояния. Многие инструменты обработки плотностей требуют указания Радиуса. Выбранное расстояние должно быть связано с масштабом вопроса, на который вы пытаетесь ответить, или масштабом устранения последствий. Предположим, что вы хотите проанализировать степень ожирения среди детей. Каков масштаб вашего анализа? Это отдельные семьи или целые районы? В этом случае расстояние, используемое для определения масштаба анализа, будет небольшим, чтобы охватить дома в одном или двух кварталах друг от друга. Или же, каким будет масштаб устранения последствий? Возможно, рассматриваемый вопрос учитывает наличие фитнес-программ после школы для сокращения ожирения. В этом случае расстояние должно отражать школьные зоны. Иногда определить нужный масштаб довольно легко. Если вы изучаете закономерности ежедневных поездок в город из пригородов и знаете, что среднее расстояние поездки составляет 15 км, вы можете использовать для анализа фиксированное расстояние в 15 км. В других ситуациях обосновать расстояние анализа сложнее. В этом случае инструмент Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation) очень полезен.

Когда вы видите пространственную кластеризацию ландшафта, вы видите доказательства работы внутренних пространственных процессов. Знание о пространственном масштабе, в котором будут работать базовые процессы, может помочь вам выбрать необходимое расстояние анализа. Инструмент Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation) запускает инструмент Пространственная автокорреляция (Глобальный индекс Морана I) (Spatial Autocorrelation (Global Moran’s I)) с последовательностью увеличивающимися расстояниями для измерения интенсивности пространственной кластеризации для каждого расстояния. Интенсивность кластеризации определяется z-оценкой. Обычно при увеличении расстояния растет и z-оценка, что указывает на повышенную интенсивность кластеризации. Однако на определенном расстоянии возникает пик z-оценки. Иногда пиков несколько.

Иллюстрация инструмента Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation)

Пиковые z-оценки соответствует расстояниям, при которых пространственные процессы, обеспечивающие пространственную кластеризацию, наиболее выражены. Цвет каждой точки на графике соответствует статистической значимости значений z-оценок.

Цветовые обозначения статистической значимости

Одна из стратегий для определения нужного масштаба нужного анализа — выбрать расстояние, связанное со статистически значимым пиком, которое лучше всего отражает масштаб анализа. Зачастую это первый статистически значимый пик.

Как выбрать начальное расстояние и приращение расстояния?

Все измерения расстояния основываются на центроидах объектов, а значение параметра Начальное расстояние (Beginning Distance) по умолчанию является наименьшим расстоянием, которое гарантирует, что у каждого объекта есть хотя бы один соседний объект. Обычно это хороший вариант, если набор данных не содержит пространственные выбросы. Определите, есть ли у вас пространственные выбросы, а затем выберите все объекты, кроме объектов с выбросами, и запустите инструмент Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation) только для выбранных объектов. Если вы нашли пиковое расстояние для выбранного набора объектов, используйте это расстояние для создания файла матрицы пространственных весов на основе всех ваших объектов (даже выбросов). При запуске инструмента Построить матрицу пространственных весов (Generate_Spatial_Weights_Matrix) для создания файла матрицы пространственных весов установите для параметра Количество соседей (Number of Neighbors) определенное значение, чтобы у всех объектов было такое число соседних объектов.

Значение параметра Приращение расстояния (Increment Distance) — это среднее расстояние от каждого объекта до ближайшего к нему соседнего объекта. Если вы определили нужное начальное расстояние, используя стратегии, описанные выше, но не нашли пиковое расстояние, можно поэкспериментировать с меньшими или большими приращениями расстояния.

Что если на графике совсем нет пиков?

В некоторых случаях вы используете инструмент Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation) и получаете график с z-оценкой, которая постоянно растет при увеличении расстояний; пикового значения нет. Это чаще всего происходит, когда данные были объединены, а масштаб процессов, влияющих на переменную Входное поле (Input Field), меньше схемы агрегации. Вы можете попробовать уменьшить приращение расстояние и посмотреть, появятся ли более выраженные пики. Иногда пики не возникают из-за наличия в области изучения нескольких пространственных процессов, каждый из которых работает на разном расстоянии. Это часто происходит при работе с большими точечными наборами данных с множеством помех (без четкого пространственного шаблона для анализируемых данных). В этом случае нужно обосновать масштаб анализа с помощью других критериев.

Интерпретация результатов

При запуске инструмента Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation) на переднем плане результаты z-оценки для каждого расстояния записываются в окно Ход процесса (Progress). Результаты работы инструмента также отображаются в окне Результаты (Results). Если щелкнуть правой кнопкой мыши запись Сообщения (Messages) в окне Результаты (Results) и выбрать Вид (View), результаты можно будет просмотреть в диалоговом окне Сообщение (Message). Если вы указываете путь для дополнительного параметра Выходная таблица (Output Table), то создается таблица с полями Distance, MoransI, ExpectedI, Variance, z_score и p_value. Изучив значения z-оценок в окне Ход процесса (Progress), диалоговом окне Сообщение (Message) или в Выходной таблице, можно определить наличие пиковых расстояний. Однако чаще пиковые расстояния определяются по графику в дополнительном файле Выходного отчета. Этот отчет состоит из трех страниц. Пример первой страницы отчета приведен ниже. Учтите, что на этом графике три пиковые z-оценки, связанные с расстояниями 5000, 9000 и 13000 футов. Гало отображается для выделения первого пикового расстояния и максимального пикового расстояния, но все пики представляют расстояния, где процессы, обеспечивающие пространственную кластеризацию, наиболее очевидны. Можно выбрать пик, который лучше всего отражает масштаб анализа. В некоторых случаях показывается только одно гало, так как первый и максимальный пики находятся на одном расстоянии. Если ни один из пиков z-оценок не является статистически значимым, то ни для одного из них не будет отображаться светло-синее гало. Учтите, что цвет нарисованной z-оценки соответствует критическим значениям статистической значимости.

Отчет инструмента Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation), стр. 1

На второй странице отчета расстояния и z-оценки представлены в формате таблицы. На последней странице отчета показаны все настройки параметров, использованные при запуске инструмента. Чтобы получить файл отчета, укажите путь в параметре Выходной отчет (Output Report).

Дополнительные ресурсы

9/11/2013