Моделирование пространственных отношений

В этом документе содержится дополнительная информация о параметрах инструментов, а также описываются основные термины и понятия, важные для анализа данных с помощью Инструментов пространственной статистики. Используйте этот документ как справочник, когда вам потребуется дополнительная информация о параметрах инструмента.

ПримечаниеПримечание:
  • Расчеты, основанные на Евклидовом или Манхэттенском расстояниях, требуют использования проецированных данных, для точного измерения расстояний. Как следствие, когда проводимый анализ имеет дело с расстояниями (что практически всегда имеет место в случае пространственной статистики), требуется проецирование данных в Систему координат проекции (в противопоставление Географической системе координат, измеряемой в градусах, минутах, секундах).
  • Инструменты в наборе инструментов Пространственная статистика (Spatial Statistics) не работают напрямую со слоями событий. Данные событий XY следует до начала анализа преобразовать в класс пространственных объектов при помощи инструмента Копировать объекты (Copy Features).
  • При использовании шейп-файлов, помните, что в них нельзя хранить нулевые (null) значения. Инструменты или другие процедуры, создающие шейп-файлы из прочих входных данных, могут хранить значения NULL в виде 0 или оперировать ими как нулем. В некоторых случаях нули в шейп-файлах хранятся как очень маленькие отрицательные числа. Это может привести к неожиданным результатам. Дополнительные сведения см. в разделе Рекомендации по геообработке выходных данных шейп-файла.

Концептуализация пространственных отношений

Важное отличие между пространственной и традиционной (пространственной или непространственной) статистикой состоит в том, что пространственная статистика интегрирует пространство и пространственные отношения непосредственно в вычисления. Следовательно, многие инструменты из набора пространственной статистики требуют, чтобы значение параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships) было выбрано до выполнения анализа. Общая концептуальная модель (концептуализация) включает обратное расстояние, время в пути, фиксированное расстояние, K ближайших соседей и смежность. Концептуальная модель (концептуализация) пространственных отношений, которую вы используете, зависит от того, что именно вы измеряете. Если вы измеряете кластеризацию отдельных видов размножающихся семенами растений, вероятно, обратное расстояние подходит лучше всего. Однако, если вы оцениваете географическое распределение жителей пригородов, приезжающих на работу в город, время пути и стоимость пути будут лучше всего описывать пространственные отношения. Для некоторых видов анализа, пространство и время могут иметь меньшее значение, чем абстрактные концепции, такие как знакомство с чем-либо (чем более знакомо что-либо, тем большей функциональностью оно обладает) или пространственное взаимодействие (например, между Нью-Йорком и Лос-Анджелесом совершается значительно больше телефонных звонков, чем между Нью-Йорком и небольшим городом рядом с ним, таким как Покипси — можно предположить, что Лос-Анджелес и Нью-Йорк функционально ближе).

Инструмент Анализ группирования (Grouping Analysis) содержит параметр Пространственные ограничения (Spatial Constraints), и хотя опции параметры аналогичны описанным для параметра Концептуализация пространственных взаимоотношений (Conceptualization of Spatial Relationships), они используются по-разному. При наложении пространственного ограничения, только объекты с хотя бы одним соседом (что также определяется близостью, отношениями ближайшей окрестности или методами триангуляции) могут входить в одну группу. Дополнительные сведения и примеры см. в разделе Как работает инструмент Анализ группирования (Grouping Analysis).

Опции параметра Концептуализация пространственных отношений описываются ниже. Выбранные вами опции определяют взаимоотношения в окрестностях для инструментов, которые оценивают каждый пространственный объект в контексте окрестных объектов. К таким инструментам относятся Пространственная автокорреляция (глобальный индекс Морана I) (Spatial Autocorrelation (Global Moran's I)), Анализ горячих точек (Getis-Ord Gi*) (Hot Spot Analysis (Getis-Ord Gi*)) и Анализ кластеров и выбросов (Anselin локальный индекс Морана I) (Cluster and Outlier Analysis (Anselin Local Moran's I)). Обратите внимание, что некоторые из этих опций доступны только, если вы используете инструменты Построить матрицу пространственных весов (Generate Spatial Weights Matrix) или Построить матрицу пространственных весов для сети (Generate Network Spatial Weights).

Обратное расстояние, обратное расстояние в квадрате (сопротивление)

График обратных расстояний

При использовании опций обратного расстояния, концептуальная модель (концептуализация) пространственных отношений зависит от сопротивления, или затухания в зависимости от расстояния. Все пространственные объекты воздействуют/влияют на другие пространственные объекты, но, с увеличением расстояния, это влияние снижается. В общем случае, если вы используете концептуализацию обратных расстояний, вам потребуется ввести значение Диапазон расстояний или Пороговое расстояние (Distance Band or Threshold Distance) для сокращения количества необходимых вычислений, особенно для больших наборов данных. Если эти значения не указаны, вычисляется пороговое значение по умолчанию. Вы можете ввести все объекты в ближайшую окрестность, задав значение 0 для параметра Диапазон расстояний или пороговое расстояние (Distance Band or Threshold Distance).

Обратное евклидово расстояние подходит для моделирования непрерывных данных, например изменений температуры. Обратное манхэттенское расстояние лучше всего работает, если в анализе участвуют местоположения магазинов или других городских предприятий, в том случае, если данные дорожной сети недоступны. Концептуальная модель при использовании опции Обратные расстояния в квадрате (Distance Squared) не отличатся от модели, использующей обратные расстояния, за исключением случаев, когда уклон острее, и влияния соседей спадают быстрее и только ближайший сосед оказывает наиболее значимое влияние на вычисления для данного объекта.

Диапазон расстояний (сфера влияния)

График фиксированных расстояний

Для таких инструментов как Анализ горячих точек (Hot Spot Analysis) диапазон фиксированных расстояний выбирается как концептуализация по умолчанию. С помощью опции Диапазон фиксированных расстояний (Fixed Distance Band) вводится модель "сферы влияния" или "скользящего окна". Каждый пространственный объект анализируется в контексте окружающих его объектов, расположенных на расстоянии, заданном параметром Диапазон расстояний или пороговое расстояние (Distance Band or Threshold Distance). Соседи в пределах заданного расстояния имеют одинаковый вес. Пространственные объекты, находящиеся вне указанного расстояния, не оказывают влияния на вычисления (их вес принимается за 0). Используйте метод Диапазон фиксированных расстояний, если вы хотите оценить статистические параметры данных при определенном (фиксированном) пространственном масштабе. Если вы изучаете закономерности ежедневных поездок в город из пригородов и знаете, что среднее расстояние поездки составляет 15 миль, вы можете использовать для анализа фиксированное расстояние в 15 миль. В разделе Выбор фиксированного расстояния приведены стратегии, которые помогут определить соответствующий вашему анализу масштаб.

Зона индифферентности

Рисунок Зона индифферентности

Опция Зона индифферентности (Zone of Indifference) параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships) комбинирует модели Обратное расстояние (Inverse Distance) и Диапазон фиксированных расстояний (Fixed Distance Band). Пространственные объекты, расположенные в пределах диапазона расстояний или порогового расстояния, включаются в анализ целевого пространственного объекта. После достижения критического расстояния, уровень влияния (вес) быстро уменьшается. Предположим, вы ищите работу и выбираете между офисами, расположенными на расстоянии 5 и 6 миль от дома. В этом случае, расстояние, скорее всего, не будет иметь для вас большого значения. Теперь, предположим, что один офис расположен в 5 милях от дома, а другой — в 20 милях. В этом случае, расстояние становится существенным и не может не учитываться при принятии решения. Используйте этот метод, если вы хотите иметь фиксированный масштаб анализа, но не хотите ограничиваться жесткими рамками окрестных объектов включенных в вычисления для целевого объекта.

Смежность полигонов (первого порядка)

Для классов полигональных объектов можно выбрать опцию CONTIGUITY_EDGES_ONLY (которую иногда называют Rook's Case) или CONTIGUITY_EDGES_CORNERS (которую иногда называют Queen's Case). В рамках метода EDGES_ONLY полигоны, имеющие общее ребро (т. е. совпадающую границу), включаются в вычисления для целевого полигона. Полигоны, не имеющие общих ребер, исключаются из вычислений. В рамках метода EDGES_CORNERS полигоны, имеющие общее ребро и (или) угол, включаются в вычисления для целевого полигона. Если часть двух полигонов пересекается, они считаются соседями и включатся в соответствующие вычисления. Используйте одну из этих концептуальных моделей смежности с объектами-полигонами в том случае, если вы моделируете распространение некоторых типов инфекционных заболеваний или работаете с непрерывными данными, представленными в виде полигонов.

Ближайшая окрестность K

Отношения в окрестности можно также сконструировать так, что каждый пространственный объект будет доступен в пределах пространственного контекста, состоящего из заданного числа ближайших окрестностей. Если K (число окрестностей) равно 8, в вычисления для целевого пространственного объекта будут включены восемь ближайших окрестностей. В тех местах, где плотность пространственных объектов высока, пространственный контекст анализа будет меньше. Соответственно, если плотность объектов невелика, пространственный контекст анализа будет больше. Преимущество этой модели пространственных отношений состоит в том, что для каждого целевого объекта будет задано некоторое количество окрестностей, даже если плотность пространственных объектов в изучаемой области варьирует в широких пределах. Этот метод можно применить, когда вы работаете с инструментом Построить матрицу пространственных весов (Generate Spatial Weights Matrix). Опция K_NEAREST_NEIGHBORS со значением 8 для параметра Количество соседей (Number of Neighbors) — это концептуализация по умолчанию, используемая с инструментом Исследовательская регрессия (Exploratory Regression) для оценки невязок регрессии.

Триангуляция Делоне (естественная окрестность)

Опция Триангуляция Делоне создает окрестности методом построения треугольников Вороного по точечным объектам или по центроидам пространственных объектов, так, чтобы каждая точка/центроид становилась узлом (вершиной) треугольника. Узлы, соединенные ребрами треугольников, рассматриваются как окрестности. Использование триангуляции Делоне позволяет обеспечить для каждого пространственного объекта наличие хотя бы одной окрестности, даже если в данных присутствуют острова и/или плотность пространственных объектов меняется в широких пределах. Опцию DELAUNAY_TRIANGULATION не следует использовать для наборов данных с совпадающими объектами. Этот метод можно применить, когда вы работаете с инструментом Построить матрицу пространственных весов (Generate Spatial Weights Matrix).

Рисунок Триангуляция Делоне

Пространственно-временное окно

С помощью этой опции можно определить отношения объектов как в пространственном (фиксированное расстояние), так и во временном (фиксированный интервал) окне. Эта опция доступна при создании файла матрицы пространственных весов с помощью инструмента Построить матрицу пространственных весов (Generate Spatial Weights Matrix). При выборе опции SPACE_TIME_WINDOW также требуется указать Поле даты/времени (Date/Time Field), Тип интервала даты/времени (Date/Time Interval Type) (например, HOURS, DAYS или MONTHS) и Значение интервала даты/времени (Date/Time Interval Value). Значение интервала — целое число. Если вы выбрали опцию HOURS в качестве типа интервала и значение 3 как значение интервала, два объекта будут считаться соседями, если значения в поле Дата/Время (Date/Time) расположены в пределах трех часов друг от друга. С такой концептуализацией объекты будут соседями, если они расположены на определенном расстоянии и в пределах заданного временного интервала целевого объекта. В качестве примера можно выбрать опцию SPACE_TIME_WINDOW для параметра Концептуализация пространственных взаимоотношений (Conceptualization of Spatial Relationships), если требуется создать файл матрицы пространственных весов для использования инструмента Анализ горячих точек (Hot_Spot_Analysis), чтобы выявить горячие точки в пространстве-времени. Дополнительные сведения, в том числе о визуализации результатов, см. в разделе Пространственно-временной анализ.

Получение пространственных весов из файла (пространственные отношения, заданные пользователем)

Можно создать файл для хранения соседских отношений объектов с помощью инструмента Построить матрицу пространственных весов (Generate Spatial Weights Matrix) или Построить матрицу пространственных весов для сети (Generate Network Spatial Weights). Если вы хотите определить пространственные отношения с учетом времени или стоимости пути, определенных в сетевом наборе данных, создайте файл матрицы пространственных весов с помощью инструмента Построить матрицу пространственных весов для сети (Generate Network Spatial Weights), а затем используйте для анализа итоговый SWM-файл. Если пространственные отношения для ваших объектов заданы в таблице, можно использовать инструмент Построить матрицу пространственных весов (Generate Spatial Weights Matrix) для конвертации этой таблицы в файл матрицы пространственных весов (SWM). Определенные поля нужно включить в таблицу для использования опции CONVERT_TABLE и создания SWM-файла. Можно указать путь к форматированному текстовому ASCII-файлу, который задает пользовательскую концептуализацию пространственных отношений (например, на основе пространственных взаимодействий).

Выбор концептуализации пространственных отношений: рекомендации

Чем более точно вы сможете смоделировать взаимодействие пространственных объектов в пространстве, тем более точные результаты вы получите. Выбор параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships) должен отражать внутренние отношения между пространственными объектами, которые вы анализируете. Иногда на выбор могут влиять характеристики имеющихся данных.

Методы обратно-взвешенного расстояния, например лучше всего подходят для непрерывных данных или для моделирования процессов, в которых два объекта сближены в пространстве настолько, что с большей вероятностью оказывают влияние друг на друга. При такой пространственной концептуализации, каждый объект является потенциальной окрестностью любого другого объекта, и, при использовании больших наборов данных, количество вычислений может стать значительным. Всегда следует пытаться включить значение Диапазон расстояний или пороговое значение (Distance Band or Threshold Distance) при использовании концептуализации обратно-взвешенного расстояния. Это особенно важно для больших наборов данных. Если вы оставите параметр Диапазон расстояний или пороговое значение (Distance Band or Threshold Distance) пустым, пороговое расстояние будет вычислено автоматически, но оно может оказаться не вполне подходящим расстоянием для вашего анализа. По умолчанию пороговое расстояние равно минимальному расстоянию, которое гарантирует, что для каждого объекта имеется хотя бы одна окрестность.

Метод Диапазон фиксированного расстояния хорошо работает с точечными данными. Это опция по умолчанию, используемая инструментом Анализ горячих точек (Getis-Ord Gi*). Метод фиксированного диапазона расстояний хорошо работает с полигональными данными, имеющими различные размеры полигонов (большие полигоны по краям изучаемой области и очень маленькие полигоны в центре изучаемой области, например), если вам требуется обеспечить согласованный масштаб анализа. В нижеследующем разделе Выбор фиксированного расстояния приведены стратегии, которые помогут определить значение диапазона расстояний, подходящее для вашего анализа.

Концептуализация зоны индифферентности, хорошо работает при правильно подобранном Фиксированном расстоянии (Fixed Distance), но слишком резкие границы отношений окрестностей мешают точному представлению данных. Имейте в виду, что концептуализация Зоны индифферентности (Zone of Indifference), рассматривает каждый пространственный объект как окрестность другого объекта. Следовательно, эта опция не подходит для больших наборов данных, поскольку указанные значения Диапазона расстояний или порогового расстояния (Distance Band or Threshold Distance) не ограничивают число окрестностей, а только определяют, где интенсивность пространственных отношений начинает снижаться.

Концептуализация смежность полигонов, эффективна, когда полигоны имеют одинаковые размеры и однотипное распределение, а пространственные отношения являются функцией близости полигонов (если два полигона имеют общую границу, пространственное взаимодействие между ними возрастает). Если вы выбрали концептуализацию смежности полигонов, почти всегда потребуется выбрать нормализацию ряда (значений) для инструментов, которые имеют параметр Нормализация ряда (Row Standardization).

Опция K ближайших соседей (K nearest neighbors) эффективна, если вам необходимо задать минимальное количество окрестностей для анализа. Если значения, связанные с пространственными объектами, ассиметричны (не имеют нормального распределения), важно, чтобы каждый объект оценивался в контексте как минимум восьми (или около того) окрестностей. Если распределение данных в изучаемом районе неоднородно, т.е., некоторые пространственные объекты расположены очень далеко от всех остальных объектов, этот метод работает очень хорошо. Заметьте, однако, что пространственный контекст анализа меняется в зависимости от изменения плотности используемых пространственных объектов. Если фиксированный масштаб анализа имеет меньшее значение, чем фиксированное число окрестностей, можно использовать метод K ближайших соседей.

Некоторые аналитики рассматривают триангуляцию Делоне в качестве способа создания естественных окрестностей для набора пространственных объектов. Этот метод является хорошим вариантом, если ваши данные содержат островные полигоны (изолированные полигоны, которые не имеют общих границ с другими полигонами), или в тех случаях, когда пространственные объекты распределены слишком неравномерно. Эту опцию не следует использовать для наборов данных с совпадающими объектами. Так же, как и метод K ближайших соседей, триангуляция Делоне обеспечивает для каждого пространственного объекта наличие минимум одной окрестности, при этом на основе распределения данных определяется количество окрестностей, которое может быть присвоено каждому объекту.

Опции Окна пространства-времени (Space-Time Window) позволяют определить отношения объектов как с точки зрения пространственной, так и временной близости. Эта опция используется для определения горячих точек в пространстве-времени или формирования групп, членство в которых определяется близостью в пространстве и времени. Примеры пространственно-временного анализа, а также стратегии для эффективного отображения результатов такого анализа представлены в разделе Пространственно-временной анализ.

Для некоторых приложений пространственные взаимодействия лучше всего моделируются в терминах времени пути или расстояния пути. Если вы моделируете доступность до городских служб, например, или определяете "горячие точки" преступности, наилучшим выбором будет моделирование пространственных отношений в терминах сети. С помощью инструмента Построить матрицу пространственных весов (Generate Network Spatial Weights) создайте файл матрицы пространственных весов (SWM) до начала анализа, выберите GET_SPATIAL_WEIGHTS_FROM_FILE для вашего значения Концептуализации пространственных отношений (Conceptualization of Spatial Relationships), а затем для параметра Файл матрицы весов (Weights Matrix File), назначив полный путь к созданному SWM-файлу.

ПодсказкаПодсказка:

Набор данных Data and Maps for ArcGIS, бесплатный для пользователей ArcGIS, содержит данные StreetMap, включающие готовый набор сетевых данных в формате SDC. Этот набор данных покрывает территорию США и Канады. Этими наборами сетевых данных можно пользоваться непосредственно с помощью инструмента Построить матрицу пространственных весов для сети (Generate Network Spatial Weights).

Если ни одна из опций параметра Концептуализация пространственных взаимоотношений (Conceptualization of Spatial Relationships) не подходит для вашего анализа, можно создать текстовый ASCII-файл или таблицу, содержащие отношения между пространственными объектами и использовать их для построения файла матрицы пространственных весов. Если одна из указанных выше опций соответствует, но не идеально подходит для ваших целей, можно использовать инструмент Построить матрицу пространственных весов (Generate_Spatial_Weights_Matrix) для создания базового SWM-файла, а затем изменить файл матрицы пространственных весов.

Выбор значения диапазона фиксированных расстояний

Представьте выбранный диапазон фиксированных расстояний в виде движущегося окна, которое быстро фокусируется на каждом пространственном объекте и рассматривает этот объект в контексте его окрестностей. Следующие правила помогут вам определить соответствующий вашему анализу диапазон расстояний:

  • Выбирайте дистанцию на основе знаний о географическом экстенте пространственных процессов, обеспечивающих кластеризацию изучаемого явления. Часто, вы не сможете узнать этого, но, если такая информация доступна, ее следует использовать для выбора значения расстояния. Предположим, например, вы знаете, что среднее расстояние ежедневного пути на работу составляет 15 миль. Для анализа этих данных, лучше использовать диапазон расстояний в 15 миль.
  • Используйте достаточно большой диапазон расстояний, чтобы каждый пространственный объект мог иметь как минимум одну окрестность, в противном случае результаты будут недействительными. Если данные распределены неравномерно (не позволяют получить ровную кривую при построении гистограммы), потребуется убедиться, что выбранный диапазон расстояний не является слишком малым (большинство пространственных объектов имеют только одну или две окрестности) или слишком большим (несколько объектов используют в качестве окрестности все остальные пространственные объекты), поскольку это может привести к получению недостоверных z-оценок. Z-оценки будут достоверны (даже при использовании неравномерно распределенных данных) в тех случаях, когда выбран достаточно большой диапазон расстояний, чтобы каждый пространственный объект мог получить несколько (около 8) окрестностей. Даже если ни у одного из объектов нет соседей среди других объектов, проблемы с производительностью и даже потенциальные ограничения памяти могут возникнуть, если создать диапазон расстояний, где у объектов будут тысячи соседей.
  • Иногда, если пытаться сделать так, чтобы у всех объектов был хотя бы один сосед, можно получить объекты с тысячами соседей, а это нежелательно. Это может произойти, если некоторые объекты являются пространственными выбросами. Чтобы устранить эту проблему, определите соответствующий диапазон расстояний для всех объектов, кроме выбросов и используйте инструмент Построить матрицу пространственных весов (Generate_Spatial_Weights_Matrix), чтобы создать файл матрицы пространственных весов с использованием этого расстояния. При запуске инструмента Построить матрицу пространственных весов (Generate Spatial Weights Matrix) укажите минимальное число соседей для параметра Количество соседей (Number of Neighbors). Например: предположим, что вы оцениваете доступ к здоровой пище в округе Лос-Анджелеса с использованием данных переписи. Вы знаете, что более 90 процентов населения живут в пяти километрах от магазинов. Если вы анализируете районы переписи, вы обнаружите, что расстояние между дорогами (на основе центроидов районов) в центральном районе в среднем равно 1000 метрам, но расстояние между районами в дальних районах превышает 18000 метров. Чтобы убедиться, что каждый пространственный объект имеет, по крайней мере, одного соседа, диапазон расстояний должен быть более 18000 метров, а такой масштаб анализа не подходит для исследуемого вопроса. Для решения задачи нужно создать файл матрицы пространственных весов для класса объектов района переписи с помощью инструмента Построить матрицу пространственных весов (Generate_Spatial_Weights_Matrix). Укажите для параметра Пороговое расстояние (Threshold Distance) значение 4800 метров (приблизительно три мили) и минимальное число соседей (допустим, 2) для параметра Количество соседей (Number of Neighbors). Так окрестность в 4800 метров будет применена ко всем объектам, кроме объектов, у которых нет хотя бы двух соседей на этом расстоянии. Для дальних объектов (и только для них) расстояние будет увеличено так, чтобы у каждого объекта было, по крайней мере, два соседа.
  • Используйте диапазон расстояний, который отражает максимальную пространственную автокорреляцию. Когда вы видите пространственную кластеризацию ландшафта, вы видите проявление работы внутренних пространственных процессов. Диапазон расстояний, который представляет максимальную кластеризацию, измеренную инструментом Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation), является расстоянием, на котором данный пространственный процесс проявляется наиболее активно или лучше выражен. Запустите инструмент Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation) и определите, при каком расстоянии полученные z-оценки будут максимальными. Используйте расстояние, обеспечивающее пиковые значения, для последующего анализа.
    ПримечаниеПримечание:

    Значения расстояний должны вводиться в тех же единицах, которые заданны в среде геообработки для выходной системы координат.

    • Каждое максимальное значение соответствует расстоянию, при котором процессы, обеспечивающие пространственную кластеризацию, наиболее выражены. Часто имеется несколько максимальных значений. В основном, максимальные значения, связанные с большими расстояниями, отражают широкие тренды (широкий тренд с востока на запад, например, где запад является гигантской "горячей точкой", а восток — гигантской "холодной точкой"). В общем случае более интересны максимальные значения, связанные с меньшими расстояниями, как правило, первый максимум.
    • Малозаметный пик часто означает наличие нескольких различных пространственных процессов, действующих при различных пространственных масштабах. Возможно, следует изучить другие критерии, чтобы определить фиксированное расстояние, которое следует использовать для данного анализа (или более эффективное расстояние для исправления полученных результатов).
    • Если z-оценка не демонстрирует пиков (другими словами, продолжает возрастать), а вы используете сгруппированные данные (например, округа), это обычно означает, что схема группировки слишком груба; интересующие вас пространственные процессы действуют при меньшем масштабе, чем масштаб группируемых единиц. Если вы можете использовать меньший масштаб анализа (перейти от округов к районам, например), это поможет определить необходимую дистанцию. Если вы работаете с точечными данными и z-оценка не достигает пика, то это означает, что в наличии множество различных пространственных процессов на разных пространственных масштабах. Вам потребуется использовать другой критерий для определения фиксированного расстояния в анализе. Также необходимо убедиться, что значение Начальное расстояние (Beginning Distance) при запуске инструмента Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation) не слишком велико.
    • Если не указать начальное расстояние, инструмент Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation) будет использовать расстояние, позволяющее получить для всех объектов хотя бы одного соседа. Если данные содержат пространственные выбросы, это расстояние может быть слишком большим для анализа, поэтому вы и не увидите выраженного пика в выходном файле отчета. Чтобы устранить эту проблему, запустите инструмент Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation) для выбранных объектов, из которых временно исключены все пространственные выбросы. Если после исключения выбросов удалось найти пик, используйте стратегию, описанную выше, с применением этого пикового расстояния ко всем объектам (в том числе пространственным выбросам) и укажите, чтобы у каждого объекта был минимум один или два соседа. Если вы не уверены в том, являются ли объекты пространственными выбросами:
      • При работе с полигональными данными отображайте области полигонов с помощью схемы отображения Стандартное отклонение и считайте полигоны с областями более трех стандартных отклонений пространственными выбросами. Можно использовать инструмент Вычислить поле (Calculate_Field) или Калькулятор Геометрии (Geometry Calculator) для создания поля с полигональными областями, если такое не существует.
      • Для точечных данных используйте инструмент Ближайший объект (Near), который вычисляет расстояние до ближайшего соседа каждого объекта. Для этого установите параметры Входные объекты (Input Features) и Ближайшие объекты (Near Features) так, чтобы они указывали на ваш набор данных. После получения поля с расстояниями до ближайшего соседа отобразите эти значения с помощью метода отображения Стандартное отклонение и считайте расстояния, превышающие три стандартных отклонения, пространственными выбросами.
    Иллюстрация инструмента Пошаговая пространственная автокорреляция (Incremental Spatial Autocorrelation)
  • Не следует считать, что существует только один правильный диапазон расстояний. В реальности все может быть сложнее. Весьма вероятно, что влияние на наблюдаемую кластеризацию оказывают несколько пространственных процессов. Вместо поиска одного диапазона расстояний, попытайтесь рассмотреть инструменты анализа структурных закономерностей в качестве эффективного метода изучения пространственных отношений при различных пространственных масштабах. Обратите внимание, что при изменении масштаба (изменении значения диапазона расстояний), появляется возможность изучения других задач. Предположим, вы исследуете входные данные. С небольшими диапазонами расстояний можно изучить закономерности в ближайшем соседстве, средние диапазоны расстояний могут отражать закономерности на уровне поселения или города, самые большие диапазоны расстояний используются для определения региональных закономерностей.

Метод расстояния

Многие инструменты из набора инструментов Пространственная статистика используют в вычислениях расстояние. Эти инструменты позволяют выбрать либо Евклидово, либо Манхэттэнское расстояние.

D = sq root [(x1–x2)**2.0 + (y1–y2)**2.0]

где (x1,y1) - координаты точки A, (x2,y2) - координаты точки B, а D - расстояние по прямой между точками A и B.

Евклидово расстояние (Euclidean Distance)
D = abs(x1–x2) + abs(y1–y2)

где (x1,y1) - координаты точки A, (x2,y2) - координаты точки B, а D - сумма вертикальной и горизонтальной разности между точками A и B. Это расстояние, которое необходимо пройти, если возможность перемещения ограничена только направлениями север-юг и запад-восток. Этот метод дает более точные результаты, чем Евклидово расстояние, если путь ограничен дорожной сетью и если стоимость перемещения по уличной сети не доступна.

Манхэттенское расстояние (Manhattan Distance)

Самопотенциал (поле, дающее интразональный вес)

Некоторые инструменты в наборе инструментов Пространственная статистика позволяют вычислить поле, представляющее вес, который используется для самопотенциала. Собственный потенциал — это расстояние или вес между объектом и этим же объектом. Часто вес имеет значение 0, но в некоторых случаях может потребоваться определить другое фиксированное или изменяющееся для каждого объекта значение. Если ваша концептуализация пространственных отношений основана на расстояниях в пределах или между переписными участками, то, например, вы можете решить смоделировать самопотенциал, чтобы отразить средние расходы на путешествие с учетом размеров полигона:

dii = 0.5*[(Ai / π)**0.5]

где dii — транспортные расходы, связанные с внутризональным путешествием для полигонального объекта i, и Ai — область, связанная с полигональным объектом i.

Нормализация

Нормализация ряда (Row standardization) рекомендуется, независимо от того, распределены ли объекты потенциально предвзято в зависимости от дизайна примера или от установленной схемы агрегации. Когда выбирается нормализация ряда, каждый вес делится на его сумму весов ряда (сумму весов всех соседних объектов). Взвешивание с нормализацией весов ряда значений часто используется с фиксированным расстоянием до соседних окрестностей и практически всегда используется для соседей, основанных на полигональной смежности. Это для того, чтобы смягчить смещение из-за того, что объекты имеют разное количество соседей. Нормализация ряда масштабирует все веса так, что они варьируют между 0 и 1, создавая относительную, а не абсолютную схему взвешивания. В любом случае, когда вы работаете с полигональными объектами, представляющими административные границы, вы, вероятно, захотите выбрать опцию Нормализации ряда.

Примеры:

Диапазон расстояний и Пороговое расстояние

Параметр Диапазон расстояний и пороговое расстояние (Distance Band or Threshold Distance) позволяет установить масштаб анализа для большинства концептуализаций пространственных отношений (например, обратного расстояния, фиксированного диапазона расстояний). Это положительное числовое значение, представляющее предельное расстояние. Объекты, расположенные за пределами указанного предельного расстояния, игнорируются в анализе для данного объекта. Однако для Зоны индифферентности, влияние объектов, расположенных вне приведенного расстояния сокращается в соответствие с близостью, в то время как расположенные в пределах порогового расстояния, рассматриваются в одинаковых условиях.

Выбор подходящего расстояния очень важен. Некоторые пространственные статистические показатели требуют для каждого объекта иметь как минимум одного соседа для того, чтобы анализ был надежный. Если значения, которое вы устанавливаете для параметра Диапазон расстояний и пороговое расстояние (Distance Band or Threshold Distance), слишком мало (и у некоторых объектов нет соседей), появится предупреждение и вам будет предложено увеличить расстояние. Инструмент Вычислить диапазон расстояний до числа соседних объектов (Calculate Distance Band from Neighbor Count) позволяет оценить минимальное, среднее и максимальное расстояния для указанного количества соседей, и может помочь вам определить подходящий диапазон расстояний для анализа. См. также Выбор фиксированного диапазона расстояний (Selecting a fixed distance band value) для дополнительных инструкций.

Когда значение не указано, рассчитывается пороговое расстояние по умолчанию. Приведенная ниже таблица демонстрирует, какие результаты выдают различные опции параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships) для каждого из трех возможных типов (отрицательные значения не действительны):

Обратное расстояние, обратное расстояние в квадрате

Фиксированный диапазон расстояний, Зона индифферентности

Близость полигонов, Триангуляция Делоне, К ближайших соседей

0

Пороговое и предельное значения не применяются; каждый объект - сосед для каждого другого объекта.

Неверно. Будет сгенерирована Ошибка выполнения.

Игнорировано.

пустой

Будет вычислено расстояние по умолчанию. Значение по умолчанию - это минимальное расстояние, которое гарантирует каждому объекту как минимум 1 соседа.

Будет вычислено расстояние по умолчанию. Значение по умолчанию - это минимальное расстояние, которое гарантирует каждому объекту как минимум 1 соседа.

Игнорировано.

положительное число

Ненулевое, положительное значение будет использовано как предельное расстояние; соседские взаимосвязи будут только существовать среди объектов в пределах этой дистанции.

Для Фиксированного диапазона расстояний, только объекты в пределах этого указанного предельного расстояния будут соседями. Для зоны индифферентности, объекты в пределах указанного предельного расстояния будут соседями; объекты за пределами этого расстояния тоже будут соседями, но будут иметь все меньший и меньший вес/влияние по мере увеличения расстояния.

Игнорировано.

Опции диапазона расстояний

Количество соседей

Укажите положительное целое число, чтобы представить количество соседей, которые должны быть включены в анализ. Когда для параметра Концептуализация пространственных отношений (Conceptualization of Spatial Relationships) выбрано значение K ближайших соседей (K Nearest Neighbors), каждый объект будет оценен в контексте ближайших К соседей (где К — указанное количество соседей). Если при запуске инструмента Построить матрицу пространственных весов (Generate Spatial Weights Matrix) для Обратного расстояния или Фиксированного диапазона расстояний (Inverse Distance or Fixed Distance Band) задать значение параметра Количество соседей (Number of Neighbors), каждый объект будет гарантированно иметь как минимум К соседей. При примыкании полигонов значение параметра Количество соседей (Number of Neighbors) применяется только к островным полигонам: K-ближайшие полигоны для каждого целевого островного полигона считаются при анализе соседями. Если для инструмента Построить матрицу пространственных весов (Generate Spatial Weights Matrix) задать значение параметра Максимальное количество соседей (Maximum Number of Neighbors), у каждого объекта будет не больше указанного числа соседей. Если для инструмента Анализ группирования (Grouping Analysis) указать значение параметра Количество соседей (Number of Neighbors), то в каждую группу будут включены близкие объекты. Например, если выбрать 6 соседей, то у объектов в группах, по крайней мере, один из шести ближайших объектов будет общим с другими объектами в группе.

Файл матрицы весов

Некоторые инструменты позволяют вам определить пространственные отношения среди объектов, указывая путь к матрице пространственных весов. Пространственные веса — числа, которые отражают расстояние, время, или цену между объектами в базе данных. Файл матрицы пространственных весов можно создать с помощью инструментов Построить матрицу пространственных весов (Generate Spatial Weights Matrix) или Построить матрицу пространственных весов для сети (Generate Network Spatial Weights), или использовать обычный ASCII-файл.

Когда файл матрицы пространственных весов - просто текстовый ASCII-файл, первая строка должна быть именем уникального поля ID. Это дает вам гибкость использовать любое числовое поле в вашем наборе данных в качестве ID; однако поле с ID должно быть целым и иметь уникальные значения для каждого объекта. После первой линии, файл пространственных весов должен быть форматирован в 3 колонки:

Например, предположим, что у вас есть 3 газовые станции. Поле, которое вы используете, как ID поле называется StationID, а ID объектов - 1, 2 и 3. Вы хотите смоделировать пространственные отношения между этими тремя станциями, используя время в пути в минутах. Вы можете создать ASCII-файл, который выглядит следующим образом:

ASCII-файл

Обычно, когда веса представляют расстояние или время, они обращаются (например, 1/10, когда расстояние 10 миль или 10 минут) для того, чтобы ближайшие объекты имели больший вес, нежели удаленные. Заметьте из файла весов выше, что газовая станция 1 в 10-ти минутах от газовой станции 2. Заметьте также, что время в пути - несимметрично в этом примере (время в пути от станции 1 до станции 3 - 7 минут, но время в пути от станции 3 до станции 1 - только 6 минут). Заметьте, что вес между станцией 1 и ей самой - 0, для станции 2 - пустое поле. Пустое поле означает 0.

Ручной ввод значений для матрицы пространственных весов - утомительная работа даже для маленьких наборов данных. Лучший подход — использовать инструмент Построить матрицу пространственных весов (Generate Spatial Weights Matrix) или быстро написать скрипт, чтобы выполнить эту задачу.

Файл матрицы пространственных весов (.swm)

Инструменты Построить матрицу пространственных весов (Generate Spatial Weights Matrix) или Построить матрицу пространственных весов для сети (Generate Network Spatial Weights) создадут файл матрицы пространственных весов (SWM), определяющий пространственные отношения между объектами в вашем наборе данных с учетом указанного параметра. Этот файл создается в двоичном формате, чтобы его нельзя было просматривать напрямую. Для просмотра или изменения отношений объектов в SWM-файле используйте инструмент Преобразовать матрицу пространственных весов в таблицу (Convert Spatial Weights Matrix to Table).

Если пространственные отношения между объектами хранятся в таблице, можно использовать инструмент Построить матрицу пространственных весов (Generate Spatial Weights Matrix) для конвертации этой таблицы в файл матрицы пространственных весов (SWM). В таблице должны присутствовать следующие поля:

Имя поля

Описание

<Уникальное имя поля ID>

Целое поле, которое существует во входящем классе объектов с уникальным ID для каждого объекта. Это от ID объекта.

NID

Целочисленное поле, содержащее ID соседних объектов. Это к ID объекта.

ВЕС

Это числовой вес, определяющий пространственные отношения между объектами: от объекта и к объекту. Большие значения отражают большие веса и более сильное влияние, или взаимодействие между двумя объектами.

Необходимые поля таблицы

Разделение файлов матриц пространственных весов

Результатом работы инструментов Построить матрицу пространственных весов (Generate Spatial Weights Matrix) и Построить матрицу пространственных весов для сети (Generate Network Spatial Weights) является SWM-файл. Этот файл связывается с входным классом объектов, полем уникального ID и выходной системой координат при создании SWM-файла. Другие люди могут продублировать пространственные отношения, которые вы определяете для анализа, используя SWM-файл и тот же входной класс объектов или класс объектов, связывающий все или часть объектов с соответствующим полем Уникальный ID (Unique ID). Особенно, если вы планируете поделиться вашими SWM-файлами с другими, попытайтесь избежать ситуации, когда ваша выходная система координат отличается от пространственной привязки, ассоциированной с входным классом объектов. Лучшая стратегия - перепроецировать Входной класс объектов, затем установить Выходную систему координат такую же, как и Входной класс объектов до создания файлов матрицы пространственных весов.

Связанные темы

9/11/2013