Окрестности поиска
Можно предположить, что по мере удаления местоположений от места прогноза пространственная автокорреляция измеренных значений с интерполируемым местоположением уменьшается. Поскольку эти точки практически не влияют на прогнозируемое значение, их можно исключить из расчета для данного конкретного интерполируемого местоположения, определив окрестность поиска. Также возможно, что отдаленные местоположения окажут нежелательное влияние на интерполируемое значение, если они находятся в области, которая по своим характеристикам отличается от интерполируемого местоположения. Третья причина использования окрестностей поиска — скорость вычислений. При 2000 местоположениях данных матрица будет слишком большой для инвертирования и получить интерполируемое значение будет невозможно. Чем меньше окрестность поиска, тем быстрее можно получить прогнозируемые значения. Поэтому обычно ограничивают количество точек, используемых в интерполяции, путем задания окрестности поиска.
Определенная форма окрестности ограничивает дальность и место сбора измеренных значений, которые будут использоваться в интерполяции. Дополнительные параметры ограничивают местоположения, используемые в пределах окрестности поиска. Окрестность поиска можно изменить путем изменения ее размера и формы или путем изменения количества входящих в нее соседей.
На форму окрестности влияют входные данные и поверхность, которую нужно создать. Если в пространственной автокорреляции данных отсутствуют направленные воздействия (более подробно см. в разделе Учет направленных воздействий), целесообразно будет задействовать точки равномерно во всех направлениях, и тогда окрестность поиска будет иметь форму круга. Однако при наличии направленной автокорреляции или тренда в данных для окрестности может быть более приемлемой форма эллипса, главная ось которого параллельна направлению автокорреляции на макроуровне (направлению, в котором значения данных наиболее близки).
Окрестность поиска можно задать в мастере геостатистики (Geostatistical Wizard), как показано в следующем примере.
- Тип окрестности: стандартная
- Максимальное число соседей = 4
- Минимальное число соседей = 2
- Тип сектора (стратегия поиска): круг с четырьмя секторами со смещением 45°; радиус = 182955,6
- Координаты контрольной точки (x = -2084032, y = 89604,57)
- Проинтерполированное значение = 0,08593987
В разделе Веса (Weights) указаны весовые коэффициенты, которые используются для оценки значения в местоположении, обозначенном перекрестием на поверхности предварительного просмотра. Точки данных с самыми высокими весами выделены красным.
Когда форма окрестности определена, можно ограничить местоположения, которые будут использоваться, ее пределами. Можно определить максимальное и минимальное количество соседей и разделить окрестность на сектора, чтобы включить значения со всех направлений. В случае деления окрестности на сектора заданные ограничения максимального и минимального количества соседей применяются к каждому сектору.
Можно использовать несколько типов секторов.
- Один сектор (One sector)
- Эллипс с четырьмя секторами
- Эллипс с четырьмя секторами и 45-градусным смещением (выбран)
- Восемь секторов (Eight sectors)
Кригинг использует конфигурацию данных, заданную окрестностью поиска в сочетании с подобранной моделью вариограммы; веса для измеренных местоположений можно определить. Используя веса и измеренные значения, можно сделать интерполяцию для данного местоположения. Этот процесс выполняется для каждого местоположения в исследуемой области, чтобы создать непрерывную поверхность. Другие методы интерполяции используют ту же процедуру, но веса определяются при помощи приемов, в которых модель вариограммы не применяется.
При выборе метода Сглаженная интерполяция (Smooth Interpolation) создаются три эллипса. Центральный эллипс использует значения Большая полуось (Major semiaxis) и Малая полуось (Minor semiaxis). Внутренний эллипс использует эти значения полуосей, умноженные на разность единицы и значения Фактор сглаживания (Smoothing factor), а внешний эллипс — значения полуосей, умноженные на сумму единицы и фактор сглаживания. В интерполяции используются точки всех трех эллипсов. Для точек внутри самого малого эллипса веса назначаются так же, как в случае стандартной интерполяции (например, если используется интерполяция по методу обратных взвешенных расстояний, веса для точек внутри самого малого эллипса определяются на основе их расстояния от интерполируемого местоположения). Точкам между самым малым и самым большим эллипсами веса назначаются так же, как для точек внутри самого малого эллипса, но затем эти веса умножаются на сигмоидальное значение, которое уменьшается от 1 (для точек, расположенных рядом с самым малым эллипсом) до 0 (для точек, расположенных рядом с самым большим эллипсом). Точки данных, расположенные снаружи самого большого эллипса, имеют нулевой вес в интерполяции. Пример приведен ниже.
Исключения из вышеописанных правил.
- Площадная интерполяция, которая поддерживает только один сектор.
- Эмпирический байесовский кригинг, для которого требуется круглая окрестность поиска; поэтому параметры Большая полуось (Major semiaxis) и Малая полуось (Minor semiaxis) были заменены на параметр Радиус (Radius). Значение радиуса — это длина радиуса окружности поиска.
В ArcGIS Geostatistical Analyst Extension веса для всех моделей, не использующих кригинг, определяются функциями априорного анализа на основе расстояния от места интерполяции. Большинство моделей кригинга прогнозируют значение, используя взвешенную сумму значений для соседних местоположений. Кригинг использует вариограмму для определения весов, которые задают вклад каждой точки данных в интерполяцию новых значений в неизмеренных местоположениях. Поэтому окрестность поиска по умолчанию, используемая в кригинге, строится на основе большого и малого диапазонов модели вариограммы.
Предполагается, что непрерывная поверхность состоит из непрерывных данных, таких как наблюдаемые значения температуры. Однако все интерполяторы с локальной окрестностью поиска вычисляют проинтерполированное значение (и стандартные ошибки интерполяции), которые могут значительно различаться для соседних местоположений, если локальные окрестности различаются. Причины этого обстоятельства графически показаны в разделе Сглаженная интерполяция.