Как работает метод обратных взвешенных расстояний

Метод обратных взвешенных расстояний (IDW) однозначно предполагает, что объекты, которые находятся поблизости, более подобны, чем объекты, удаленные друг от друга. Чтобы проинтерполировать значение для неизмеренного положения, IDW использует измеренные значения вокруг интерполируемого местоположения. Наиболее близкие к проинтерполированному местоположению измеренные значения оказывают большее влияние на прогнозируемое значение, чем удаленные от него на значительное расстояние. IDW предполагает, что каждая измеренная точка оказывает локальное влияние, которое уменьшается с увеличением расстояния. Это придает больший вес точкам, расположенным ближе всего к интерполируемому местоположению. Вес точки уменьшается как функция от расстояния. Поэтому метод носит название обратных взвешенных расстояний. Веса, назначенные точкам данных, представлены в следующем примере:

+++ Окрестность поиска (Search Neighborhood)

Окно Weights (Веса) содержит список весов, назначенных каждой точке данных, которая используется для интерполяции значения в местоположении, отмеченном перекрестием.

Более подробно о методах интерполяции в ArcGIS ArcGIS Geostatistical Analyst Extension

Степенная функция

Как было указано выше, веса пропорциональны обратным расстояниям (между точкой данных и интерполируемым местоположением), возведенными в степень p. В результате по мере увеличения расстояния вес будет стремительно уменьшаться. Степень уменьшения весов зависит от значения p. Если p = 0, вес с расстоянием не будет уменьшаться, а поскольку все веса λi одинаковы, то проинтерполированное значение будет равно среднему всех значений данных в окрестности поиска. По мере увеличения значения p веса отдаленных точек будут стремительно уменьшаться. Если значение p слишком высоко, то на интерполяцию окажут влияние только точки, расположенные в непосредственной близости.

Веса IDW

ArcGIS Geostatistical Analyst Extension использует значения степени, большие или равные 1. При p = 2 метод известен под названием «метод обратных взвешенных расстояний, возведенных в квадрат». P = 2 используется как значение, установленное по умолчанию, хотя теоретическое обоснование для предпочтения этого значения отсутствует. Влияние изменения значения p должно исследоваться с помощью просмотра выходных данных и проверки перекрестных статистических данных.

Оптимальное значение степени может быть определено минимизацией среднеквадратичной ошибки интерполяции (RMSPE). RMSPE — это статистическая величина, которая рассчитывается во время перекрестной проверки. RMSPE определяет ошибки интерполируемой поверхности. Модуль ArcGIS Geostatistical Analyst Extension выполняет оценку нескольких значений степени для определения того значения, которое выдает наименьшую ошибку RMSPE. Рисунок внизу иллюстрирует вычисление оптимальной степени модулем ArcGIS Geostatistical Analyst Extension. Ошибки RMSPE построены для нескольких различных значений степени, но с использованием одного набора данных. Кривая подобрана к точкам (квадратичная интерполяция по методу локальных полиномов), и исходя из данных кривой, степень, которая обеспечивает наименьшую ошибку RMSPE, считается оптимальной.

График степенной функции

Окрестность поиска

Поскольку объекты, находящиеся поблизости друг от друга, более сходны, чем объекты, находящиеся на большом расстоянии, то по мере удаления от местоположений измеренные значения будут находиться в несущественных отношениях со значением проинтерполированного местоположения. Для увеличения скорости вычислений можно исключить большинство удаленных точек, которые оказывают незначительное влияние на интерполяцию. В результате общей принятой практикой стало ограничение количества измеренных значений с помощью определения окрестности поиска. Форма окрестности накладывает ограничения на дальность и место поиска измеренных значений, используемых для интерполяции. Другие параметры окрестности ограничивают местоположения, которые будут использоваться в форме. На следующем рисунке представлено пять измеренных точек (соседи), которые используются для прогнозирования значения в точке, где измерения не проводились (показана желтым цветом).

Сосед

Форма окрестности оказывает влияние на входные данные и поверхность, которую необходимо создать. При отсутствии направленных воздействий на данные можно рассматривать точки одновременно во всех направлениях. Для этого определите окрестность поиска как окружность. Но если присутствует направленное воздействие на данные, например преобладающий ветер, можно изменить форму окрестности поиска на эллипс с большой осью, параллельной ветру. Настройка на такое направленное воздействие оправдана, поскольку известно, что положения с наветренной стороны от интерполируемого местоположения более сходны на отдаленных расстояниях, чем положения, которые перпендикулярны ветру, но расположены ближе к интерполируемой точке.

После определения формы окрестности можно наложить ограничение на использование местоположения точек данных в этой окрестности. Можно задать максимальное и минимальное количество положений для использования и разделить окрестность на сектора. При разделении окрестности на сектора к каждому сектору применяются максимальные и минимальные ограничения. Несколько различных секторов, которые могут использоваться, приведены ниже.

Сектора окрестности

Точки, выделенные в виде данных, демонстрируют положения и веса, которые используются для интерполяции местоположения в центре эллипса (положение перекрестия). Окрестности поиска ограничиваются внутренним пространством эллипса. В примере, приведенном ниже, вес точки (красной) в южном секторе и двух точек (красных) в западном секторе составит более чем 10 %. В южном секторе вес точки (коричневой) составит 5–10 %. Веса остальных точек окрестности поиска будут ниже.

Вес сектора окрестности

Когда используется IDW

Профиль обратных взвешенных расстояний (Inverse Distance Weighted)

Поверхность, рассчитанная с помощью IDW, зависит от выбора степени (p) и стратегии поиска окрестности. IDW — это жесткий интерполятор, в котором минимальные и максимальные значения (см. рисунок выше) на интерполированной поверхности могут встречаться только в опорных точках. Выходная поверхность чувствительна к кластеризации и наличию выпадающих значений. IDW предполагает, что смоделированные явления приводятся в действие локальными изменениями, которые могут быть получены (смоделированы) с помощью определения подходящей окрестности поиска. Так как IDW не предусматривает вычисление стандартных ошибок интерполяции, обоснование использования этой модели может быть проблематичным.

9/11/2013