Выполнение проверки и перекрестной проверки

Прежде чем создавать окончательную поверхность, необходимо понять, насколько точно модель позволяет интерполировать значения в неизвестных точках. Перекрестная и обычная проверки помогают принять обоснованное решение относительно выбора модели, которая обеспечит лучшую интерполяцию. Вычисление статистики служит инструментом диагностики, который показывает, приемлемы ли модель и/или значения связанных с ней параметров.

Перекрестная и обычная проверки основаны на следующем принципе — удаление одного или нескольких местоположений данных и интерполяция связанных с ними значений с использованием данных в оставшихся местоположениях. Таким образом, можно сравнить интепролируемое значение с наблюдаемым и получить полезную информацию о качестве модели кригинга (например, о параметрах вариограммы и окрестности поиска).

Перекрестная проверка

Перекрестная проверка использует все данные для оценки моделей тренда и автокорреляции. В ходе этой проверки по очереди удаляются все местоположения данных и интерполируется связанное значение. Например, на приведенной ниже схеме показаны 10 точек данных. Перекрестная проверка пропускает точку (красную точку) и рассчитывает значение в этом местоположении, используя 9 остальных точек (синие точки). Затем выполняется сравнение интерполируемого и фактического значений в месте пропущенной точки. Эта процедура повторяется для второй точки и т. д. Перекрестная проверка сравнивает измеренные и интерполируемые значения для всех точек. В некотором смысле перекрестная проверка немного «обманывает», используя все данные для оценки моделей тренда и автокорреляции. По завершении перекрестной проверки некоторые местоположения данных могут быть исключены как аномальные, что потребует исправления моделей тренда и автокорреляции.

Перекрестная проверка (Cross validation)

Перекрестная проверка выполняется автоматически, и ее результаты отображаются в последнем шаге мастера геостатистики (Geostatistical Wizard). Перекрестную проверку можно также выполнить вручную с помощью инструмента геообработки Перекрестная проверка (Cross Validation).

Проверка (Validation)

При обычной проверке сначала удаляется часть данных (тестовый набор данных), а затем на основе оставшихся данных (учебного набора данных) разрабатываются модели тренда и автокорреляции, которые будут использоваться для интерполяции. В ArcGIS Geostatistical Analyst Extension для создания тестового и учебного наборов данных применяется инструмент Создать поднабор (Create Subset). В остальном типы графиков и сводной статистики, которые используются для сравнения интерполируемых и истинных значений, одинаковы для обычной и перекрестной проверок. Обычная проверка создает модель только для поднабора данных, поэтому она не позволяет проверить напрямую окончательную модель, которая должна включать все доступные данные. Обычная проверка позволяет удостоверить правильность протокола решений, например касающихся выбора модели вариограммы, размера лага и окрестности поиска. Если протокол решений работает для проверки, это гарантирует, что он также будет работать для всего набора данных.

Проверку модели можно выполнить с помощью инструмента геообработки Слой GA в точки (GA Layer to Points). Более подробно о проверке модели см. в разделе Использование проверки для оценки моделей.

Графики

ArcGIS Geostatistical Analyst Extension предусматривает несколько диаграмм и сводок по сравнению измеренных значений с интерполируемыми. Ниже приведена диаграмма рассеивания интерполируемых значений относительно истинных. Можно было бы ожидать, что точки должны рассеиваться относительно линии 1:1 (черная пунктирная линия на приведенном графике). Однако уклон обычно меньше 1. Это особенность кригинга, который обычно при интерполяции занижает большие значения и завышает малые, как показано на следующем рисунке.

Изображение диаграммы рассеивания

Подобранная линия, проходящая через область рассеивания точек, показана синим цветом, а уравнение приведено сразу под графиком. График ошибок аналогичен графику интерполяции, только измеренные значения вычитаются из прогнозируемых значений. Для графика нормированных ошибок разность измеренных и прогнозируемых значений делится на оценку стандартных ошибок кригинга. Все эти три графика показывают точность интерполяции кригинга. Если все данные независимые (нет автокорреляции), то все проинтерполированные значения будут одинаковыми (каждый интерполяция будет представлять собой среднее измеренных данных), поэтому синяя линия станет горизонтальной. При наличии автокорреляции и хорошей модели кригинга синяя линия будет приближаться к линии 1:1 (черный пунктир).

Окончательный график — это график КК. Он показывает квантили разности между интерполируемыми и измеренными значениями, а также соответствующие квантили из стандартного нормального распределения. Если отклонения интерполируемых значений от истинных значений распределены по нормальному закону, точки должны располагаться примерно вдоль серой линии. Если ошибки распределены по нормальному закону, можно уверенно использовать методы, основанные на этом законе (например, карты квантилей в простом кригинге).

График КК

Статистика ошибок интерполяции

Наконец, ниже приведены некоторые сводные статистические данные по ошибкам интерполяции кригинга. Используйте эти данные для диагностики.

Сводная статистика кригинга для ошибок интерполяции

Связанные темы

5/10/2014