Использование проверки для оценки моделей

Проверка позволяет оценить проинтерполированные значения с помощью набора данных, который не использовался для создания модели интерполяции.

Как и при перекрестной проверке, при проверке задаются следующие цели:

Шаги:
  1. Создайте поднаборы, которые будут использоваться для создания и проверки модели:
    1. Добавьте набор данных к ArcMap, который будет использоваться для поднабора.
    2. В раскрывающемся списке на панели инструментов ArcGIS Geostatistical Analyst Extension выберите инструмент Поднабор пространственных объектов (Subset Features).

      Откроется инструмент Поднабор пространственных объектов (Subset Features). Этот инструмент также можно открыть непосредственно из набора инструментов ArcGIS Geostatistical Analyst Extension Tools. Инструмент находится в группе Геостатические слои.

    3. Задайте набор данных для использования в поднаборе.
    4. Задайте имена и местоположения для создаваемых учебных и тестовых поднаборов.
    5. Задайте размер учебного поднабора. По умолчанию используется 50% данных, но можно задать другое процентное значение или определенное количество объектов, задав для параметра Единицы размера поднабора (Subset size units) значение ABSOLUTE_VALUE.
    6. Щелкните Готово.
  2. Создайте модель интерполяции.
    1. Щёлкните на кнопке Мастер операций геостатистики (Geostatistical Wizard) Мастер операций геостатистики (Geostatistical Wizard) на панели инструментов ArcGIS Geostatistical Analyst Extension.
    2. Используйте учебный набор данных для создания модели интерполяции.
  3. Выполните проверку с использованием тестового набора данных:
    1. После создания выходной поверхности щёлкните правой кнопкой мыши слой и выберите Проверка/Интерполяция (Validation/Prediction).

      Откроется диалоговое окно Слой в точки (Layer To Points).

    2. В поле Входной геостатистический слой (Input geostatistical layer) уже должны быть данные слоя, выбранного для проверки.
    3. В разделе Местоположения точек наблюдения (Point observation locations) задайте тестовый набор данных.
    4. Значение Поле проверки (Field to validate on) должно соответствовать полю (атрибуту), используемому для создания модели интерполяции.
    5. Задайте местоположение для файла в поле Выходная статистика для точечного местоположения (Output statistics at point locations).
    6. Нажмите ОК.
  4. Оцените результаты:
    1. Откройте таблицу атрибутов векторного слоя точечных объектов, созданную в предыдущем шаге. Для этого щёлкните правой кнопкой мыши слой и выберите команду Открыть таблицу атрибутов (Open Attribute Table).
    2. Выполните прокрутку вправо, чтобы найти поля Включено (Included), Проинтерполированное (Predicted) и Ошибка (Error). При оценке модели кригинга это могут быть другие поля, например: Стандартная ошибка (Standard Error), Нормированная ошибка (Standardized Error) и Нормальное значение (Normal Value).
    3. Щёлкните правой кнопкой мыши заголовок столбца Ошибка (Error) и щёлкните на Статистика (Statistics).

      Среднее значение должно быть близко к 0.

    4. Для вычисления среднеквадратической ошибки добавьте в таблицу атрибутов поле (определенное как double) с именем Error_squared. Щёлкните правой кнопкой мыши заголовок столбца и выберите команду Калькулятор поля (Field Calculator) для вычисления значений. Задайте выражение Error * Error. С помощью инструмента Статистика (Statistics) определите среднее квадратов ошибок. Наконец, вычислите квадратный корень из среднего значения. Полученный результат – среднеквадратическая ошибка, ее значение должно стремиться к 0.
    5. Щёлкните правой кнопкой мыши заголовок столбца Стандартная ошибка (Standard Error) и щёлкните на Статистика (Statistics).

      Среднее значение должно быть стремиться к 0. Оно также должно быть аналогично среднеквадратической ошибке.

    6. При проверке модели кригинга щёлкните правой кнопкой мыши заголовок столбца Нормированная ошибка (Standardized Error) и щёлкните на Статистика (Statistics). Среднее значение должно быть близко к 0.
    7. Также может оказаться полезным построить диаграмму рассеяния прогнозируемых значений относительно измеренных (исходный атрибут), чтобы посмотреть, насколько близко точки находятся к линии, проложенной под углом 45 градусов.

Связанные темы

5/10/2014