Геостатический рабочий поток
В этой главе подробно описывается генерализованный рабочий поток для геостатических исследований и объясняются его основные шаги. Как уже упоминалось в главе Что такое геостатистика, геостатистика — это класс статистических данных, использующихся для анализа и прогнозирования значений, связанных с пространственным или пространственно-временным явлением. ArcGIS ArcGIS Geostatistical Analyst Extension предоставляет набор инструментов, позволяющих создавать модели, использующие эти пространственные (и временные) координаты. Эти модели могут быть применены в широком ряде сценариев, обычно они используются для интерполяции значений внеопорных местоположениях и измерения неопределенности этой интерполяции.
Первый шаг, как и почти в любом многостраничном исследовании, — это тщательное изучение данных. Этот процесс начинается с картографирования набора данных с использованием классификации и цветовой схемы, позволяющих доступно отобразить важные характеристики, которые может содержать набор данных, например значительное увеличение значений с севера на юг (тренд — см. Анализ_тренда), сочетание больших и маленьких значений без определенного порядка (возможно, это знак, что данные были отобраны при масштабе, не отображающем пространственную корреляцию, — см. раздел Изучение пространственной_структуры_и _направленной_вариации) или более плотно отобранные зоны (преференциальная выборка), что может привезти к решению использовать декластеризованное взвешивание в анализе данных. См. Использование_декластеризации_для настройки префернциальной выборки. Для более подробного обсуждения картографирования и схем классификации см. раздел Картографирование данных.
Вторая стадия — это построение геостатистической модели. Это может вызывать несколько шагов в зависимости от целей изучения (то есть тип (типы) информации, которую предположительно предоставляет модель) и характеристик набора данных, которые считались достаточно важными для включения. На этой стадии информация, собранная во время тщательного исследования набора данных, и первичные знания о явлении, определяют уровень сложности модели и степень точности интерполируемых значений и мер неопределенности. На рисунке выше построение модели может вызвать предварительную обработку данных для удаления пространственных трендов, смоделированных отдельно и добавленных в итоговый шаг процесса интерполяции (см.Анализ_тренда), преобразование данных для большего соотвествия Гауссову распределению (которое является обязательным для некоторых методови выходных аднных моделей — см. Изучение_распределения_данных), и декластеризацию наборов данных для компенсации преференциальной выборки. Тогда как большое количество информации можно получить, тщательно исследуя набор данных, тем не менее важно включить любые сведения, которые у вас могут быть об этом явлении. Разработчик не может полагаться только на набор данных, чтобы показать все важные характеристики. Те характеристики, которые не отобразятся, все еще могут быть включены в модель путем настройки значений параметров для отображения ожидаемого итога. Очень важно, чтобы модель была реалистичной, насколько это возможно, для точного представления интерполируемых значений и связанных с ними неопределенностей в качестве характеристики реального явления.
Кроме предварительной обработки данных, в наборе данных может быть необходимо смоделировать пространственную структуру (пространственную корреляцию). Некоторые методы, такие как кригинг, требуют тщательного моделирования с использованием функций вариограммы или ковариации (см. Функции вариограммы_и ковариации), тогда как другие методы, такие как обратные взвешенные расстояния, полагаются только на предполагаемую степень пространственной структуры, которую проектировщик должен предоставить на основе предварительных сведений об явлении.
Итоговым компонентом модели является поиск стратегии. Стратегия определяет, как много точек данных будет использоваться для вычисления значения для неопорного местоположения. Также можно задать их пространственную конфигурацию (положение относительно друг друга и неопорного местоположения). Оба фактора влияют на интерполируемое значение и связанную с ним неопределенность. Для большинства методов задан поиск эллипса вместе с количеством секторов эллипса, и количеством точек, взятых из каждого сектора, для интерполяции (см. Поиск _окрестности).
После того как модель будет полностью задана, она будет использована вместе с набором данных для создания интерполируемых значений для всех неопорных местоположений, находящихся в области интереса. Итогом обычно является создание карты, показывающей значения моделируемой переменной. Итог выпадающих значений может быть исследован на этой стадии, поскольку эти значения, возможно, изменят значения параметра модели, и таким образом изменится интерполяция карты. В зависимости от метода интерполяции, также можно использовать похожую модель для вычисления мер неопределенности интерполируемых значений. Не все модели имеют эту возможность, поэтому важно вначале задать, необходимы ли измерения неопределенности. Это, в свою очередь, определит, какая из моделей является подходящей (см. Дерево классификации).
Поскольку используются все типы моделирования, результат моделирования необходимо проверить, то есть убедиться, что интерполируемые значения и связанные с ними меры неопределенности являются значимыми и соответствуют ожиданиям.
После построения соответствующей модели, ее настройки и проверки результата, полученные результаты могут быть использованы в анализе рисков и принятия решений.