Geostatistical Analyst 快速浏览
Geostatistical Analyst 包括三个主要组件:
- 一组探索性空间数据分析 (ESDA) 图
- 地统计向导
- Geostatistical Analyst 工具箱,其中包括一系列专门用于扩展“地统计向导”功能以及允许对生成的表面进行进一步分析的地理处理工具
可通过 Geostatistical Analyst 工具条访问 ESDA 图和“地统计向导”,此工具条必须在启用 Geostatistical Analyst 扩展模块后立即添加到 ArcMap 视图中(请参阅启用 Geostatistical Analyst 扩展模块和将 Geostatistical Analyst 工具条添加到 ArcMap)。
探索性空间数据分析图
使用插值方法之前,应该先使用探索性空间数据分析工具对数据进行初步分析。此工具帮助您深入了解数据并为插值模型选择最适合的方法和参数。例如,如果要使用普通克里金法生成分位数图,则需要先检查输入数据的分布,因为这种特定方法假定数据呈正态分布。如果数据不呈正态分布,应该在插值模型中包含数据变换。第二个示例是您可能会使用 ESDA 工具检测数据的空间趋势,并且希望将某个步骤包括进来以将该趋势作为预测过程的一部分独立建模。
可通过 Geostatistical Analyst 工具条(如下所示)访问 ESDA 工具,包括以下内容:
- 直方图 - 检查数据集的分布和汇总统计数据。
- 正态 QQ 图和常规 QQ 图 - 分别评估数据集是否是正态分布以及研究两个数据集是否具有相似的分布。
- Voronoi 图 - 直观地检查数据集的空间可变性和稳定性。
- 趋势分析 - 查看并检查数据集的空间趋势。
- 半变异函数/协方差云 - 评估数据集的空间依赖性(半变异函数和协方差)。
- 交叉协方差云 - 评估两个数据集间的空间依赖性(协方差)。
下面显示了 ESDA 图。
用于浏览单个数据集的工具
下图显示了用于一次分析一个数据集的 ESDA 工具:
用于探索数据集之间关系的工具
下图显示了两个用于检查两个数据集间关系的工具:
地统计向导
可通过 Geostatistical Analyst 工具条访问“地统计向导”,如下所示:
“地统计向导”由一组动态页面组成,用于引导您完成构建插值模型和评估模型性能的全过程。在某个页面上进行的选择将决定接下来的页面上可用的选项以及如何与数据交互以开发适合的模型。从开始选择插值方法直到查看模型预期性能的汇总衡量指标,向导都会自动引导您执行各步操作。此工作流的简单版本(用于反距离权重插值)以图形方式表示如下:
在插值模型构建期间,向导可更改参数值,建议或提供优化的参数值,并允许您在过程中前进或后退来评估交叉验证结果,以查看当前模型是否符合要求或是否应该修改某些参数值。除了动态数据和表面预览以外,这种灵活性使得向导成为构建插值模型的强大环境。
“地统计向导”提供了对多种插值方法的访问,这些插值方法主要分为两种类型:确定性方法和地统计方法。
确定性方法
确定性方法包含的参数可控制 (1) 值的相似程度(例如反距离权重法)或 (2) 表面的平滑程度(例如径向基函数插值法)。这些方法并不基于随机空间过程模型,且数据中不存在空间自相关的显式测量或建模。确定性方法包括以下内容:
地统计方法
地统计方法假设至少某些自然现象中所观测到的空间变化可借助空间自相关通过随机过程进行建模,并需要对空间自相关显式建模。地统计方法可用于对空间模式进行描述和建模(变异分析)、预测未测量位置的值(克里金法)以及评估与未测量位置处的预测值相关联的不确定性(克里金法)。
地统计向导提供了多种类型的克里金法(适合不同类型的数据并具有不同的基本假定条件):
这些方法可用于生成以下表面:
- 克里金预测值图
- 与克里金预测值相关联的标准误差图
- 指示是否超出预定义临界水平的概率图
- 预先确定的概率水平的分位数图
下述情况例外:
- 指示克里金法和概率克里金法生成以下内容时:
- 指示是否超出预定义临界水平的概率图
- 指示器标准误差图
- 面插值生成以下内容时:
- 预测值图
- 与预测值相关联的标准误差图
Geostatistical Analyst 工具箱
Geostatistical Analyst 工具箱中所包括的工具可用于分析数据、生成各种输出表面、检查并将地统计图层转换为其他格式、执行地统计模拟和灵敏度分析以及辅助设计采样网络。所有工具被组合为五个工具集:
- 插值 - 包含地理处理工具,可执行插值运算(与地统计向导一样),可用作独立工具或在模型构建器和 Python 中使用
- 采样网络设计 - 包含辅助设计或修改现有采样设计/监控网络的工具
- 模拟 - 通过执行地统计模拟来扩展克里金法并可为点或面区域提取模拟结果
- 工具 - 此常用工具用于提取数据集的子集、执行交叉验证以评估模型性能、检查对半变异函数参数中变化的敏感度以及形象地表示插值工具所使用的邻域
- 使用地统计图层 - 包含的工具用于生成点位置的预测、以栅格和矢量格式导出地统计图层、检索并设置插值模型参数(在 XML 参数文件中)以及生成新的地统计图层(基于 XML 参数文件和数据集)
子集要素
虽然为“地统计向导”中所有可用的方法提供了交叉验证,并且使用“交叉验证”地理处理工具为所有地统计图层运行交叉验证,但评估输出表面质量的更严格方法是将预测值与未用于构建插值模型的测量值进行比较。由于并不总是能返回到研究区域采集独立验证数据集,一种解决方案是将原始数据集分成两部分。一部分可用于构建模型及生成表面。另一部分用于对输出表面进行比较和验证。“子集要素”工具可用于将数据集拆分成训练数据集和测试数据集。“子集要素”工具是一种地理处理工具(位于以上部分中介绍的 Geostatistical Analyst 工具箱中)。为方便起见,还可通过 Geostatistical Analyst 工具条访问此工具,如下图所示:
有关此工具及其使用方法的详细信息,请参阅 Geostatistical Analyst 中的子集要素的工作原理以及使用验证对模型进行评估。
构建插值模型的过程
Geostatistical Analyst 包含许多用于分析数据及生成多种输出表面的工具。由于调查的原因可能不同,建议分析和映射空间过程中使用地统计工作流中描述的方法:
- 表示数据 - 创建图层并在 ArcMap 中显示。
- 浏览数据 - 检查数据集的统计属性和空间属性。
- 选择适当的插值方法 - 应该根据研究目的、对现象的了解和需要模型提供的内容(作为输出)做出选择。
- 拟合模型 - 创建表面。“地统计向导”用于合适模型的定义和优化。
- 执行诊断 - 检查结果是否合理(符合预期),并使用交叉验证和验证评估输出表面。这将帮助您了解模型预测未采样位置处的值的能力。
“地统计向导”和 Geostatistical Analyst 工具箱都提供了许多插值方法。应该始终清楚地了解研究目的以及选择方法时预测值(和其他相关信息)如何帮助您做出更正确的决定。要需要指导,请参阅分类树获取不同方法的一组分类树。
(图中显示的数据由“阿拉斯加渔业科学中心”提供。)