Geostatistical Analyst 的基本词汇
下列术语和概念经常出现在地统计和 Geostatistical Analyst 中。
术语 |
描述 |
---|---|
交叉验证 |
一种用于评估插值模型的准确程度的方法。在 Geostatistical Analyst 中,交叉验证会将一个点排除在外,然后使用其余点预测该位置处的值。然后将排除的点重新添加到数据集中,再移除另外一个点。对数据集中所有样本执行此操作,并提供可比较的预测值和已知值对以评估模型的性能。结果通常被归纳为“平均”误差和“均方根”误差。 |
确定性方法 | 在 Geostatistical Analyst 中,确定性方法将根据测量点基于相似程度(例如反距离权重法)或平滑程度(例如径向基函数)创建表面。不提供对预测的不确定性(误差)的度量。 |
地统计图层 |
“地统计向导”生成的结果以及 Geostatistical Analyst 工具箱中的许多地理处理工具所生成的结果都被存储在称为地统计图层的表面数据中。地统计图层可用于生成结果图、查看和修正插值方法的参数值(通过在“地统计向导”中打开)、创建其他类型的地统计图层(如预测误差图)并将结果导出为栅格或矢量(等值线、填充的等值线和点)格式。 |
地统计方法 | 在 Geostatistical Analyst 中,地统计方法基于包含自相关(测量点之间的统计关系)的统计模型。这类方法可以生成预测表面,还提供对与这些预测相关的不确定性(误差)的度量。 |
插值 |
一个使用已知采样位置处获取的测量值预测(估算)未采样位置处的值的过程。Geostatistical Analyst 提供了多种插值方法,这些方法因生成不同类型的输出(例如,预测值及与之相关的误差 [不确定性])的基本假定、数据要求和能力的不同而有所差异。 |
核 |
Geostatistical Analyst 中提供的多个插值方法均使用加权函数。通常情况下,为接近预测位置的采样值分配较高权重,为远离预测位置的采样值分配较低权重。 |
克里金法 |
一组插值方法的集合,依赖空间自相关的半变异函数模型为研究区中的每个位置生成预测值、与预测相关联的误差以及其他有关可能值分布情况的信息(通过分位数及概率图或地统计模拟,后者将为每个位置提供一组可能值)。 |
搜索邻域 |
大多数插值方法都使用数据的本地子集进行预测。设想一个移动窗口,只有该窗口内的数据用于对窗口中心位置进行预测。这样做是因为在那些远离预测位置的样本中往往存在冗余信息,其目的是为了缩短为整个研究区生成预测值所需的计算时间。对邻域的选择(窗口内的附近样本数量及其空间配置)会影响到预测表面,因此应谨慎选择。 |
半变异函数 |
一个用于描述相隔不同距离的样本之间差异(方差)的函数。通常情况下,半变异函数在差异较小时显示低方差,在间隔距离较大时显示高方差,以表明该数据空间上自相关。根据样本数据估计的半变异函数称为经验半变异函数。它们表现为图形中的一组点。将根据这些点拟合函数,称为半变异函数模型。半变异函数模型是克里金法(一种强大的插值方法,可以为研究区域中的每个位置提供预测值、与预测相关联的误差以及有关可能值分布情况的信息)中的重要组成部分。 |
模拟 |
在地统计中是指一种通过生成多个可能版本的预测表面来扩展克里金法的方法(有别于只生成一个表面的克里金法)。预测表面集可提供大量的信息,这些信息可用于描述特定位置处预测值的不确定性、感兴趣区中预测值集的不确定性或可用作第二个模型(物质、经济等)的输入的预测值集,以便评估风险并做出更明智的决策。 |
空间自相关 |
自然现象通常会表现出空间自相关的态势,即距离较近的采样值要比距离较远的采样值更相似。插值方法中的一些需要空间自相关的显式模型(如克里金法),一些依赖假定的空间自相关度但不提供对其进行测量的方法(如“反距离权重法”),而另一些则不需要数据集中空间自相关的任何概念。请注意,当存在空间自相关时,使用传统的统计方法(依赖于观测值之间的独立性)将不再可靠。 |
变换 |
将某一函数(对数、Box-Cox、反正弦、常态得分)应用于数据时将执行数据变换,以更改数据分布的形状和/或稳定方差(例如,减少均值与方差之间的关系,即数据的变异性随着平均值的增加而增加)。 |
验证 |
与交叉验证类似,但不使用相同的数据集来建立和评估模型,而是使用两个数据集 - 一个用于建立模型,另一个用于对性能进行独立测试。如果只有一个数据集,则可使用“子集要素”工具将其随机分割为训练子集和测试子集。 |