常态得分变换

某些插值方法和模拟方法需要正态分布的输入数据(有关这些方法的列表,请参阅检查数据的分布)。常态得分变换 (NST) 旨在通过变换数据集来使数据集的分布接近标准正态分布。常态得分变换会对数据集从最低值到最高值进行分级,并将这些级别与正态分布中产生的同等级别匹配。变换中的步骤如下:首先对数据集进行排序和分级,然后为数据集中每个级别找到标准正态分布中的同等对应级别,再用与这些级别关联的正态分布值构成变换后的数据集。可使用数据集的频率分布或累积分布来完成分级过程。

展示应用常态得分变换前后的直方图和累积分布的示例如下所示:

应用常态得分变换前后的直方图
应用常态得分变换前后的直方图

应用常态得分变换前后的累积分布
应用常态得分变换前后的累积分布

近似方法

在 Geostatistical Analyst 中,存在四种近似方法:直接近似法、线性近似法、高斯核近似法和乘偏斜近似法。直接法使用所观测的累积分布,线性法在累积分布的每个步骤之间对线进行拟合,高斯核方法通过拟合各部分累积正态分布的一种线性组合来逼近累积分布。乘偏斜法通过拟合基本分布(学生 t 分布、对数正态分布、gamma 分布、经验分布和对数经验分布)来逼近累积分布,该基本分布随后将被 beta 分布的拟合线性组合倾斜(通过逆概率积分变换完成倾斜)。对数正态基本分布、gamma 基本分布和对数经验基本分布只能用于正数据,而且预测值保证为正值。提供 Akaike 信息准则 (AIC) 来判断拟合模型的质量。

在“地统计向导”对变换的比例做出预测后,会自动将其变换回原始比例。选择哪种近似方法取决于您要做的假设以及近似的平滑度。直接方法的平滑度最低并且假设也最少;线性方法具有中等的平滑度和中等数量的假设。高斯核方法和乘偏斜方法具有平滑的反向变换,但它们假设数据分布可通过已知分布的有限组合进行逼近。

9/15/2013