Box-Cox、反正弦和对数变换

Geostatistical Analyst 中的一些方法要求数据呈正态分布。如果数据偏斜(分布不均衡),则可能需要将数据变换为正态分布。直方图和正态 QQ 图允许探索不同变换对数据集分布的不同作用。如果构建的插值模型使用某种克里金方法,并选择将变换数据作为其中一步,则在插值表面中预测值将变换回原始比例。

Geostatistical Analyst 允许使用多种变换,包括 Box-Cox(又称幂变换)、反正弦和对数。假设观测数据 Z(s),然后应用某种变换 Y(s) = t(Z(s))。通常要找到可使 Y(s) 呈正态分布的变换。经常发生的一种情况是,变换还生成在整个研究区域中都有恒定方差的数据。

了解有关变换和趋势的详细信息

了解有关 Box–Cox、反正弦和对数变换的详细信息

Box-Cox 变换

Box-Cox 变换为

Y(s) = (Z(s)λ - 1)/λ,

其中 λ≠ 0。

例如,假设数据由某种现象的计数组成。对于这些类型的数据,方差通常与平均值相关。也就是说,如果在某一部分研究区域中计数值很小,这一局部区域的变异性就小于计数值更大的另一区域的变异性。在这种情况下,平方根变换将有助于使整个研究区域内的方差更加恒定,通常还会使数据呈正态分布。平方根变换是 Box-Cox 变换中 λ = ½ 时的特例。

对数变换

对数变换实际上是 Box-Cox 变换中 λ = 0 时的特例;该变换如下所示:

Y(s) = ln(Z(s)),

其中 Z(s) > 0,ln 为自然对数。

对数变换通常用于呈正偏分布(如下所示)的数据,其中有些值非常大。如果这些大值位于研究区域中,对数变换有助于使方差更加恒定和归一化数据。就术语而言,在用克里金法实现对数变换时,预测方法称为对数正态克里金法,而在 λ 等于所有其他值时,关联的克里金方法称为高斯变换克里金法。

正偏分布

反正弦变换

反正弦变换如下所示:

Y(s) = sin-1(Z(s)),

其中 Z(s) 介于 0 到 1 之间。

反正弦变换可用于表示比例或百分比的数据。通常在数据为比例形式时,方差在接近 0 和 1 时最小,接近 0.5 时最大。反正弦变换有助于使整个研究区域内的方差更加恒定,通常还会使数据呈正态分布。

5/10/2014