不同的克里金模型

克里金方法依赖于数学模型和统计模型。通过添加包含概率的统计模型,可将克里金方法从空间插值的确定性方法中描述的确定性方法中分离出来。对于克里金法,您会将某种概率与预测值相关联;也就是说,这些值不能完全基于统计模型进行预测。以在某一地区测得的氮值这一样本为例。显然,即使样本很大,您也无法预测某个未测量位置处的准确氮值。因此,您不但要尝试预测该值,而且还要评估预测的误差。

克里金方法依赖于自相关概念。相关性通常被视为两种变量相关的趋势。例如,股票市场在利率降低时倾向于上涨,所以称其为负相关。但是,股票市场属于正向自相关,也就是说股票市场本身存在相关性。股票市场中,相隔一天的两个值比相隔一年的两个值更加相似。这与地理的基本原则相关,即距离较近的事物要比距离较远的事物更相似。相关性衰减的比率可表示为距离的函数。

自相关是距离的函数。这是地统计的定义功能。在经典统计法中,假定观测值是独立的,也就是说观测值间不存在相关性。在地统计中,使用空间位置的相关信息可以计算观测值间的距离并将自相关建模为距离的函数。

另请注意,股票市场通常随时间变化而上涨,其术语名词为趋势。地统计数据中也有相同的项,它们用下面的简单数学公式来表示:

Z(s) = µ(s) + ε(s),

其中,Z(s) 是感兴趣变量,可分解成确定性趋势 µ(s) 和随机的自相关误差形式 ε(s)。符号 s 仅标识位置;可将其视为包含空间 x(经度)和 y(纬度)坐标。基于此公式的各种变形构成了不同克里金法的基础。先看公式的右侧部分,然后再看公式的左侧部分。

无论模型中的趋势如何复杂,仍无法完全预测 µ(s)。在这种情况下,需要对误差项 ε(s) 做出一些假设;即,您希望它们为 0(通常情况)并且 ε(s) 与 ε(s + h) 间的自相关不依赖于实际位置 s,而仅依赖于两者之间的位移 h。这对于确保重复性以估算自相关函数很有必要。例如,在下图中:

自相关箭头

假设由箭头连接的一对位置处的随机误差具有相同的自相关。

接下来,检查趋势。趋势可以是简单的常数,即对于所有位置 s,µ(s) = m;如果 µ 未知,则此模型就是普通克里金法所依据的模型。趋势也可以由空间坐标本身的线性函数构成,例如:

µ(s) = ß0 + ß1x + ß2y + ß3x2 + ß4y2 + ß5xy,

这是二阶多项式趋势表面,并且仅关于空间 x 坐标和 y 坐标线性回归。如果趋势不同并且回归系数未知,则这类趋势可构成泛克里金法的模型。只要趋势完全已知(即已知所有参数和协变量),无论其是否为常数,该趋势都会构成简单克里金法的模型。

现在,请看分解式 Z(s) = µ(s) + ε(s) 的左侧。Z(s) 可执行变换。例如,可将该项更改为指示变量,也就是说,Z(s) 小于某值(例如,臭氧浓度 0.12 ppm)时,指示变量为 0,而该项大于某值时,指示变量为 1。您可能需要预测 Z(s) 大于阈值的概率,此时,基于此模型的预测值便构成了指示克里金法。您可以构建 Z(s) 的常规不确定变换,并称其为第 i 个变量的 fi(Z(si))。您可以基于变量的函数构建预测因子,例如,如果您要对位置 s0 进行预测,则使用数据 fi(Z(si)) 构建析取克里金法预测因子 g(Z(s0))。

最后,请考虑以下情况:您具有多种变量类型,并且要为第 j 种变量类型构建模型 Zj(s) = µj(s) + εj(s)。此时,您可以考虑每个变量的不同趋势,对于两种变量类型来说,除了误差 εj(s) 的自相关外,误差 εj(s) 与 εk(s) 之间还存在互相关。例如,您可以考虑两个变量(例如,臭氧浓度和微粒物质)间的互相关,并且这两个变量不需要在相同位置进行测量。基于多个感兴趣变量的模型便构成了协同克里金法的基础。您可以构建 Z(s) 的指示变量,如果使用协同克里金法模型中原始的未转换数据 Z(s) 来预测指示变量,将获得概率克里金法。如果存在多个感兴趣变量,则可将普通协同克里金法、泛协同克里金法、简单协同克里金法、指示协同克里金法、概率协同克里金法和析取协同克里金法视为之前描述的各种不同克里金法的多变量扩展。

5/10/2014