树状图工作原理
树状图是表示连续合并的每对类之间的属性距离的示意图。为避免线交叉,示意图将以图形的方式进行排布,使得要合并的每对类的成员在示意图中相邻。
树状图工具采用等级聚类算法。程序首先会计算输入特征文件中每对类之间的距离。然后迭代式地合并最近的一对类,完成后继续合并下一对最近的类,直到合并完所有的类。在每次合并后,每对类之间的距离会进行更新。合并类特征时采用的距离将用于构建树状图。
未选中在距离计算中使用方差选项时 (NO_STD),每对类(m 和 n)之间的距离 dmn 通过两者之间的距离均值进行测量:
其中:
m 和 n:类的 ID
i:图层编号
µ:图层 i 中类 m 或 n 的平均值
选中方差选项时 (STD),树状图工具将基于每对类的平均值和方差测量每对类间的距离,公式如下:
其中 V 是类 m 或 n 的方差,这两个类属于图层 i。
用于描述合并类的新统计数据(平均值和方差)基于组成合并类的样本的原始平均值和方差生成。因此,合并类是通过使用池化平均值和方差而生成的。在合并后的类中,用于创建合并类的两个特征将替换为一个特征。新的平均值特征基于合并类的所有成员像元在多维属性空间中的位置进行计算。新特征将保留两个输入类编号中较小的一个,将其作为合并类的 ID。
值的级别或者合并每对类时使用的距离可使用树状图的比例尺进行插值。由于受字符大小所限(图形分辨率粗糙所致),将对合并级别值进行四舍五入以便于显示。然而,合并级别的精确值在与树状图关联的表中表示为 DISTANCE。
在对一对类进行合并后,将使用方差(而非协方差)计算距离。树状图所用的算法并不使用马氏距离来确定类之间的距离。因此,类和合并类之间的距离可能和基于马氏距离的格网工具(如编辑特征、最大似然法分类和类别概率)计算出的结果不匹配。
可以通过提供合并或分离数据类所需的信息,树状图可用于减少分析时的统计误分类。如果分析中的各个类在统计上过于接近(即很难根据统计数据区分这两个类),则可能导致误分类情况发生。在这种情况下,请考虑对类进行合并。对于是否应该合并类并没有明确的规则。何时应该合并类?这取决于您的研究区域和数据的异质性、要将数据归类到的类的数量以及您的目标。例如,如果您的研究区域非常复杂,可能有许多不同的类,那么可以不必对类进行合并。还有另一种可能的情况,您的数据可能较为相似,您可能正试图将数据归为过多的类。在第二种情况下,这些类可能在统计上过于接近,那么就需要对其中一部分进行合并。
如果分析时并不需要详细的类,您可能会希望将类合并成更为常规的类别,从而降低误分类的可能性。使用树状图可以明确哪些类在统计上最为接近,但您还是需要根据研究区域和目标来确定是否应该对类进行合并。
例如,如果您已将一个类指定为普通湿地,将另一个指定为沼泽,则可以对这两个类进行合并。但是,根据训练样本得出的统计结果在两个类之间会非常相似;因此,这两个类在生成的树状图中也会很接近。如果您只对确定湿地感兴趣,那么您也许希望将沼泽合并到普通湿地类。
使用树状图不仅可以确定哪些类可进行合并,还能够确定何时添加类会有好处。如果一个类在统计上与另一个类相差很多,您可能想要添加类,以便进一步细化分类。例如,您可能已将一个类指定为作物,将另一个类指定为草地。在生成的树状图上,这两个类可能会相距很远。但是,假设您有一个高分辨率的多波段栅格。如果您要分析此区域的农业输出,那么高分辨率的数据可能允许您将作物类和草地类归到特定的作物类型中。
示例
在以下示例中,类别 3 和类别 5 是属性空间中的最近邻,所以它们最终在 3.443 级别进行合并。该值显示了相似性的相对程度,也可将其视为多维空间中的距离。对这两个类进行合并并视为单个类。计算合并类的统计数据以及合并类到其他类的距离。然后识别下一对最近的两个类。两个候选项是类别 4 和类别 6,它们之间的距离是 3.609,将它们合并。这个过程将迭代进行。所有的类相继合并成较大的类,直到最终所有的类合并成一个类。
- 树状图工具对话框中使用的设置:
输入特征文件:isoclust12.gsg
输出树状图文件:isodendro.txt
在距离计算中使用方差:{default}
树状图的线宽度: 78
输出树状图文件如下:
Distances between pairs of combined classes (in the sequence of merging): Remaining Merged Between-Class Class Class Distance ---------------------------------- 3 5 3.442680 4 6 3.608904 7 9 3.899360 2 7 3.795288 3 4 4.883098 2 8 6.073256 1 3 6.257798 1 2 9.350019 ---------------------------------- Dendrogram of /discb/topdir/myspace/isoclust12.gsg C DISTANCE L A S 0 1.0 2.1 3.1 4.1 5.2 6.2 7.2 8.3 9.3 S |-------|-------|-------|-------|-------|-------|-------|-------|------ 5 -------------------------| |----------| 3 -------------------------| | |----------| 6 ---------------------------| | | |--------| |-------------------| 4 ---------------------------| | | | | 1 -----------------------------------------------| | |- 9 -----------------------------| | | | 7 ---------------------------------------------| | | | | 2 ------------------------------| |---------------------| | 8 ---------------------------------------------| |-------|-------|-------|-------|-------|-------|-------|-------|------ 0 1.0 2.1 3.1 4.1 5.2 6.2 7.2 8.3 9.3