Cómo funciona Dendrograma

Un dendrograma es un diagrama que muestra las distancias de atributos entre cada par de clases fusionadas de manera secuencial. Para evitar cruzar líneas, el diagrama se expone gráficamente de tal modo que los miembros de cada par de clases que se fusionan son elementos próximos.

La herramienta Dendrograma utiliza un algoritmo de clustering jerárquico. El programa primero calcula las distancias entre cada par de clases en el archivo de firma de entrada. Después, se fusiona iterativamente el par de clases más cercano y se fusiona sucesivamente el siguiente par de clases más cercano y el siguiente más cercano hasta que se fusionan todas las clases. Después de cada fusión, se actualizan las distancias entre todos los pares de clases. Las distancias a las que se fusionan las firmas de clases se utilizan para construir un dendrograma.

Cuando no está marcada la opción Utilizar varianza en cálculos de distancia (NO_STD), la distancia dmn entre un par de clases m y n se mide como una distancia entre los valores medios:

Fórmula de distancia entre valores medios

Cuando la opción de varianza está marcada (STD), la herramienta Dendrograma mide las distancias entre los pares de clases en base a los valores medios y las varianzas mediante la siguiente fórmula:

La ecuación para medir las distancias entre pares de clases

Las nuevas estadísticas (valores medios y varianzas) que describen la clase fusionada se basan en el valor medio y la varianza original de las muestras que constituyen la clase fusionada. Por lo tanto, la clase fusionada se produce utilizando el valor medio y la varianza de forma conjunta. Las dos firmas que se utilizan para crear la clase fusionada se reemplazan por una firma única de la clase combinada. La nueva firma de valor medio se calcula en base a las ubicaciones en el espacio de atributos multidimensional de todas las celdas miembro de la clase fusionada. La nueva firma mantiene el número más bajo de las dos clases de entrada para el Id. de clase fusionada.

Los niveles de valores, o las distancias a las que se fusionan cada par de clases, se pueden interpolar utilizando las barras de escala del gráfico de dendrograma. Debido a la limitación del tamaño de un carácter (la resolución gruesa del gráfico), se redondean los niveles de fusión para la visualización. Sin embargo, los valores precisos de los niveles de fusión se presentan como DISTANCIA en la tabla asociada con el dendrograma.

Las varianzas, no las covarianzas, se utilizan para calcular la distancia después que se fusiona un par de clases. El algoritmo que utiliza Dendrograma no utiliza la distancia de Mahalanobis para determinar la distancia entre clases. Por lo tanto, es posible que las distancias entre las clases y las clases fusionadas no coincidan con los resultados de las herramientas de cuadrícula que se basan en la distancia de Mahalanobis, como Editar signaturas, Clasificación de máxima verosimilitud y Capas de probabilidad para cada clase.

El dendograma se puede utilizar para reducir la mala clasificación estadística en su análisis al proporcionar la información necesaria para combinar o separar las clases de datos. Si las clases en su análisis son estadísticamente muy cercanas (es decir, puede ser difícil diferenciar los dos clases según sus estadísticas), puede resultar en una mala clasificación. En este caso, considere la fusión de las clases. No hay normas definitivas de cuándo las clases se deben y no se deben fusionar. ¿Cuándo se deben fusionar las clases? Esto depende de la heterogeneidad de su área de estudio y los datos, la cantidad de clases en las que están intentando clasificar los datos y sus objetivos. Por ejemplo, si su área de estudio es muy heterogénea, tiene el potencial para muchas clases diferentes, dispares, de esa manera es posible que no sea necesario fusionar las clases. En otra situación posible, sus datos pueden ser más homogéneo, y podría estar intentando clasificar los datos en demasiadas clases. En la segunda situación las clases pueden ser estadísticamente demasiado cercanas; por tanto, la fusión de algunas de las clases, puede ser adecuada.

Si su análisis no requiere clases detalladas, es posible que desee puede fusionar las en categorías más generales para disminuir la oportunidad de malas clasificaciones. El dendrograma identifica qué clases son estadísticamente más cercanas, pero le corresponde a usted, mediante su conocimiento de la zona y de sus objetivos, determinar cuál es el momento adecuado para fusionar las clases.

Por ejemplo, podría ser apropiado fusionar dos clases si ha especificado una clase como zonas húmedas generales y una segunda clase como ciénagas. No obstante, las estadísticas determinadas a partir de los ejemplos de capacitación son muy similares entre las dos clases; por consiguiente, estas dos clases estarán cerca en el dendrograma resultante. Si solo está interesado en la identificación de las zonas húmedas, es posible que desee fusionar las ciénagas en la clase de las zonas húmedas general.

No solo el dendrograma identifica qué clases se pueden fusionarse, también puede identificar cuándo podría ser beneficioso agregar clases. Si una clase está estadísticamente lejos de otra clase, es posible que desee agregar clases para perfeccionar la clasificación. Por ejemplo, puede haber una clase especificada como los cultivos y una segunda clase como la hierba. Sobre el dendrograma resultante, estas dos clases pueden ser muy distantes. Sin embargo, supongamos que tienen un ráster multibanda de alta resolución. Si analiza la salida agrícola para la zona, los datos de resolución más alta le permiten perfeccionar las clases de cultivos y hierba en tipos de cultivos específicos.

Ejemplo

En el siguiente ejemplo, las clases 3 y 5 son los vecinos más próximos en el espacio de atributos; por lo tanto, se fusionan al nivel 3,443. Este valor indica el grado de similitud relativo, que también se puede visualizar como la distancia en el espacio multidimensional. Las dos clases se fusionan y se tratan como una clase única. Se calculan las estadísticas para la clase fusionada y las distancias desde la clase fusionada a las otras clases. Después se identifican las siguientes dos clases más cercanas. Las dos candidatas son las clases 4 y 6. La distancia entre ellas es de 3,609, y se fusionan. El proceso itera. Todas las clases se fusionan secuencialmente en clases más grandes hasta que todas las clases se fusionan en una clase única.

El archivo de dendrograma de salida será el siguiente:

Distances between pairs of combined classes (in the sequence of merging):  Remaining   Merged   Between-Class Class      Class      Distance ----------------------------------   3         5        3.442680   4         6        3.608904   7         9        3.899360   2         7        3.795288   3         4        4.883098   2         8        6.073256   1         3        6.257798   1         2        9.350019 ----------------------------------  Dendrogram of /discb/topdir/myspace/isoclust12.gsg  C       DISTANCE L A S   0      1.0     2.1     3.1     4.1     5.2     6.2     7.2     8.3     9.3 S   |-------|-------|-------|-------|-------|-------|-------|-------|------        5 -------------------------|                               |----------|    3 -------------------------|          |                                          |----------|    6 ---------------------------|        |          |                                 |--------|          |-------------------|    4 ---------------------------|                   |                   |                                                     |                   |    1 -----------------------------------------------|                   |                                                                         |-    9 -----------------------------|                                     |                                   |                                     |    7 ---------------------------------------------|                     |                                    |              |                     |    2 ------------------------------|              |---------------------|                                                   |    8 ---------------------------------------------|         |-------|-------|-------|-------|-------|-------|-------|-------|------     0      1.0     2.1     3.1     4.1     5.2     6.2     7.2     8.3     9.3

Temas relacionados

9/11/2013