Cómo funciona Análisis de cluster y de valor atípico (I Anselin local de Moran)
Dado un conjunto de entidades (Clase de entidad de entrada) y un campo de análisis (Campo de entrada), la herramienta Análisis de cluster y de valor atípicoidentifica clusters espaciales de las entidades con valores altos o bajos. La herramienta también identifica los valores atípicos espaciales. Para realizar esto, la herramienta calcula un valor de I local de Moran, una puntuación z, un valor P y un código que representa el tipo de cluster para cada entidad. Las puntuaciones z y los valores P representan la significancia estadística de los valores de índice calculados.
Interpretación
Un valor positivo paraI indica que una entidad tiene entidades vecinas con valores de atributo altos o bajos similares; esta entidad es parte de un cluster. Un valor negativo para I indica que una entidad tiene entidades vecinas con valores diferentes; esta entidad es un valor atípico. En ambas instancias, el valor P para la entidad debe ser lo suficientemente pequeño para que el cluster o el valor atípico se consideren estadísticamente significativos. Para obtener más información sobre cómo determinar la significancia estadística, consulte¿Qué es una puntuación z? ¿Qué es un valor P? Tenga en cuenta que el índice I de Moran local (I) es una medida relativa y que sólo se puede interpretar dentro del contexto de su puntuación z o valor P calculado.
El campo de salida, tipo de cluster/valor atípico (COType), distingue entre un cluster de valores altos (AA), un cluster de valores bajos (BB), un valor atípico en el que un valor alto está rodeado principalmente por valores bajos (AB) y un valor atípico en el que un valor bajo está rodeado principalmente por valores altos (BA) que sean estadísticamente significativos (nivel 0,05).
Salida
Esta herramienta crea una nueva clase de entidad de salida con los siguientes atributos para cada entidad en la clase de entidad de entrada: índice I de Moran local, puntuación z, valor P y COType. Los nombres de los campos de estos atributos también se devuelven como salidas de cadena de caracteres de herramienta derivadas para el uso potencial en modelos y secuencias de comandos personalizados.
Cuando esta herramienta se ejecuta en ArcMap, la clase de entidad de salida se agrega automáticamente a la tabla de contenido (TOC) con una representación predeterminada aplicada al campo COType. La representación aplicada se define en un archivo de capa en <ArcGIS>/ArcToolbox/Templates/Layers. Puede volver a aplicar la representación predeterminada, de ser necesario, al importar la simbología de capa de plantilla.
Pautas de mejores prácticas
- Los resultados son confiables sólo si la clase de entidad de entrada contiene un mínimo de 30 entidades.
- Esta herramienta requiere un campo de entrada como conteo, tasa u otras medidas numéricas. Si analiza datos de punto, donde cada punto presenta un evento o un incidente único, es probable que no tenga un atributo numérico específico para evaluar (una clasificación de gravedad, un conteo u otra medida). Si está interesado en buscar ubicaciones con muchos incidentes (puntos calientes) o ubicaciones con muy pocos incidentes (puntos fríos), deberá agregar los datos de incidentes antes del análisis. La herramienta Análisis de punto caliente (Gi* de Getis-Ord) también es efectiva para buscar puntos calientes y puntos fríos. Sin embargo, sólo la herramienta Análisis de cluster y de valor atípico (I Anselin local de Moran) identificará los valores atípicos espaciales estadísticamente significativos (un valor alto rodeado por valores bajos o un valor bajo rodeado por valores altos).
- Seleccione una conceptualización de relaciones espaciales adecuada.
- Cuando selecciona la conceptualización SPACE_TIME_WINDOW, puede identificar los clusters de espacio-tiempo y los valores atípicos. Consulte Análisis espacio-tiempo para obtener más información.
- Seleccione una banda de distancia o una distancia de umbral adecuada.
- Todas las entidades deben tener al menos un vecino.
- Ninguna entidad debe tener todas las otras entidades como un vecino.
- Especialmente si los valores para el campo de entrada están sesgados, cada entidad debe tener aproximadamente ocho vecinos.
Potenciales aplicaciones
La herramienta Análisis de cluster y de valor atípico (I Anselin local de Moran) identifica concentraciones de valores altos, concentraciones de valores bajos y valores atípicos espaciales. Le puede ayudar a responder preguntas como las siguientes:
- ¿Dónde están los límites más nítidos entre prosperidad y pobreza en un área de estudio?
- ¿Existen ubicaciones en un área de estudio con patrones de gastos anómalos?
- ¿Dónde están las tasas de diabetes altas no esperadas en el área de estudio?
Las aplicaciones se pueden encontrar en muchos campos que incluyen economía, administración de recursos, biogeografía, geografía política y demografía.
Recursos adicionales
Anselin, Luc. "Local Indicators of Spatial Association—LISA," Geographical Analysis 27(2): 93–115, 1995.
Mitchell, Andy. La Guía de Esri para el análisis SIG, Volumen 2. Esri Press, 2005.