Fonctionnement de l'outil Cluster and Outlier Analysis (Anselin Local Moran's I)
Dans un ensemble d'entités (Classe d'entités en entrée) et un champ d'analyse (Champ en entrée) donnés, l'outil Cluster and Outlier Analysis permet d'identifier des agrégats spatiaux d'entités présentant des valeurs élevées ou faibles. L'outil identifie également des points spatiaux aberrants. Pour cela, l'outil calcule la valeur d'indice local de Moran, un score z, une valeur p et un code qui représente le type d'agrégat pour chaque entité. Les scores z et les valeurs p représentent la signification statistique des valeurs d'indice calculées.
Interprétation
Une valeur de I positive indique qu'une entité est voisine d'entités présentant également des valeurs attributaires élevées ou faibles ; cette entité fait partie d'un agrégat. Une valeur négative pour I indique qu'une entité est voisine d'entités présentant des valeurs dissemblables ; cette entité est un point aberrant. Dans l'un et l'autre instance, la valeur de p pour l'entité doit être petite assez pour l'agrégat ou point aberrant à considérer comme statistiquement significatif. Pour plus d'informations sur la façon de déterminer la signification d'une statistique, reportez-vous à la rubrique Qu'est-ce qu'un score z ? Qu'est-ce qu'une valeur p ?. Notez que l'indice I local de Moran (I) est une mesure relative et peut uniquement être interprété dans le contexte de son score z ou de sa valeur p calculée.
Le champ en sortie, type agrégat-point aberrant (COType), fait la distinction entre un agrégat statistiquement significatif (niveau 0,05) de valeurs élevées (HH), un agrégat de valeurs faibles (LL), un point aberrant dans lequel une valeur élevée est entourée principalement de valeurs faibles (HL) et un point aberrant dans lequel une valeur faible est entourée principalement de valeurs élevées (LH).
Sortie
Cet outil crée, pour chaque entité dans la classe d'entités en entrée, une classe d'entités en sortie avec les attributs suivants : indice I local de Moran, score z, valeur p et COType. Les noms de champ de ces attributs sont renvoyés également, en tant que sorties dérivées de la chaîne d'outils pour une utilisation potentielle dans les modèles ou les scripts personnalisés.
Lorsque l'outil s'exécute dans ArcMap, la classe d'entités en sortie est ajoutée automatiquement à la table des matières et le rendu par défaut est appliqué au champ COType. Le rendu appliqué est défini par un fichier de couches dans <ArcGIS>/ArcToolbox/Templates/Layers. Vous pouvez appliquer à nouveau le rendu par défaut, si nécessaire, en important la symbologie des couches modèle.
Pratiques conseillées
- Les résultats sont uniquement fiables si la classe d'entités en entrée contient 30 entités au moins.
- Cet outil nécessite un champ en entrée tel qu'un nombre, un taux, ou une autre mesure numérique. Si vous analysez des données ponctuelles, où chaque point représente un événement ou un incident unique, vous pouvez ne pas avoir d'attribut numérique spécifique à évaluer (une échelle de gravité, un nombre ou une autre mesure). Si vous vous intéressez aux emplacements présentant beaucoup d'incidents (hot spots) et/ou aux emplacements présentant très peu d'incidents (cold spots), vous devrez agréger vos données d'incident avant l'analyse. L'outil Hot Spot Analysis (Getis-Ord Gi*) est également efficace pour identifier les hot spots et les cold spots. Toutefois, seul l'outil Cluster and Outlier Analysis (Anselin Local Moran's I) identifiera des points spatiaux aberrants statistiquement significatifs (valeur haute entourée par des valeurs basses ou valeur basse entourée par des valeurs hautes).
- Sélection d'une conceptualisation de relations spatiales.
- Lorsque vous sélectionnez la conceptualisation SPACE_TIME_WINDOW, vous pouvez identifier les agrégats et les points aberrants spatio-temporels. Reportez-vous à rubrique Analyse spatio-temporelle pour plus d'informations.
- Sélection d'une valeur de canal distance ou de distance seuil.
- Toutes les entités doivent avoir au moins un voisin.
- Aucune entité ne doit être voisine de l'ensemble des autres entités.
- Surtout si les valeurs du champ en entrée sont désaxées, il est préférable que les entités aient approximativement huit voisines chacune.
Applications possibles
L'outil Cluster and Outlier Analysis (Anselin Local Moran's I) identifie les concentrations de valeurs hautes, de valeurs basses et les points spatiaux aberrants. Il peut aider à répondre à des questions telles que :
- Où se situent les limites les plus nettes entre abondance et pauvreté dans une zone d'étude ?
- La zone d'étude contient-elle des emplacements présentant des modèles de dépense anormaux ?
- Où existe-t-il des taux de diabète anormalement élevés dans la zone d'étude ?
Les applications touchent à de nombreux domaines, notamment l'économie, la gestion des ressources, la biogéographie, la géographie politique et la démographie.
Ressources supplémentaires
Anselin, Luc. "Local Indicators of Spatial Association—LISA," Geographical Analysis 27(2): 93–115, 1995.
Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2.ESRI Press, 2005.