Analyse de grappes et de valeurs aberrantes (Anselin Local Morans I) (Statistiques spatiales)

Niveau de licence :BasicStandardAdvanced

Récapitulatif

A partir d'un ensemble d'entités pondérées, identifie des points chauds, des points froids et des points aberrants spatiaux statistiquement significatifs à l'aide de l'outil statistique Anselin Local Morans I.

Pour en savoir plus sur le fonctionnement de l'analyse de grappes et de valeurs aberrantes (Anselin Local Morans I)

Illustration

Illustration de l'outil Analyse de grappes et de valeurs aberrantes

Utilisation

Syntaxe

ClustersOutliers_stats (Input_Feature_Class, Input_Field, Output_Feature_Class, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Weights_Matrix_File}, {Apply_False_Discovery_Rate__FDR__Correction})
ParamètreExplicationType de données
Input_Feature_Class

Classe d'entités pour laquelle l'analyse d'agrégat/de point aberrant est effectuée.

Feature Layer
Input_Field

Champ numérique à évaluer.

Field
Output_Feature_Class

Classe d'entités en sortie qui reçoit les champs de résultats.

Feature Class
Conceptualization_of_Spatial_Relationships

Indique la façon dont les relations spatiales sont conceptualisées parmi les entités.

  • INVERSE_DISTANCELes entités voisines proches influencent plus fortement les calculs d'une entité cible que les entités qui sont éloignées.
  • INVERSE_DISTANCE_SQUAREDIdentique à INVERSE_DISTANCE, mais la pente est plus prononcée et l'influence chute donc plus rapidement. De plus, seuls les voisins les plus proches d'une entité cible exercent une influence notable sur les calculs de cette entité.
  • FIXED_DISTANCE_BANDChaque entité est analysée dans le contexte des entités voisines. Les entités voisines situées en deçà de la distance critique spécifiée reçoivent une pondération de 1 et exercent une influence sur les calculs de l'entité cible. Les entités voisines situées au-delà de la distance critique reçoivent une pondération de zéro et n'exercent aucune influence sur les calculs de l'entité cible.
  • ZONE_OF_INDIFFERENCELes entités situées en deçà de la distance critique spécifiée d'une entité cible reçoivent une pondération de 1 et exercent une influence sur les calculs de cette entité. Une fois la distance critique dépassée, les pondérations (et l'influence exercée par une entité voisine sur les calculs d'une entité cible) diminuent avec la distance.
  • CONTIGUITY_EDGES_ONLYSeules les entités surfaciques voisines qui partagent une limite ou se chevauchent influencent les calculs de l'entité surfacique cible.
  • CONTIGUITY_EDGES_CORNERSLes entités surfaciques voisines qui partagent une limite, un nœud, ou qui se chevauchent influencent les calculs de l'entité surfacique cible.
  • GET_SPATIAL_WEIGHTS_FROM_FILELes relations spatiales sont définies dans un fichier de pondérations spatiales. Le chemin d'accès au fichier de pondérations spatiales est donné par le paramètre Fichier de matrice des pondérations.
String
Distance_Method

Spécifie le mode de calcul des distances de chaque entité avec les entités voisines.

  • EUCLIDEAN_DISTANCEDistance en ligne droite entre deux points (distance à vol d'oiseau).
  • MANHATTAN_DISTANCEDistance entre deux points mesurée le long des axes à angle droit (bloc de bâtiments) ; calculée en totalisant la différence (absolue) entre les coordonnées x et y.
String
Standardization

La standardisation par lignes est recommandée chaque fois que la répartition de vos entités est potentiellement influencée par la conception de l'échantillonnage ou un plan d'agrégation imposé.

  • NONEAucune standardisation de pondérations spatiales n'est appliquée.
  • ROWLes pondérations spatiales sont standardisées ; chaque pondération est divisée par la somme des lignes (la somme des pondérations de toutes les entités voisines).
String
Distance_Band_or_Threshold_Distance
(Facultatif)

Spécifie une distance limite pour les options Inverse Distance et Fixed Distance. Les entités se trouvant à l'extérieur de la limite spécifiée pour une entité cible ne sont pas prises en compte dans les analyses pour cette entité. Cependant, pour Zone of Indifference, l'influence des entités situées hors de la distance donnée est réduite avec la distance, tandis que les entités se trouvant dans le seuil de distance sont considérées à part égale. La valeur de distance entrée doit être identique à celle du système de coordonnées en sortie.

Pour les conceptualisations d'inverse de la distance des relations spatiales, une valeur de zéro indique qu'aucune distance de seuil n'est appliquée ; lorsque ce paramètre n'est pas défini, une valeur de seuil par défaut est calculée et appliquée. Cette valeur par défaut est la distance euclidienne qui permet de s'assurer que chaque entité possède au moins un voisin.

Ce paramètre n'a aucun effet lorsque les conceptualisations spatiales Contiguïté polygonale ou Extraire les pondérations spatiales à partir du fichier sont sélectionnées.

Double
Weights_Matrix_File
(Facultatif)

Chemin d'accès à un fichier contenant des pondérations qui définissent les relations spatiales, et potentiellement les relations temporelles, entre des entités.

File
Apply_False_Discovery_Rate__FDR__Correction
(Facultatif)
  • APPLY_FDRLa signification statistique repose sur la correction FDR (False Discovery Rate) pour un niveau de confiance de 95 pour cent.
  • NO_FDRLes entités dont les valeurs p sont inférieures à 0,05 apparaissent dans le champ COType pour refléter les grappes ou les valeurs aberrantes statistiquement significatives à un niveau de confiance de 95 pour cent (par défaut).
Boolean

Exemple de code

Exemple 1 d'utilisation de l'outil ClusterandOutlierAnalysis (fenêtre Python)

Le script de fenêtre Python suivant illustre l'utilisation de l'outil ClusterandOutlierAnalysis.

import arcpy
arcpy.env.workspace = "c:/data/911calls"
arcpy.ClustersOutliers_stats("911Count.shp", "ICOUNT","911ClusterOutlier.shp",
                             "GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN_DISTANCE", 
                             "NONE","#", "euclidean6Neighs.swm","NO_FDR")
Exemple 2 d'utilisation de l'outil ClusterandOutlierAnalysis (script Python autonome)

Le script Python autonome ci-dessous illustre l'utilisation de l'outil ClusterandOutlierAnalysis.

# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Cluster-Outlier Analysis Tool (Anselin's Local Moran's I)

# Import system modules
import arcpy

# Set geoprocessor object property to overwrite outputs if they already exist
arcpy.gp.OverwriteOutput = True

# Local variables...
workspace = r"C:\Data\911Calls"

try:
    # Set the current workspace 
    #  (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace

    # Copy the input feature class and integrate the points to snap
    # together at 500 feet
    # Process: Copy Features and Integrate
    cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
                         "#", 0, 0, 0)

    integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")

    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")

    # Add a unique ID field to the count feature class
    # Process: Add Field and Calculate Field
    af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
                     "NON_NULLABLE", "NON_REQUIRED", "#",
                     "911Count.shp")
    
    cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")

    # Create Spatial Weights Matrix for Calculations
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6) 

    # Cluster/Outlier Analysis of 911 Calls
    # Process: Local Moran's I
    clusters = arcpy.ClustersOutliers_stats("911Count.shp", "ICOUNT", 
                        "911ClusterOutlier.shp", 
                        "GET_SPATIAL_WEIGHTS_FROM_FILE",
                        "EUCLIDEAN_DISTANCE", "NONE",
                        "#", "euclidean6Neighs.swm","NO_FDR")

except:
    # If an error occurred when running the tool, print out the error message.
    print arcpy.GetMessages()

Environnements

Système de coordonnées en sortie

La géométrie de l'entité est projetée dans le système de coordonnées en sortie avant l'analyse, donc les valeurs entrées pour le paramètre Canal distance ou distance seuil doivent correspondre à celles spécifiées dans le système de coordonnées en sortie. Tous les calculs mathématiques sont basés sur la référence spatiale du système de coordonnées en sortie. Lorsque le système de coordonnées en sortie est exprimé en degrés, minutes et secondes, les distances géodésiques sont estimées à l'aide de distances à la corde en mètres.

Thèmes connexes

Informations de licence

ArcGIS for Desktop Basic: Oui
ArcGIS for Desktop Standard: Oui
ArcGIS for Desktop Advanced: Oui
5/10/2014