Average Nearest Neighbor (Statistiques spatiales)
Récapitulatif
Calcule un index du voisin le plus proche en fonction de la distance moyenne de chaque entité par rapport à son entité avoisinante la plus proche.
Vous pouvez accéder aux résultats de cet outil (fichier facultatif du rapport compris) par l'intermédiaire de la fenêtre Résultats. Si vous désactivez le traitement en arrière-plan, les résultats apparaissent également dans la boîte de dialogue Progression.
Pour en savoir plus sur le fonctionnement de l'outil Average Nearest Neighbor Distance
Illustration
Utilisation
-
L'outil Average Nearest Neighbor renvoie cinq valeurs : distance moyenne observée, distance moyenne attendue, indice de voisin le plus proche, score z et valeur p. Ces valeurs sont disponibles dans la fenêtre Résultats et sont transmises en tant que valeurs en sortie dérivées pour utilisation potentielle dans les modèles ou les scripts. Cet outil peut également créer un fichier HTML contenant un récapitulatif graphique des résultats. Double-cliquez sur le fichier HTML dans la fenêtre Résultats pour ouvrir le fichier HTML dans le navigateur Internet par défaut. Cliquez avec le bouton droit sur l'entrée Messages dans la fenêtre Résultats et sélectionnez Afficher pour consulter les résultats dans une boîte de dialogue de message.
Remarque :- Si cet outil fait partie d'un outil de modèle personnalisé, le lien HTML apparaît seulement dans la fenêtre Résultats s'il est défini en tant que paramètre du modèle avant l'exécution de l'outil.
- Pour un meilleur affichage des graphiques HTML, assurez-vous que la résolution définie pour votre moniteur est 96 PPP.
-
Les résultats de score z et de valeur p sont des mesures de signification statistique qui indiquent si l'on peut rejeter l'hypothèse nulle. Pour la statistique Average Nearest Neighbor, l'hypothèse nulle suppose que les entités sont distribuées aléatoirement.
-
L'indice de voisin le plus proche est exprimé en tant que rapport de la distance moyenne observée à la distance moyenne attendue. La distance attendue est la distance moyenne entre voisins dans une distribution aléatoire hypothétique. Si l'indice est inférieur à 1, le modèle présente un phénomène d'agrégation ; si l'indice est supérieur à 1, la tendance est à la dispersion ou à la concurrence.
-
La méthode de moyenne distance de voisin le plus proche est très sensible à la valeur Surface (d'infimes variations de la valeur du paramètre Surface peuvent provoquer des variations sensibles dans les résultats). Par conséquent, l'outil Average Nearest Neighbor est plus efficace pour comparer des entités différentes dans une zone d'étude fixe. L'image suivante illustre la façon dont des distributions identiques d'entités peuvent être dispersées ou agrégées selon la zone d'étude spécifiée.
-
Si une valeur du paramètre Surface n'est pas spécifiée, c'est la superficie du rectangle d'encadrement minimum des entités en entrée qui est utilisée. Contrairement à l'étendue, un rectangle d'encadrement minimum ne s'aligne pas nécessairement sur les axes x et y.
-
Dans certains cas, des rectangles d'encadrement minimum non valides (superficie nulle) sont générés pour des entités en entrée. Pour y remédier, une petite valeur dérivée de la tolérance x,y de l'entité en entrée permet de créer le rectangle d'encadrement minimum. Par exemple, si toutes les entités sont coïncidentes (toutes ont exactement les mêmes coordonnées x et y), le système utilise, dans les calculs, la superficie d'un petit polygone carré autour de l'emplacement unique. Autre exemple : si toutes les entités sont parfaitement alignées (par exemple, 3 points sur une ligne droite), le système utilise la superficie d'un polygone rectangle qui laisse un petit espace autour des entités encadrées. Quoi qu'il en soit, il vaut toujours mieux fournir une valeur de Surface avec l'outil Average Nearest Neighbor.
-
Bien que cet outil fonctionne avec des données surfaciques ou linéaires, il est plus adapté aux données d'événement, d'incident ou autres données d'entité ponctuelle fixe. Pour les entités linéaires et surfaciques, les calculs utilisent le centroïde géométrique vrai pour chaque entité. Pour les multi-points, les polylignes, ou les polygones comprenant plusieurs parties, le centroïde est calculé à l'aide du centre moyen pondéré de toutes les parties d'entité. La pondération pour les entités ponctuelles est de 1 ; pour les entités linéaires, elle correspond à la longueur et pour les entités surfaciques, à la superficie.
Cet outil peut également créer un fichier HTML récapitulant les résultats. Les fichiers HTML n'apparaissent pas automatiquement dans la fenêtre Catalogue. Si vous souhaitez afficher des fichiers HTML dans la fenêtre Catalogue, ouvrez l'application ArcCatalog, sélectionnez l'option de menu Personnaliser, cliquez sur Options ArcCatalog et sélectionnez l'onglet Types de fichiers. Cliquez sur le bouton Nouveau type et spécifiez HTML comme valeur du paramètre Extension de fichier.
-
Les calculs basés sur la distance euclidienne ou la distance de Manhattan requièrent des données projetées afin de pouvoir mesurer les distances avec précision.
-
Les couches peuvent permettre de définir la Classe d'entités en entrée. Lors de l'utilisation d'une couche avec une sélection, seules les entités sélectionnées sont incluses dans l'analyse.
Dans ArcGIS 10, la sortie graphique optionnelle n'est plus affichée automatiquement. A la place, un fichier HTML récapitulant les résultats est créé. Pour afficher les résultats, double-cliquez sur le fichier HTML dans la fenêtre Résultats. Il se peut que les scripts personnalisés ou les outils de modèles créés à l'aide d'une version préalable à ArcGIS 10 et utilisant cet outil doivent être recréés. Pour recréer les outils personnalisés, ouvrez-les, supprimez le paramètre Afficher les résultats de manière graphique, puis enregistrez cette modification.
Lorsque vous utilisez des fichiers de formes, n'oubliez pas qu'ils ne peuvent pas stocker de valeurs Null. Il se peut que des outils ou autres procédures qui créent des fichiers de formes à partir d'entrées autres que des fichiers de formes stockent ou interprètent des valeurs Null comme étant égales à zéro. Dans certains cas, les valeurs Null sont stockées sous forme de valeurs négatives très élevées dans les fichiers de formes. Cela peut aboutir à des résultats inattendus. Reportez-vous à la rubrique Remarques concernant le géotraitement pour la sortie de fichiers de formes pour plus d'informations.
Syntaxe
Paramètre | Explication | Type de données |
Input_Feature_Class |
Classe d'entités, généralement une classe d'entités ponctuelles, pour laquelle la distance moyenne du voisin le plus proche est calculée. | Feature Layer |
Distance_Method |
Spécifie le mode de calcul des distances de chaque entité avec les entités voisines.
| String |
Generate_Report (Facultatif) |
| Boolean |
Area (Facultatif) |
Valeur numérique qui représente la taille de la zone d'étude. La valeur par défaut correspond à la superficie du rectangle d'encadrement minimum qui englobe toutes les entités (ou toutes les entités sélectionnées). Les unités doivent correspondre à celles du système de coordonnées en sortie. | Double |
Exemple de code
Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil AverageNearestNeighbor.
import arcpy
arcpy.env.workspace = r"C:\data"
arcpy.AverageNearestNeighbor_stats("burglaries.shp", "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
Le script Python autonome ci-dessous illustre l'utilisation de l'outil AverageNearestNeighbor.
# Analyze crime data to determine if spatial patterns are statistically significant
# Import system modules
import arcpy
# Local variables...
workspace = "C:/data"
crime_data = "burglaries.shp"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Obtain Nearest Neighbor Ratio and z-score
# Process: Average Nearest Neighbor...
nn_output = arcpy.AverageNearestNeighbor_stats(crime_data, "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
# Create list of Average Nearest Neighbor output values by splitting the result object
nn_values = nn_output.split(";")
print "The nearest neighbor index is: " + nn_values[0]
print "The z-score of the nearest neighbor index is: " + nn_values[1]
print "The p-value of the nearest neighbor index is: " + nn_values[2]
print "The expected mean distance is: " + nn_values[3]
print "The observed mean distance is: " + nn_values[4]
print "The path of the HTML report: " + nn_values[5]
except:
# If an error occurred when running the tool, print out the error message.
print arcpy.GetMessages()
Environnements
- Système de coordonnées en sortie
La géométrie de l'entité est projetée au système de coordonnées en sortie avant l'analyse. Tous les calculs mathématiques sont basés sur la référence spatiale du système de coordonnées en sortie.