Fonctionnement de l'autocorrélation spatiale incrémentielle

En général, dans le cas de l'analyse de données spatiales, l'échelle de votre analyse est importante. La valeur par défaut du paramètre Conceptualisation de relations spatiales pour l'outil Hot Spot Analysis, par exemple, est FIXED_DISTANCE_BAND et exige que vous spécifiiez une valeur de distance. Pour de nombreux outils de densité, vous devrez spécifier un Rayon. La distance que vous sélectionnez doit être en rapport avec l'échelle du problème que vous tentez de résoudre ou celle de la solution que vous envisagez. Supposons, par exemple, que vous souhaitiez comprendre l'obésité infantile. Quelle est votre échelle d'analyse ? S'effectue-t-elle au niveau de la famille ou du quartier ? Si oui, la distance que vous utilisez pour définir votre échelle d'analyse est faible, couvrant des habitations situées à un ou deux pâtés de maisons les uns des autres. Et quelle sera l'échelle de la solution ? Votre problème implique peut-être de déterminer où développer les activités sportives périscolaires afin de tenter de réduire l'obésité infantile. Dans ce cas, votre distance reflétera probablement des zones scolaires. Il est parfois facile de déterminer une échelle d'analyse appropriée. Si vous étudiez la migration quotidienne de travailleurs et savez que le trajet moyen jusqu'au lieu de travail est de 12 km, par exemple, une distance de 12 km convient donc pour votre analyse. Mais il peut aussi être plus difficile de justifier une distance d'analyse spécifique. Dans ce cas, l'outil Autocorrélation spatiale incrémentielle est très utile.

Dès lors que vous remarquez une agrégation spatiale dans le paysage, vous voyez la preuve de l'existence de processus spatiaux sous-jacents. Si vous connaissez l'échelle spatiale utilisée par ces processus sous-jacents, il vous sera plus facile de sélectionner une distance d'analyse appropriée. L'outil Autocorrélation spatiale incrémentielle exécute l'outil Spatial Autocorrelation (Global Moran’s I) pour une série de distances de plus en plus élevées, mesurant l'intensité de l'agrégation spatiale pour chacune d'elles. L'intensité de l'agrégation est déterminée par le score z obtenu. Au fur et à mesure que la distance augmente, le score z fait de même, indiquant l'intensification de l'agrégation. Cependant, à une certaine distance , le score z atteint généralement un pic. Il arrive parfois que vous voyiez plusieurs pics.

Graphique illustrant l'autocorrélation spatiale incrémentielle

Les pics représentent des distances où les processus spatiaux qui favorisent l'agrégation sont les plus prononcés. La couleur de chaque point du graphique correspond à la signification statistique des valeurs des scores z.

Légende des couleurs utilisées pour la signification statistique

Une stratégie d'identification de l'échelle d'analyse appropriée consiste à sélectionner la distance associée au pic statistiquement significatif qui reflète le mieux l'échelle de votre problème. Il s'agit souvent du premier pic statistiquement significatif.

Comment sélectionner les valeurs des paramètres Distance de départ et Incrément de distance ?

Toutes les mesures de distance sont basées sur des centroïdes d'entités et la Distance de départ par défaut est la plus petite distance permettant d'assurer que chaque entité a au moins une entité voisine. C'est en général un bon choix, sauf si votre jeu de données inclut des points aberrants spatiaux. Déterminez s'il existe ou non des points aberrants spatiaux, puis sélectionnez toutes les entités aberrantes et exécutez l'outil Autocorrélation spatiale incrémentielle uniquement sur les entités sélectionnées. Si vous trouvez un pic de distance pour l'ensemble de sélection, utilisez cette distance pour créer un fichier de matrice de pondérations spatiales basé sur toutes vos entités (points aberrants inclus). Lorsque vous créez un fichier de matrice de pondérations spatiales à l’aide de l’outil Generate_Spatial_Weights_Matrix, spécifiez une valeur pour le paramètre Nombre de voisins afin que toutes les entités aient au moins le nombre correspondant d'entités voisines.

La valeur par défaut du paramètre Incrément de distance est la distance moyenne entre chaque entité et son entité voisine la plus proche. Si vous avez déterminé une distance de départ appropriée à l'aide des stratégies décrites ci-dessus et si aucun pic de distance n'apparaît, essayez d'utiliser des incréments de distance plus faibles ou plus élevés.

Et si le graphique ne présente jamais de pic ?

Dans certains cas, vous utiliserez l'outil Autocorrélation spatiale incrémentielle et obtiendrez un graphique avec un score z qui continue d'augmenter en même temps que les distances, et le graphique ne comportera pas de pic. Cela se produit en général lorsque des données ont été agrégées et que l'échelle des processus affectant la variable Champ en entrée est inférieure à celle du schéma d'agrégation. Vous pouvez essayer de réduire l'incrément de distance pour vérifier si cela permet de capturer des pics plus petits. Toutefois, vous n'obtiendrez pas de pic si plusieurs processus spatiaux sont exécutés chacun à une distance différente dans votre zone d'étude. Cela se produit souvent dans le cas de jeux de données ponctuelles volumineux et bruyants (où les valeurs de données ponctuelles que vous analysez ne présentent pas de distribution spatiale claire). Dans ce cas, vous devrez justifier votre échelle d'analyse à l'aide d'autres critères.

Interprétation des résultats

Lorsque vous utilisez l'outil Autocorrélation spatiale incrémentielle au premier plan, les résultats des scores z pour chaque distance apparaissent dans la fenêtre Progression. Ces résultats sont également indiqués dans la fenêtre Résultats. Si vous cliquez avec le bouton droit sur l'entrée Messages dans la fenêtre Résultats et sélectionnez Afficher, les résultats de l'outil s'affichent dans une boîte de dialogue Message. Si vous spécifiez un chemin pour le paramètre optionnel Table en sortie, une table incluant des champs pour les valeurs Distance, Indice de Moran, Indice attendu, Variance, z_score et p_value est créée. En étudiant les valeurs des scores z dans la fenêtre Progression, dans la boîte de dialogue Message ou dans la Table en sortie, vous pouvez déterminer s'il existe des pics de distance. En général, cependant, vous identifierez les pics de distance en consultant le graphique dans le fichier facultatif de rapport en sortie. Le rapport comporte trois pages. Vous trouverez ci-dessous un exemple de la première page du rapport. Notez que ce graphique comporte trois pics de score z, associés à des distances de 5 000, 9 000 et 13 000 pieds. Un halo apparaît pour mettre en évidence le premier pic de distance et le pic de distance maximal, mais tous les pics représentent des distances où les processus spatiaux favorisant l'agrégation sont les plus prononcés. Vous pouvez sélectionner le pic qui représente le mieux l'échelle de votre question analytique. Dans certains cas, il existera un seul halo, car le premier pic et le pic maximum se trouvent à la même distance. Si aucun des pics de score z n'est statistiquement significatif, aucun des pics ne comportera de halo bleu clair. Notez que la couleur du score z représenté correspond à la légende indiquant les valeurs critiques de signification statistique.

Première page du rapport Autocorrélation spatiale incrémentielle

Sur la deuxième page du rapport, les distances et les valeurs des scores z sont présentées sous forme de table. La dernière page du rapport récapitule toutes les valeurs de paramètres utilisées lors de l'exécution de l'outil. Pour générer un fichier de rapport, spécifiez un chemin comme valeur du paramètre Rapport en sortie.

Ressources supplémentaires

9/13/2013