Fonctionnement de l'outil High/Low Clustering (Getis-Ord General G)

L'outil High/Low Clustering mesure la concentration de valeurs hautes ou basses pour une zone d'étude donnée.

Calculs

Formules mathématiques de la statistique General G

Consulter d'autres formules mathématiques relatives à la statistique General G.

Notez que la seule différence entre le numérateur et le dénominateur est la pondération (wij). La statistique High/Low Clustering fonctionne uniquement avec les valeurs positives. Par conséquent, si vos pondérations sont binaires (0/1) ou sont toujours inférieures à 1, la plage pour la statistique General G ira de 0 à 1. Une structure de pondération binaire est recommandée pour cette statistique. Sélectionnez Canal de distance constante, Contiguïté des polygones, K voisins les plus proches ou Triangulation de Delaunay pour le paramètre Conceptualisation de relations spatiales. Sélectionnez Aucun pour le paramètre Standardisation.

Interprétation

L'outil High/Low Clustering (Getis-Ord General G) génère une statistique inférentielle, ce qui signifie que les résultats de l'analyse sont interprétés dans le contexte de l'hypothèse nulle. L'hypothèse nulle de cette statistique suppose qu'il n'y a aucune agrégation spatiale de valeurs d'entité. Quand la valeur p renvoyée par cet outil est petite et statistiquement significative, l'hypothèse nulle peut être rejetée (voir Qu'est-ce qu'un score z ? Qu'est-ce qu'une valeur p ?). Si l'hypothèse nulle est rejetée, le signe du score z devient important. Si la valeur du score z est positive, l'indice General G observé est plus grand que l'indice General G attendu, indiquant par là que les valeurs élevées pour l'attribut sont agrégées dans la zone d'étude. Si la valeur de score z est négative, l'indice General G observé est plus petit que l'indice attendu, indiquant ainsi que les valeurs faibles sont agrégées dans la zone d'étude.

L'utilisation de l'outil High/Low Clustering (Getis-Ord General G) est appropriée lorsque vous disposez d'une distribution de valeurs relativement homogène et que vous recherchez des pointes spatiales inattendues de valeurs élevées. Malheureusement, lorsque les valeurs élevées et faibles s'agrègent toutes les deux, elles ont tendance à s'annuler entre elles. Si vous souhaitez mesurer l'agrégation spatiale lorsque à la fois les valeurs élevées et les valeurs faibles s'agrègent, utilisez l'outil Spatial Autocorrelation (Global Moran's I).

L'hypothèse nulle pour les outils High/Low Clustering (Getis-Ord General G) et Spatial Autocorrelation (Global Moran's I) est une structure totalement aléatoire (complete spatial randomness, CSR) ; les valeurs sont distribuées aléatoirement parmi les entités dans le jeu de données, reflétant ainsi des processus spatiaux aléatoires à l'œuvre. Toutefois, l'interprétation des scores z de l'outil High/Low Clustering (Getis-Ord General G) est très différente de l'interprétation des scores z de l'outil Spatial Autocorrelation (Global Moran's I) :

Résultat

Agrégation élevée/faible

Auto-corrélation spatiale

La valeur p n'est pas statistiquement significative.

Vous ne pouvez pas rejeter l'hypothèse nulle. Il est tout à fait possible que la distribution spatiale des valeurs d'attribut de l'entité soit le résultat de processus spatiaux aléatoires. Autrement dit, le modèle spatial observé de valeurs pourrait bien être l'un des innombrables scénarios possibles de structure totalement aléatoire.

La valeur p est statistiquement significative et le score z est positif.

Vous pouvez rejeter l'hypothèse nulle. La distribution spatiale de valeurs élevées dans le jeu de données fait l'objet d'une agrégation spatiale plus importante que si les processus spatiaux sous-jacents étaient aléatoires.

Vous pouvez rejeter l'hypothèse nulle. La distribution spatiale de valeurs élevées et/ou de valeurs faibles dans le jeu de données fait l'objet d'une agrégation spatiale plus importante que si les processus spatiaux sous-jacents étaient aléatoires.

La valeur p est statistiquement significative et le score z est négatif.

Vous pouvez rejeter l'hypothèse nulle. La distribution spatiale de valeurs faibles dans le jeu de données fait l'objet d'une agrégation spatiale plus importante que si les processus spatiaux sous-jacents étaient aléatoires.

Vous pouvez rejeter l'hypothèse nulle. La distribution spatiale de valeurs élevées et de valeurs faibles dans le jeu de données fait l'objet d'une dispersion spatiale plus importante que si les processus spatiaux sous-jacents étaient aléatoires. Un modèle spatial dispersé reflète souvent un processus de type concurrentiel : une entité présentant une valeur élevée repousse d'autres entités associées à des valeurs élevées ; de la même façon, une entité associée à une valeur faible repousse d'autres entités associées à des valeurs faibles.

Sortie

L'outil High/Low Clustering (Getis-Ord General G) renvoie cinq valeurs : General G observé, General G attendu, variance, score z et valeur p. Ces valeurs sont accessibles à partir de la fenêtre Résultats et sont transmises en tant que valeurs en sortie dérivées pour utilisation potentielle dans les modèles ou les scripts. Cet outil peut également créer un fichier HTML contenant un récapitulatif graphique des résultats. Double-cliquez sur le fichier HTML dans la fenêtre Résultats pour ouvrir le fichier HTML dans le navigateur Internet par défaut.

Vous pouvez également cliquer avec le bouton droit sur l'entrée Messages dans la fenêtre Résultats et sélectionnez Afficher pour consulter les résultats dans une boîte de dialogue de message.

Les résultats en sortie des outils sont accessibles dans la fenêtre Résultats.

Forum aux questions

Q : Les résultats de l'outil Hot Spot Analysis (Getis-Ord Gi*) indique des hot spots statistiquement significatifs. Pourquoi les résultats de l'outil High/Low Clustering (Getis-Ord General G) ne sont-ils pas également statistiquement significatifs ?

R : Les statistiques globales, auxquelles l'outil High/Low Clustering (Getis-Ord General G) se destine, évaluent le modèle et la tendance de vos données globalement. Elles sont très efficaces lorsque le modèle spatial est cohérent dans toute la zone d'étude. Les statistiques locales (cf. l'outil Hot Spot Analysis (Getis-Ord Gi*)) évaluent chaque entité dans un contexte d'entités voisines et comparent la situation locale à la situation globale. Prenons un exemple. Lorsque vous calculez une moyenne pour un ensemble de valeurs, vous calculez également une statistique globale. Si toutes les valeurs sont proches de 20, la moyenne se situera également autour de 20 et ce résultat constituera une très bonne représentation du jeu de données dans son ensemble. Mais si la moitié des valeurs est proche de 1 et l'autre moitié des valeurs est proche de 100, la moyenne se situera aux alentours de 50. Il se peut qu'aucune des valeurs de données n'approche de 50 et donc la valeur moyenne n'est pas représentative du jeu de données dans son ensemble. Toutefois, si vous créez un histogramme des valeurs des données, vous pourrez constater la distribution bimodale. De la même façon, les statistiques spatiales globales, notamment avec l'outil High/Low Clustering (Getis-Ord General G), sont très efficaces lorsque les processus spatiaux qui sont mesurés sont cohérents dans la zone d'étude. Les résultats constitueront alors une bonne représentation du modèle spatial global. Pour plus d'informations, reportez-vous à l'article de Getis et Ord (1992) cité ci-dessous et à l'analyse du syndrome de mort subite du nourrisson qu'ils présentent.

 

Q : Pourquoi les résultats de l'outil High/Low Clustering (Getis-Ord General G) sont-ils différents des résultats de l'outil Spatial Autocorrelation (Moran's I) ?

R : Consultez la table ci-dessus. Ces outils mesurent des modèles spatiaux différents.

 

: Est-il possible de comparer les scores z ou les valeurs p de cet outil aux résultats de l'analyse d'une zone d'étude différente ?

R : Les résultats issues de zones d'étude différentes ne sont pas comparables à moins que la zone d'étude et que les paramètres utilisés pour l'analyse soient fixes (identiques pour toutes les analyses que vous souhaitez comparer). Toutefois, si la zone d'étude comprend un ensemble fixe de polygones et que les paramètres d'analyse sont constants, vous pouvez comparer des scores z pour un attribut particulier dans le temps. Par exemple, supposons que vous souhaitiez analyser les tendances à l'agrégation en matière d'achat de médicaments sans ordonnance, au niveau des secteurs, pour un comté particulier. Vous pouvez exécuter l'outil High/Low Clustering (Getis-Ord General G) pour chaque période envisagée, puis créez une courbe des résultats. S'il se trouve que les scores z sont statistiquement significatifs et croissants, vous pouvez en conclure que l'intensité d'agrégation spatiale pour les valeurs élevées d'achat de médicaments augmente.

 

Q : La taille des entités impacte-elle l'analyse ?

R : La taille des entités peut affecter les résultats. Par exemple, si les grands polygones ont tendance à avoir des valeurs faibles et les polygones plus petits, à avoir des valeurs élevées, même si la concentration de valeurs faibles et élevées est homogène, l'indice General G observé peut être plus élevé que l'indice General G attendu, s'il y a plus de paires de petits polygones à la distance spécifiée.

Applications possibles

Ressources supplémentaires

Getis, Arthur et J. K. Ord. "The Analysis of Spatial Association by Use of Distance Statistics." Geographical Analysis 24, no. 3. 1992.

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.

9/13/2013