Funktionsweise der Hot-Spot-Analyse (Getis-Ord Gi*)
Mit dem Werkzeug Hot-Spot-Analyse wird die Getis-Ord Gi*-Statistik (ausgesprochen G-i-Sternchen) für die einzelnen Features eines Datasets berechnet. Anhand der sich ergebenden Z-Werte und p-Werte können Sie feststellen, wo Features mit hohen oder niedrigen Werten zur räumlichen Cluster-Bildung neigen. Mit diesem Werkzeug wird jedes Feature unter Berücksichtigung der benachbarten Features beurteilt. Ein Feature mit einem hohen Wert ist beachtenswert, es muss sich dabei jedoch nicht zwangsweise um einen statistisch signifikanten Hot Spot handeln. Ein statistisch signifikanter Hot Spot ist ein Feature mit einem hohen Wert, das darüber hinaus von anderen Features mit hohen Werten umgeben ist. Die lokale Summe eines Features und der benachbarten Features wird proportional mit der Summe aller Features verglichen. Wenn die lokale Summe sich erheblich von der erwarteten lokalen Summe unterscheidet und der Unterschied zu groß ist, um von einem willkürlichen Zufall herzurühren, handelt es sich um einen statistisch signifikanten Z-Wert. Bei Anwendung der FDR-Korrektur wird die statistische Signifikanz so angepasst, dass Mehrfachtests und räumliche Abhängigkeit einbezogen werden.
Berechnungen
Interpretation
Der als Gi*-Statistik zurückgegebene Wert jedes Features im Dataset ist ein Z-Wert. Bei statistisch signifikanten, positiven Z-Werten gilt, je höher der Z-Wert, desto dichter ist das Clustering hoher Werte (Hot Spot). Bei statistisch signifikanten, negativen Z-Werten gilt, je niedriger der Z-Wert, desto dichter ist das Clustering niedriger Werte (Cold Spot). Weitere Informationen zum Bestimmen der statistischen Signifikanz und zum Korrigieren für Mehrfachtests und räumliche Abhängigkeit finden Sie unter Was ist ein Z-Ergebnis? Was ist ein p-Wert?
Ausgabe
Mit diesem Werkzeug wird eine neue Ausgabe-Feature-Class mit einem Z-Ergebnis-, p-Wert- und Konfidenzniveau-Bin (Gi_Bin) für jedes Feature in der Eingabe-Feature-Class erstellt. Wenn ein Auswahlsatz auf die Eingabe-Feature-Class angewendet wird, werden nur selektierte Features analysiert und in der Ausgabe-Feature-Class angezeigt.
Bei Ausführung dieses Werkzeugs in ArcMap wird dem Inhaltsverzeichnis automatisch die Ausgabe-Feature-Class mit Standard-Rendering für das Gi_Bin-Feld hinzugefügt. Das Hot-to-Cold-Rendering wird durch eine Layer-Datei in <ArcGIS>/ArcToolbox/Templates/Layers definiert. Sie können das Standard-Rendering nach Bedarf erneut anwenden, indem Sie die Vorlagen-Layer-Symbologie importieren.
Überlegungen zur Hot-Spot-Analyse
Bei der Ausführung einer Hot-Spot-Analyse müssen drei Punkte beachtet werden:
- Was ist das Analysefeld (Eingabefeld)? Mit dem Hot-Spot-Analyse-Werkzeug wird bewertet, ob hohe oder niedrige Werte (z. B. die Anzahl von Straftaten, Unfallschwere oder aufgewendete Geldbeträge für Sportartikel) zur räumlichen Cluster-Bildung neigen. Das Feld mit diesen Werten ist das Analysefeld. Bei Punktereignisdaten sind Sie jedoch möglicherweise eher an der Einschätzung der Intensität eines Ereignisses interessiert und nicht so sehr an der Analyse der räumlichen Cluster-Bildung eines bestimmten Wertes, der mit diesen Ereignissen zusammenhängt. In diesem Fall müssen Sie die Ereignisdaten vor der Analyse zusammenfassen. Folgende Methoden sind möglich.
- Wenn das Untersuchungsgebiet Polygon-Features enthält, können Sie die Anzahl der Ereignisse in jedem Polygon mit dem Werkzeug Räumliche Verbindung zählen. Das Ergebnisfeld enthält die Anzahl der Ereignisse in jedem Polygon und stellt das Eingabefeld für die Analyse dar.
- Erstellen Sie mit dem Werkzeug Netz erstellen ein Polygon-Gitter über den Punkt-Features. Zählen Sie dann die Anzahl der Ereignisse in jedem Gitter-Polygon mit dem Werkzeug Räumliche Verbindung. Entfernen Sie alle Gitter-Polygone außerhalb des Untersuchungsgebiets. Wenn viele der Gitter-Polygone im Untersuchungsbereich NULL-Werte als Anzahl der Ereignisse enthalten, vergrößern Sie ggf. die Gittergröße des Polygons, oder entfernen Sie diese Gitter-Polygone mit NULL-Wert vor der Analyse.
- Wenn eine Reihe von lagegleichen Punkten oder Punkten, die in geringer Entfernung zu anderen Punkten liegen, vorhanden sind, können Sie alternativ mit der Funktion Integrieren des Werkzeugs Ereignisse erfassen (1) Features mit einer bestimmten Entfernung zueinander fangen und dann (2) eine neue Feature-Class mit einem Punkt an jeder eindeutigen Position mit zugehörigem Anzahl-Attribut erstellen, das die Anzahl der Ereignisse/gefangenen Punkte enthält. Verwenden Sie das resultierende ICOUNT-Feld als Eingabefeld für die Analyse. Hinweis:
Wenn Sie vermuten, dass es sich bei den lagegleichen Punkten um redundante Datensätze handeln könnte, können Sie Duplikate mit dem Werkzeug Identische finden suchen und entfernen.
- Welche Konzeptualisierung von räumlichen Beziehungen ist geeignet? Welches Entfernungsband oder welcher Entfernungsschwellenwert eignet sich am besten?
Die empfohlene (und standardmäßig verwendete) Konzeptualisierung von räumlichen Beziehungen für das Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*) ist Festes Entfernungsband. Aber auch Raum-Zeit-Fenster, Indifferenzzone, Nachbarschaft, Nächste Nachbarn (K) und Delaunay-Triangulation können möglicherweise verwendet werden. Informationen zu den Empfehlungen und Strategien zum Bestimmen eines Entfernungswertes für die Analyse finden Sie unter Auswählen eines Konzeptualisierung räumlicher Beziehungen und Auswählen eines Wertes für ein festes Entfernungsband. Weitere Informationen zur räumlichen und zeitlichen Hot-Spot-Analyse finden Sie unter Raum/Zeit-Analysen.
- Wie lautet die Frage?
Dies mag augenscheinlich auf der Hand liegen, aber die Konstruktionsweise der Option Eingabefeld für die Analyse bestimmt, welche Fragen Sie stellen können. Interessieren Sie sich besonders dafür, zu bestimmen, wo viele Ereignisse vorliegen oder wo hohe/niedrige Werte für ein bestimmtes Attribut zur räumlichen Cluster-Bildung neigen? Falls ja, führen Sie die Hot-Spot-Analyse mit den unverarbeiteten Werten oder der Anzahl der unverarbeiteten Ereignisse aus. Diese Art der Analyse ist vor allem bei Problemen mit der Ressourcenzuteilung hilfreich. Alternativ (oder zusätzlich) können Sie Gebiete mit unerwartet hohen Werten im Vergleich zu einer anderen Variable bestimmen. Wenn Sie etwa Zwangsvollstreckungen analysieren, erwarten Sie wahrscheinlich mehr Zwangsvollstreckungen an Orten mit mehr Häusern (oder anders ausgedrückt: ab einem gewissen Grad erwarten Sie, dass die Anzahl der Zwangsvollstreckungen eine Funktion der Anzahl der Häuser darstellt). Wenn Sie die Anzahl der Zwangsvollstreckungen durch die Anzahl der Häuser teilen und dann das Hot-Spot-Analyse-Werkzeug für dieses Verhältnis ausführen, fragen Sie nicht mehr danach, wo es viele Zwangsvollstreckungen gibt, sondern danach, wo es im Verhältnis zur Anzahl der Häuser eine unerwartet hohe Anzahl von Zwangsvollstreckungen gibt. Durch die Erstellung einer Rate oder eines Verhältnisses vor der Analyse können Sie überprüfen, ob bestimmte erwartete Beziehungen vorhanden sind (beispielsweise ist die Anzahl der Straftaten eine Funktion der Bevölkerung; die Anzahl der Zwangsvollstreckungen ist eine Funktion der vorhandenen Häuser), und unerwartete Hot Spots und Cold Spots identifizieren.
Richtlinien für bewährte Methoden
- Enthält die Eingabe-Feature-Class mindestens 30 Features? Bei weniger als 30 Features sind die Ergebnisse nicht zuverlässig.
- Ist die ausgewählte Konzeptualisierung von räumlichen Beziehungen geeignet? Bei diesem Werkzeug empfiehlt sich die Verwendung der Methode Festes Entfernungsband. Informationen zur räumlichen und zeitlichen Hot-Spot-Analyse finden Sie unter Auswählen einer Konzeptualisierung räumlicher Beziehungen.
- Ist das Entfernungsband oder der Entfernungsschwellenwert geeignet? Weitere Informationen finden Sie unter Auswählen eines Wertes für ein festes Entfernungsband.
- Jedes Feature sollte mindestens einen Nachbarn aufweisen.
- Kein Feature sollte alle anderen Features als Nachbarn haben.
- Besonders wenn die Werte für das Eingabefeld verzerrt sind, sollten die Features über jeweils ca. acht Nachbarn verfügen.
Potenzielle Anwendungsbereiche
Das Werkzeug kann bei der Analyse von Straftaten, Wahlmustern, Einzelhandelsdaten und Verkehrsereignissen oder in der Epidemiologie, ökonomischen Geographie und Demografie eingesetzt werden. Beispiele sind folgende Fragen:
- Wo bricht die Krankheit besonders häufig aus?
- Wo machen Küchenbrände eine höheren Anteil als erwartet von Wohnungsbränden aus?
- Wo sollten sich die Evakuierungsorte befinden?
- Wo/wann treten Spitzenwerte auf?
- An welchen Orten und zu welchen Zeiten sollten wir mehr Ressourcen zuweisen?
Zusätzliche Quellen
Mitchell, Andy. The Esri Guide to GIS Analysis, Volume 2.Esri Press, 2005.
Getis, A. und J.K. Ord. 1992. "The Analysis of Spatial Association by Use of Distance Statistics" in Geographical Analysis 24(3).
Ord, J.K. und A. Getis. 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" in Geographical Analysis 27(4).
Auf der Seite Spatial Statistics Resources werden kurze Videos, Lernprogramme, Online-Seminare, Artikel und eine Vielzahl anderer Materialien zur Verfügung gestellt, die Ihnen den Einstieg in räumliche Statistiken erleichtern.
Scott, L. und N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools in ArcUser Online, April bis Juni 2005.