Modellieren von räumlichen Beziehungen

Dieses Dokument enthält zusätzliche Informationen zu Werkzeugparametern, bietet aber auch eine Einführung in wichtige Terminologie und Begriffe, die beim Analysieren von Daten mithilfe der Werkzeuge für räumliche Statistik wichtig sind. Verwenden Sie dieses Dokument als Referenz, wenn Sie weitere Informationen zu Werkzeugparametern benötigen.

HinweisHinweis:
  • Für Berechnungen, die auf der euklidischen Entfernung oder der Manhattan-Distanz basieren, sind zur genauen Messung von Entfernungen projizierte Daten erforderlich. Immer dann, wenn die Entfernung eine Komponente der Analyse ist, was bei den Werkzeugen in der Toolbox "Spatial Statistics" fast immer der Fall ist, projizieren Sie die Daten daher mithilfe eines projizierten Koordinatensystems (anstelle eines geographischen Koordinatensystems, das auf Graden, Minuten und Sekunden basiert).
  • Die Werkzeuge in der Toolbox "Spatial Statistics" können nicht direkt mit XY-Ereignis-Layern verwendet werden. Verwenden Sie vor dem Ausführen der Analyse zunächst CopyFeatures zum Konvertieren der XY-Ereignisdaten in eine Feature-Class.
  • Denken Sie beim Verwenden von Shapefiles daran, dass diese keine NULL-Werte speichern können. Werkzeuge oder andere Verfahren zur Erstellung von Shapefiles aus Nicht-Shapefile-Eingaben speichern oder interpretieren NULL-Werte möglicherweise als Wert 0. In manchen Fällen werden NULL-Werte in Shapefiles als sehr große negative Werte gespeichert. Dies kann zu unerwarteten Ergebnissen führen. Weitere Informationen finden Sie unter Überlegungen zur Geoverarbeitung für die Shapefile-Ausgabe.

Konzeptualisierung von räumlichen Beziehungen

Ein wichtiger Unterschied zwischen räumlichen und herkömmlichen (lageunabhängigen oder nicht räumlichen) Statistiken besteht darin, dass bei den räumlichen Statistiken Raum und räumliche Beziehungen direkt in die Mathematik integriert sind. Infolgedessen muss der Benutzer bei vielen Werkzeugen der Toolbox "Spatial Statistics" einen Wert für den Parameter Konzeptualisierung von räumlichen Beziehungen auswählen. Allgemeine Konzeptualisierungen umfassen inverse Entfernung, Fahrzeit, feste Entfernung, nächste Nachbarn (K) und Nachbarschaft. Die verwendete Konzeptualisierung räumlicher Beziehungen ist davon abhängig, was gemessen wird. Wenn Sie die Cluster-Bildung einer bestimmten Art einer samenverbreitenden Pflanze messen, bietet sich die inverse Entfernung an. Wenn Sie jedoch die geographische Verteilung von Pendlern einer Region bewerten, sind die Fahrzeit oder die Reisekosten möglicherweise besser zum Beschreiben dieser räumlichen Beziehungen geeignet. Bei manchen Analysen sind Raum und Zeit vielleicht weniger wichtig als abstraktere Begriffe wie Vertrautheit (je vertrauter etwas ist, desto funktional näher ist es) oder räumliche Interaktion (zwischen Los Angeles und New York gibt es beispielsweise viel mehr Telefonanrufe als zwischen New York und einer Kleinstadt in der Nähe von New York, z. B. Poughkeepsie; man könnte daher argumentieren, dass sich Los Angeles und New York funktional näher sind).

Das Werkzeug Gruppierungsanalyse enthält den Parameter Räumliche Einschränkungen. Dessen Parameteroptionen ähneln zwar denen, die für den Parameter Konzeptualisierung von räumlichen Beziehungen beschrieben sind, doch werden sie unterschiedlich verwendet. Wenn eine räumliche Einschränkung vorgegeben wird, können nur Features, die mindestens einen Nachbarn gemeinsam haben (definiert durch Nachbarschaft, Nächster-Nachbar-Beziehungen oder Triangulationsmethoden), zu derselben Gruppe gehören. Weitere Informationen und Beispiele finden Sie im Thema Funktionsweise der Gruppierungsanalyse.

Die Optionen für den Parameter Konzeptualisierung von räumlichen Beziehungen werden nachfolgend erläutert. Durch die Option, die Sie auswählen, werden die Nachbarbeziehungen für Werkzeuge bestimmt, die jedes Feature innerhalb des Kontexts benachbarter Features bewerten. Diese Werkzeuge umfassen die Werkzeuge Räumliche Autokorrelation (Global Morans I), Hot-Spot-Analyse (Getis-Ord Gi*) und Cluster- und Ausreißeranalyse (Anselin Local Morans I). Beachten Sie, dass einige dieser Optionen nur verfügbar sind, wenn Sie die Werkzeuge Räumliche Gewichtungsmatrix erstellen oder Räumliche Gewichtung des Netzwerkes generieren verwenden.

Inverse Entfernung, inverse Entfernung im Quadrat (Impedanz)

Abbildung "Inverse Entfernung"

Aufgrund der Optionen für die inverse Entfernung weist das Konzeptmodell räumlicher Beziehungen Impedanz oder Entfernungsabhängigkeit auf. Alle Features beeinflussen alle anderen Features, je größer jedoch die Entfernung ist, desto geringer sind die Auswirkungen. Sie werden im Allgemeinen einen Wert für Entfernungsband oder Schwellenwertentfernung angeben, wenn Sie eine inverse Entfernungskonzeptualisierung verwenden, um die Anzahl der erforderlichen Berechnungen, besonders bei großen Datasets, zu reduzieren. Wenn kein Wert für das Entfernungsband oder die Schwellenwertentfernung angegeben wird, wird ein Standardschwellenwert für Sie berechnet. Sie können erzwingen, dass alle Features ein Nachbar aller anderen Features werden, indem Sie den Wert für Entfernungsband oder die Schwellenwertentfernung auf null festlegen.

Die inverse euklidische Entfernung ist für das Modellieren kontinuierlicher Daten wie Temperaturschwankungen geeignet. Die inverse Manhattan-Entfernung funktioniert am besten, wenn Analysen die Standorte von Baumärkten oder anderen festen städtischen Einrichtungen umfassen, wenn keine Straßennetzdaten verfügbar sind. Das Konzeptmodell bei Verwendung der Option "Inverse Entfernung im Quadrat" ist dasselbe wie bei "Inverse Entfernung", abgesehen davon, dass die Neigung stärker ist und der Einfluss von Nachbarn daher schneller abfällt; nur der nächste Nachbar eines Ziel-Features kann wesentlichen Einfluss auf die Berechnungen für dieses Feature ausüben.

Entfernungsband (Einflusszone)

Abbildung "Feste Entfernung"

Bei manchen Werkzeugen, z. B. Hot-Spot-Analyse, ist ein festes Entfernungsband die Standardkonzeptualisierung räumlicher Beziehungen. Mit der Option "Festes Entfernungsband" unterwerfen Sie die Daten einer Einflusszone oder verschieben das Fenster für das Konzeptmodell räumlicher Beziehungen auf die Daten. Jedes Feature wird innerhalb des Kontexts der benachbarten Features analysiert, die sich innerhalb der Entfernung befinden, die Sie für Entfernungsband oder Schwellenwertentfernung angeben. Nachbarn innerhalb der angegebenen Entfernung werden gleich gewichtet. Features außerhalb der angegebenen Entfernung beeinflussen die Berechnungen nicht (ihre Gewichtung ist null). Verwenden Sie die Methode "Festes Entfernungsband", wenn Sie die statistischen Eigenschaften Ihrer Daten bei einem bestimmten (festen) Maßstab berechnen möchten. Wenn Sie Pendelmuster untersuchen und wissen, dass die durchschnittliche Fahrtdauer zur Arbeit beispielsweise 15 Kilometer beträgt, können Sie eine feste Entfernung von 15 Kilometern für die Analyse verwenden. Unter Auswählen eines Wertes für ein festes Entfernungsband finden Sie Strategien, mit deren Hilfe Sie einen geeigneten Maßstab für die Analyse ermitteln können.

Indifferenzzone

Abbildung "Indifferenzzone"

Die Option "Indifferenzzone" für den Parameter Konzeptualisierung von räumlichen Beziehungen kombiniert die Modelle "Inverse Entfernung" und "Festes Entfernungsband". Features innerhalb des Entfernungsbands oder der Schwellenwertentfernung sind in Analysen für das Ziel-Feature enthalten. Sobald die kritische Entfernung überschritten wird, fällt die Einflussebene (die Gewichtung) schnell ab. Angenommen, Sie suchen nach einem Job und haben die Wahl zwischen einem Job in fünf Kilometern Entfernung und einem Job in sechs Kilometern Entfernung. Bei der Entscheidung, welcher Job der richtige ist, werden Sie wahrscheinlich nicht viel über die Entfernung nachdenken. Nehmen wir nun an, Sie haben die Wahl zwischen einem Job in fünf Kilometern Entfernung und einem Job in 20 Kilometern Entfernung. In diesem Fall gewinnt die Entfernung an Impedanz und kann bei der Entscheidungsfindung berücksichtigt werden. Verwenden Sie diese Methode, wenn Sie den Maßstab der Analyse fixiert halten möchten, die benachbarten Features, die in den Berechnungen der Ziel-Features enthalten sind, aber keinen zu engen Begrenzungen unterwerfen möchten.

Polygonnachbarschaft (erste Ordnung)

Bei Polygon-Feature-Classes können Sie CONTIGUITY_EDGES_ONLY (auch als "Rook's Case" bezeichnet) oder CONTIGUITY_EDGES_CORNERS (auch als "Queen's Case" bezeichnet) wählen. Bei EDGES_ONLY werden Polygone, die eine gemeinsame Kante (lagegleiche Grenzen) haben, in Berechnungen für das Zielpolygon einbezogen. Polygone, die keine gemeinsame Kante haben, werden aus den Berechnungen für das Ziel-Feature ausgeschlossen. Bei EDGES_CORNERS werden Polygone, die eine gemeinsame Kante und/oder eine gemeinsame Ecke haben, in Berechnungen für das Zielpolygon einbezogen. Wenn sich beliebige Teile der beiden Polygone überlappen, werden diese als Nachbarn betrachtet und in die jeweiligen Berechnungen einbezogen. Verwenden Sie eine dieser Nachbarschaftskonzeptualisierungen mit Polygon-Features, wenn Sie einen benachbarten Prozess modellieren oder mit kontinuierlichen Daten arbeiten, die als Polygone dargestellt werden.

Nächste Nachbarn (K)

Nachbarbeziehungen können auch so erstellt werden, dass jedes Feature innerhalb des räumlichen Kontextes einer angegebenen Anzahl seiner nächsten Nachbarn bewertet wird. Wenn K (die Anzahl der Nachbarn) 8 beträgt, dann werden die acht nächsten Nachbarn zum Ziel-Feature in die Berechnungen für dieses Feature eingeschlossen. An Orten, an denen die Feature-Dichte hoch ist, ist der räumliche Kontext der Analyse kleiner. In ähnlicher Weise ist der räumliche Kontext für die Analyse an Orten, an denen die Feature-Dichte niedrig, größer. Ein Vorteil dieses Modells räumlicher Beziehungen besteht darin, dass dadurch sichergestellt wird, dass für jedes Ziel-Feature Nachbarn vorhanden sind, auch dann, wenn die Feature-Dichte über das Untersuchungsgebiet hinweg stark variiert. Diese Methode ist über das Werkzeug Räumliche Gewichtungsmatrix erstellen verfügbar. Die Option K_NEAREST_NEIGHBORS mit 8 als Anzahl der Nachbarn ist die Standardkonzeptualisierung, die mit der Regressionsanalyse zum Bewerten von Regressionsresiduen verwendet wird.

Delaunay-Triangulation (natürliche Nachbarn)

Mit der Option "Delaunay-Triangulation" werden Nachbarn erstellt, indem Voronoi-Dreiecke aus Punkt-Features oder aus Feature-Schwerpunkten erstellt werden, sodass jeder Punkt/Schwerpunkt ein Dreiecksknoten ist. Knoten, die über eine Dreieckskante verbunden sind, werden als Nachbarn betrachtet. Mit der Delaunay-Triangulation kann sichergestellt werden, dass jedes Feature mindestens einen Nachbarn hat, auch dann, wenn die Daten Inseln und/oder stark variierende Feature-Dichten beinhalten. Verwenden Sie die Option für die Delaunay-Triangulation nicht bei lagegleichen Features. Diese Methode ist über das Werkzeug Räumliche Gewichtungsmatrix erstellen verfügbar.

Abbildung zur Delaunay-Triangulation

Raum-Zeit-Fenster

Mit dieser Option definieren Sie Feature-Beziehungen für ein Raum- (feste Entfernung) und ein Zeitfenster (festes Zeitintervall). Diese Option ist verfügbar, wenn Sie mit dem Werkzeug "Räumliche Gewichtungsmatrix erstellen" eine Datei mit einer räumlichen Gewichtungsmatrix erstellen. Wenn Sie SPACE_TIME_WINDOW auswählen, müssen Sie auch ein Datums-/Uhrzeitfeld, einen Intervalltyp von Datum/Uhrzeit (beispielsweise HOURS, DAYS oder MONTHS) sowie einen Intervallwert von Datum/Uhrzeit angeben. Der Intervallwert ist eine Ganzzahl. Wenn Sie zum Beispiel als Intervalltyp HOURS und als Intervallwert 3 ausgewählt haben, werden zwei Features als Nachbarn betrachtet, wenn sich die Werte in deren Datums-/Uhrzeitfeld um maximal drei Stunden unterscheiden. Bei Verwendung dieser Konzeptualisierung sind Features Nachbarn, wenn sie innerhalb der angegebenen Entfernung und zudem innerhalb des angegebenen Zeitintervalls des Ziel-Features liegen. Als mögliches Beispiel wählen Sie als Konzeptualisierung von räumlichen Beziehungen die Option SPACE_TIME_WINDOW, wenn Sie eine Datei mit einer räumlichen Gewichtungsmatrix erstellen möchten, die mit Hot_Spot_Analysis zum Ermitteln von Raum-Zeit-Hot-Spots verwendet werden kann. Weitere Informationen, unter anderem zum Visualisieren der Ergebnisse, finden Sie im Thema Raum/Zeit-Analysen.

Abrufen von räumlichen Gewichtungen aus Datei (benutzerdefinierte räumliche Beziehungen)

Eine Datei zum Speichern von Nachbarbeziehungen für Features können Sie mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen oder Räumliche Gewichtung des Netzwerkes generieren erstellen. Wenn Sie räumliche Beziehungen mit Fahrzeit oder Reisekosten definieren möchten, die aus einem Netzwerk-Dataset abgeleitet sind, erstellen Sie eine Datei mit einer räumlichen Gewichtungsmatrix mithilfe des Werkzeugs Räumliche Gewichtung des Netzwerkes generieren, und verwenden Sie dann die resultierende SWM-Datei für die Analysen. Wenn die räumlichen Beziehungen für die Features in einer Tabelle definiert sind, können Sie das Werkzeug Räumliche Gewichtungsmatrix erstellen verwenden, um diese Tabelle in eine Datei mit einer räumlichen Gewichtungsmatrix (SWM-Datei) zu konvertieren. Um mit der Option CONVERT_TABLE eine SWM-Datei zu erhalten, müssen bestimmte Felder in die Tabelle aufgenommen werden. Sie können auch einen Pfad zu einer formatiertenASCII-Textdatei bereitstellen, in der Ihre eigene benutzerdefinierte Konzeptualisierung räumlicher Beziehungen (beispielsweise auf Grundlage der räumliche Interaktion) definiert wird.

Auswählen eines Konzeptualisierung räumlicher Beziehungen: Empfehlungen

Je realistischer Sie modellieren können, wie Features im Raum interagieren, desto genauer werden die Ergebnisse. Ihre Auswahl für den Parameter Konzeptualisierung von räumlichen Beziehungen sollte inhärente Beziehungen unter den Features, die analysiert werden, widerspiegeln. Manchmal wird die Auswahl auch von Eigenschaften der Daten beeinflusst.

Die Methode Inverse Entfernung ist beispielsweise am besten für kontinuierliche Daten oder zum Modellieren von Prozessen geeignet, bei denen die Wahrscheinlichkeit, dass Features interagieren/sich gegenseitig beeinflussen umso größer ist, je näher sich diese beiden Features im Raum zueinander befinden. Bei dieser räumlichen Konzeptualisierung ist jedes Feature potenziell ein Nachbar jedes anderen Features, und bei großen Datasets ist die Anzahl der beteiligten Berechnungen sehr hoch. Bei Verwendung der inversen Entfernungskonzeptualisierung sollten Sie immer versuchen, einen Wert für Entfernungsband oder Schwellenwertentfernung einzuschließen. Dies ist für große Datasets besonders wichtig. Wenn Sie den Parameter Entfernungsband oder Schwellenwertentfernung leer lassen, wird eine Schwellenwertentfernung für Sie berechnet, es kann jedoch sein, dass dies nicht die angemessene Entfernung für die Analyse ist. Der standardmäßige Entfernungsschwellenwert ist die minimale Entfernung, bei der sichergestellt wird, dass das Feature mindestens einen Nachbarn hat.

Die Methode festes Entfernungsband ist für Punktdaten gut geeignet. Sie ist die vom Werkzeug Hot-Spot-Analyse (Getis-Ord Gi*) verwendete Standardoption. Häufig ist sie auch für Polygondaten eine gute Option, wenn diese hinsichtlich der Polygongröße stark variieren (beispielsweise sehr große Polygone am Rand des Untersuchungsgebiets und sehr kleine Polygone in der Mitte des Untersuchungsgebiets) und Sie einen einheitlichen Analysemaßstab sicherstellen möchten. Unter Auswählen eines Wertes für ein festes Entfernungsband weiter unten finden Sie Strategien, mit deren Hilfe Sie einen geeigneten Entfernungsbandwert für die Analyse ermitteln können.

Die Konzeptualisierung der Indifferenzzone funktioniert gut, wenn eine feste Entfernung angemessen ist, enge Begrenzungen für benachbarte Beziehungen jedoch keine genaue Darstellung Ihrer Daten sind. Bedenken Sie, dass bei dem Konzeptmodell der Indifferenzzone jedes Feature als Nachbar jedes anderen Features betrachtet wird. Diese Option ist daher nicht für große Datasets geeignet, da der angegebene Wert für Entfernungsband oder Schwellenwertentfernung die Anzahl der Nachbarn nicht einschränkt, sondern nur angibt, wo die Intensität von räumlichen Beziehungen abzunehmen beginnt.

Die Konzeptualisierungen der Polygonnachbarschaft sind hilfreich, wenn Polygone im Hinblick auf Größe und Verteilung ähnlich sind und wenn räumliche Beziehungen eine Funktion der Polygonnachbarschaft sind (die Idee, dass die räumliche Interaktion zwischen zwei Polygonen zunimmt, wenn diese eine gemeinsame Kante haben). Wenn Sie eine Konzeptualisierung der Polygonnachbarschaft auswählen, möchten Sie wahrscheinlich fast immer eine Zeilenstandardisierung für Werkzeuge auswählen, die über den Parameter Zeilenstandardisierung verfügen.

Die Option Nächste Nachbarn (K) ist hilfreich, wenn Sie sicherstellen möchten, dass eine minimale Anzahl von Nachbarn für die Analyse verfügbar ist. Insbesondere, wenn die mit den Features verknüpften Werte verzerrt (nicht normal verteilt) sind, ist es wichtig, dass jedes Feature innerhalb des Kontextes der ungefähr letzten acht Nachbarn ausgewertet werden (dies ist nur eine Faustregel). Wenn die Verteilung der Daten im Untersuchungsgebiet so variiert, dass sich einige Features sehr weit von allen anderen Features befinden, bietet sich diese Methode an. Beachten Sie jedoch, das sich der räumliche Kontext der Analyse in Abhängigkeit von Variationen im Hinblick auf die Seltenheit/Dichte der Features ändert. Wenn das Fixieren des Analysemaßstabs weniger wichtig als das Fixieren der Anzahl von Nachbarn ist, bietet sich die Methode "Nächste Nachbarn (K)" an.

Einige Analysten betrachten die Delaunay-Triangulation als eine Möglichkeit zur Erstellung natürlicher Nachbarn für einen Satz von Features. Diese Methode bietet sich an, wenn die Daten Inselpolygone (isolierte Polygone, die keine gemeinsamen Kanten mit anderen Polygonen haben) umfassen, oder in Fällen, in denen eine sehr ungleichmäßige räumliche Verteilung von Features vorhanden ist. Sie ist bei lagegleichen Features jedoch nicht geeignet. Durch die Delaunay-Triangulation wird, ähnlich wie bei der Methode "Nächste Nachbarn (K)", sichergestellt, dass jedes Feature mindestens einen Nachbarn hat, jedoch die Verteilung der Daten selbst verwendet wird, um zu bestimmen, wie viele Nachbarn jedes Feature erhält.

Mit den Optionen für Raum-Zeit-Fenster können Sie Feature-Beziehungen anhand ihrer räumlichen und zeitlichen Nähe definieren. Diese Option verwenden Sie, wenn Sie Raum-Zeit-Hot-Spots ermitteln oder aber Gruppen erstellen möchten, in denen die Mitgliedschaft durch räumliche und zeitliche Nähe eingeschränkt wird. Beispiele für Raum-Zeit-Analysen sowie Strategien für das effektive Rendering der Ergebnisse solcher Analysen finden Sie im Thema Raum/Zeit-Analysen.

Für einige Anwendungen kann die räumliche Interaktion am besten im Hinblick auf Fahrzeit oder Reisestrecke modelliert werden. Wenn Sie beispielsweise die Zugänglichkeit zu städtischen Diensten modellieren oder nach Orten mit hoher Kriminalität suchen, ist die Modellierung räumlicher Beziehungen hinsichtlich eines Netzwerks eine gute Wahl. Verwenden Sie das Werkzeug Räumliche Gewichtung des Netzwerkes, um vor der Analyse eine Datei mit einer räumlichen Gewichtungsmatrix (SWM-Datei) zu erstellen. Wählen Sie GET_SPATIAL_WEIGHTS_FROM_FILE für den Wert Konzeptualisierung von räumlichen Beziehungen aus, und geben Sie dann für den Parameter Gewichtungsmatrix-Datei den vollständigen Pfad zur eben erstellten SWM-Datei an.

TippTipp:

Das für Benutzer von ArcGIS kostenlose Data and Maps for ArcGIS enthält StreetMap-Daten, einschließlich eines vordefinierten Netzwerk-Datasets im SDC-Format. Abdeckung für dieses Dataset sind die USA und Kanada. Diese Netzwerk-Datasets können vom Werkzeug Räumliche Gewichtung des Netzwerkes generieren direkt verwendet werden.

Wenn für den Parameter Konzeptualisierung von räumlichen Beziehungen keine der Optionen gut für die Analyse funktioniert, können Sie eine ASCII-Textdatei oder eine Tabelle mit den Beziehungen von Feature zu Feature erstellen und diese zum Erstellen einer Datei mit einer räumlichen Gewichtungsmatrix verwenden. Wenn sich eine der obigen Optionen für Ihre Zwecke fast, aber nicht ganz optimal eignet, können Sie mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen eine einfache SWM-Datei erstellen und dann die Datei mit einer räumlichen Gewichtungsmatrix bearbeiten.

Auswählen eines Wertes für ein festes Entfernungsband

Stellen Sie sich das feste Entfernungsband, das Sie auswählen, als bewegliches Fenster vor, das sich vorübergehend auf jedem Feature niederlässt und dieses Feature innerhalb des Kontextes seiner Nachbarn betrachtet. Es gibt mehrere Richtlinien, die Ihnen dabei behilflich sind, ein geeignetes Entfernungsband für die Analyse zu finden:

  • Wählen Sie eine Entfernung basierend darauf aus, was Sie über die geographische Ausdehnung der räumlichen Prozesse wissen, die die Cluster-Bildung für die Phänomene fördert, die Sie betrachten. Häufig wissen Sie nichts darüber, aber wenn Sie es wissen sollten, sollten Sie einen entsprechenden Entfernungswert auswählen. Nehmen wir beispielsweise an, Sie wissen, dass die durchschnittliche Fahrt zur Arbeit 15 Kilometer beträgt. Es ist eine gute Strategie, wenn Sie 15 Kilometer für die Analyse der Pendlerdaten verwenden.
  • Verwenden Sie ein Entfernungsband, das groß genug ist, um sicherzustellen, dass alle Features mindestens einen Nachbarn haben. Andernfalls sind die Ergebnisse nicht gültig. Insbesondere, wenn die Eingabedaten verzerrt sind (also keine schöne Glockenkurve ergeben, wenn die Werte als Histogramm dargestellt werden), möchten Sie sicherstellen, dass das Entfernungsband weder zu klein (die meisten Features haben nur einen oder zwei Nachbarn) noch zu groß (mehrere Features umfassen alle anderen Features als Nachbarn) ist, da die Z-Werte dann weniger zuverlässig sind. Die Z-Werte sind zuverlässig (auch bei verzerrten Daten), solange das Entfernungsband groß genug ist, um sicherzustellen, dass jedes Feature mehrere Nachbarn (ungefähr acht) hat. Wenn Sie ein Entfernungsband erstellen, bei dem die Features Tausende von Nachbarn haben, können selbst dann Performanceprobleme und sogar potenzielle Speicherbeschränkungen auftreten, wenn keines der Features alle anderen Features als Nachbarn hat.
  • Manchmal führt die Sicherstellung, dass alle Features mindestens einen Nachbarn haben, dazu, dass manche Features viele Tausend Nachbarn haben. Das ist nicht ideal. Dieser Fall kann eintreten, wenn einige Features räumliche Ausreißer enthalten. Um dieses Problem zu lösen, bestimmen Sie ein geeignetes Entfernungsband für alle außer die räumlichen Ausreißer, und erstellen Sie mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen eine Datei mit einer räumlichen Gewichtungsmatrix mit dieser Entfernung. Wenn Sie das Werkzeug "Räumliche Gewichtungsmatrix erstellen" ausführen, geben sie jedoch für den Parameter Anzahl der Nachbarn einen Wert für die Mindestanzahl von Nachbarn an. Beispiel: Angenommen, Sie werten den Zugang zu gesunden Lebensmitteln in Los Angeles County anhand von Zählbezirksdaten aus. Sie wissen, dass über 90 Prozent der Bevölkerung innerhalb von drei Meilen von Einkaufsmöglichkeiten wohnen. Wenn Sie die Zählbezirke analysieren, stellen Sie fest, dass die Entfernungen zwischen Bezirken (zwischen den jeweiligen Bezirksschwerpunkten) im Stadtzentrum durchschnittlich etwa 1.000 Meter betragen, zwischen Bezirken in Außengebieten jedoch mehr als 18.000 Meter. Um sicherzustellen, dass jedes Feature mindestens einen Nachbarn hat, muss das Entfernungsband mehr als 18.000 Meter betragen, doch ist dieser Analysemaßstab (diese Entfernung) für Ihre Fragen nicht geeignet. Die Lösung besteht darin, mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen eine Datei mit einer räumlichen Gewichtungsmatrix für die Census Tract-Feature Class zu erstellen. Geben Sie einen Entfernungsschwellenwert von etwa 4.800 Metern (etwa drei Meilen) und für den Parameter Anzahl der Nachbarn eine Mindestzahl von Nachbarn (zum Beispiel 2) an. Damit wird die Nachbarschaft mit fester Entfernung von 4.800 Metern auf alle Features mit Ausnahme derer angewendet, die nicht mindestens zwei Nachbarn haben, die diese Entfernung aufweisen. Für diese Ausreißer-Features (und nur für diese) wird der Abstand gerade genug vergrößert, um sicherzustellen, dass jedes Feature mindestens zwei Nachbarn hat.
  • Verwenden Sie ein Entfernungsband, das die maximale räumliche Autokorrelation widerspiegelt. Immer dann, wenn Sie eine räumliche Cluster-Bildung in der Landschaft sehen, sehen Sie einen Beweis für die zugrunde liegenden räumlichen Prozesse, die arbeiten. Das Entfernungsband mit der maximalen Cluster-Bildung, wie vom Werkzeug Inkrementelle räumliche Autokorrelation gemessen, ist die Entfernung, bei der diese räumlichen Prozesse am aktivsten oder am auffälligsten sind. Führen Sie das Werkzeug "Inkrementelle räumliche Autokorrelation" aus, und achten Sie darauf, wo die resultierenden Z-Werte ihren Höhepunkt zu erreichen scheinen. Verwenden Sie die mit dem Höhepunktwert verknüpfte Entfernung für die Analyse.
    HinweisHinweis:

    Entfernungswerte müssen in den Einheiten eingegeben werden, die vom Ausgabe-Koordinatensystem der Geoverarbeitungsumgebung angegeben werden.

    • Jeder Höhepunkt stellt eine Entfernung dar, bei der die Prozesse, die eine räumliche Cluster-Bildung fördern, am stärksten sind. Häufig gibt es mehrere Höhepunkte. Die mit größeren Entfernungen verknüpften Höhepunkte spiegeln im Allgemeinen generelle Trends wider (beispielsweise einen allgemeinen Ost-West-Trend, bei dem der Westen ein großer Hot Spot und der Osten ein großer Cold Spot ist). Meist interessieren Sie sich wohl hauptsächlich für die Höhepunkte, die mit kleineren Entfernungen verknüpft sind, oft den ersten Höhepunkt.
    • Ein unauffälliger Höhepunkt bedeutet häufig, dass es viele unterschiedliche räumliche Prozesse gibt, die bei einer Vielzahl von räumlichen Maßstäben arbeiten. Sie möchten wahrscheinlich nach weiteren Kriterien suchen, um zu ermitteln, welche feste Entfernung für die Analyse verwendet werden soll (vielleicht die effektivste Distanz für die Korrektur).
    • Wenn der Z-Wert niemals einen Höhepunkt erreicht (also anders ausgedrückt immer nur steigt), und wenn Sie zusammengefasste Daten (z. B. Landkreise) verwenden, bedeutet dies in der Regel, dass das Zusammenfassungsschema zu grob ist; die räumlichen Prozesse arbeiten bei einem Maßstab, der kleiner als der Maßstab der zusammengefassten Einheiten ist. Wenn Sie zu einem kleineren Analysemaßstab wechseln (also zum Beispiel von Landkreisen zu Bezirken), können Sie möglicherweise eine Entfernung mit einem Höhepunkt finden. Wenn Sie mit Punktdaten arbeiten und der Z-Wert nie einen Höhepunkt erreicht, bedeutet dies, dass viele unterschiedliche räumliche Prozesse in verschiedenen räumlichen Maßstäben zum Tragen kommen und Sie wahrscheinlich mit unterschiedlichen Kriterien zum Bestimmen der festen Entfernung für die Analyse arbeiten müssen. Außerdem können Sie beim Ausführen des Werkzeugs Inkrementelle räumliche Autokorrelation überprüfen, ob die Anfangsentfernung nicht zu groß ist.
    • Wenn Sie keine Anfangsentfernung angeben, wird vom Werkzeug "Inkrementelle räumliche Autokorrelation" die Entfernung verwendet, mit der sichergestellt wird, dass alle Features mindestens einen Nachbarn haben. Wenn die Daten räumliche Ausreißer enthalten, kann diese Entfernung für die Analyse jedoch zu groß sein, was den Grund dafür bilden kann, dass in der Ausgabeberichtsdatei kein deutlicher Höhepunkt zu sehen ist. Die Lösung besteht darin, das Werkzeug "Inkrementelle räumliche Autokorrelation" für eine Auswahl auszuführen, aus der alle räumlichen Ausreißer vorübergehend ausgeschlossen wurden. Wenn nach Ausschluss der Ausreißer ein Höhepunkt gefunden wird, verwenden Sie die oben skizzierte Strategie, während diese Entfernung zwischen Höhepunkten auf alle Features (einschließlich der räumlichen Ausreißer) angewendet wird, und erzwingen Sie, dass jedes Feature mindestens einen oder zwei Nachbarn hat. Wenn Sie sich nicht sicher sind, ob die Features räumliche Ausreißer enthalten:
      • Bei Polygondaten rendern Sie Polygonflächen mit einem Rendering-Schema mit Standardabweichung, und betrachten Sie Polygone mit Flächen, deren Größe drei Standardabweichungen übersteigt, als räumliche Ausreißer. Mit Feld berechnen oder der Geometrieberechnung können Sie ein Feld mit Polygonflächen erstellen, wenn noch keines vorhanden ist.
      • Verwenden Sie bei Punktdaten das Werkzeug Nah, um die Entfernung zum nächsten Nachbar für jedes Feature zu berechnen. Dazu legen Sie die Eingabe-Features und die Near-Features auf das Punkt-Dataset fest. Sobald ein Feld mit Entfernungen zum nächsten Nachbarn vorhanden ist, rendern Sie diese Werte mit einem Rendering-Schema mit Standardabweichung, und betrachten Sie Entfernungen, deren Größe drei Standardabweichungen übersteigt, als räumliche Ausreißer.
    Diagramm zur inkrementellen räumlichen Autokorrelation
  • Versuchen Sie, sich nicht auf die Idee zu versteifen, dass es nur ein richtiges Entfernungsband gibt. Die Realität sieht nie so einfach aus. Es ist sehr wahrscheinlich, dass es mehrere/interagierende räumliche Prozesse gibt, die die beobachtete Cluster-Bildung fördern. Versteifen Sie sich nicht darauf, dass Sie ein Entfernungsband benötigen, sondern rufen Sie sich die Musteranalysewerkzeuge als effektive Methoden für das Erkunden räumlicher Beziehungen bei mehreren räumlichen Maßstäben ins Gedächtnis. Bedenken Sie, dass Sie bei einer Änderung des Maßstabs (Änderung des Wertes für das Entfernungsbands) eine andere Frage stellen könnten. Angenommen, Sie sehen sich Einkommensdaten an. Mit kleinen Entfernungsbändern können Sie Einkommensmuster der Nachbarschaft untersuchen, mit mittleren Maßstabsentfernungen können Einkommensmuster von Gemeinden oder der Stadt widergespiegelt werden, und mit den größten Entfernungsbändern könnten Sie umfangreiche regionale Einkommensmuster hervorheben.

Entfernungsmethode

Viele der Werkzeuge in der Toolbox "Spatial Statistics" verwenden Entfernungen in ihren Berechnungen. Bei diesen Werkzeugen können Sie entweder die euklidische oder die Manhattan-Entfernung auswählen.

D = sq root [(x1–x2)**2.0 + (y1–y2)**2.0]

wobei (x1, y1) die Koordinate für Punkt A, (x2, y2) die Koordinate für Punkt B und D die geradlinige Entfernung zwischen Punkt A und Punkt B ist.

Euklidische Entfernung
D = abs(x1–x2) + abs(y1–y2)

wobei (x1, y1) die Koordinate für Punkt A, (x2, y2) die Koordinate für Punkt B und D die vertikale und die horizontale Differenz zwischen Punkt A und Punkt B ist. Dies ist die Entfernung, die Sie zurücklegen müssen, wenn es eine Beschränkung auf Reisen von Norden nach Süden und von Osten nach Westen gibt. Diese Methode passt im Allgemeinen besser als die euklidische Entfernung, wenn Reisen auf ein Straßennetz beschränkt sind und tatsächliche Reisekosten für das Straßennetz nicht verfügbar sind.

Manhattan-Entfernung

Eigenpotenzial (Feld, das eine intrazonale Gewichtung verleiht)

Bei mehreren Werkzeugen in der Toolbox "Spatial Statistics" können Sie ein Feld angeben, das die für das Eigenpotenzial zu verwendende Gewichtung darstellt. Eigenpotenzial ist die Entfernung oder die Gewichtung zwischen einem Feature und sich selbst. Oft ist diese Gewichtung null. In manchen Fällen möchten Sie jedoch eventuell einen anderen festen Wert oder einen unterschiedlichen Wert für jedes Feature angeben. Wenn die Konzeptualisierung von räumlichen Beziehungen auf Entfernungen basiert, die innerhalb und unter Zählbezirken zurückgelegt werden, können Sie beispielsweise ein Eigenpotenzial modellieren, um die durchschnittlichen intrazonalen Reisekosten basierend auf der Polygongröße widerzuspiegeln:

dii = 0.5*[(Ai / π)**0.5]

wobei dii die Reisekosten sind, die mit der intrazonalen Reise für das Polygon-Featurei verknüpft sind, und Ai die mit dem Polygon-Featurei verknüpfte Fläche ist.

Standardisierung

Eine Zeilenstandardisierung wird immer dann empfohlen, wenn die Verteilung der Features aufgrund einer Referenzpunkterfassung oder eines auferlegten Zusammenfassungsschemas möglicherweise verzerrt ist. Wenn die Zeilenstandardisierung ausgewählt wird, wird jede Gewichtung durch ihre eigene Zeilensumme (die Summe der Gewichtungen aller benachbarten Features) dividiert. Eine zeilenstandardisierte Gewichtung wird häufig bei Nachbarschaften mit festen Entfernungen und fast immer bei Nachbarschaften basierend auf Polygonnachbarschaft verwendet. Dadurch soll die Verzerrung aufgrund von Features mit einer unterschiedlichen Anzahl von Nachbarn abgeschwächt werden. Durch eine Zeilenstandardisierung werden alle Gewichtungen so skaliert, dass sie zwischen 0 und 1 liegen; dadurch wird ein relatives (und kein absolutes) Gewichtungsschema geschaffen. Wenn Sie mit Polygon-Features arbeiten, die Verwaltungsgrenzen darstellen, möchten Sie eventuell die Option "Zeilenstandardisierung" auswählen.

Beispiele:

Entfernungsband oder Schwellenwertentfernung

Entfernungsband oder Schwellenwertentfernung legt den Analysemaßstab für die meisten Konzeptualisierungen von räumlichen Beziehungen fest (z. B. inverse Entfernung, feste Bandentfernung) fest. Es handelt sich dabei um einen positiven Zahlenwert, der einen Entfernungsgrenzwert darstellt. Features außerhalb des angegebenen Grenzwertes für ein Ziel-Feature werden in der Analyse für dieses Feature ignoriert. Mit der Indifferenzzone wird jedoch der Einfluss von Features außerhalb der angegebenen Entfernung im Verhältnis zur Nähe reduziert, während die Features innerhalb des Entfernungsschwellenwertes gleichmäßig berücksichtigt werden.

Es ist wichtig, dass eine angemessene Entfernung ausgewählt wird. Einige räumliche Statistiken erfordern, dass jedes Feature mindestens einen Nachbarn hat, damit die Analyse zuverlässig ist. Wenn der Wert, den Sie für Entfernungsband oder Schwellenwertentfernung festlegen, zu klein ist (sodass einige Features keine Nachbarn haben), wird eine Warnmeldung angezeigt, in der vorgeschlagen wird, dass Sie es mit einem größeren Entfernungswert erneut versuchen. Das Werkzeug Entfernungsband anhand der Anzahl der Nachbarn berechnen wertet die minimale, durchschnittliche und maximale Entfernung für eine angegebene Anzahl von Nachbarn aus und kann bei der Bestimmung eines geeigneten Wertes für das Entfernungsband helfen, der für die Analyse verwendet werden soll. Unter Auswählen eines festen Wertes für das Entfernungsband finden Sie weitere Informationen.

Wenn kein Wert angegeben wird, wird eine standardmäßige Schwellenwertentfernung berechnet. In der Tabelle unten ist angegeben, wie sich unterschiedliche Optionen für den Parameter Konzeptualisierung von räumlichen Beziehungen für jede der drei möglichen Eingabetypen verhalten (negative Werte sind nicht gültig):

Inverse Entfernung, Inverse Entfernung im Quadrat

Festes Entfernungsband, Indifferenzzone

Polygonnachbarschaft, Delaunay-Triangulation, Nächste Nachbarn (K)

0

Es wird kein Schwellenwert oder Grenzwert angewendet; jedes Feature ist ein Nachbar von jedem anderen Feature.

Ungültig. Laufzeitfehler wird generiert.

Ignoriert.

Leer

Eine Standardentfernung wird berechnet. Dieser Standard ist die minimale Entfernung, bei der sichergestellt wird, dass jedes Feature mindestens einen Nachbarn hat.

Eine Standardentfernung wird berechnet. Dieser Standard ist die minimale Entfernung, bei der sichergestellt wird, dass jedes Feature mindestens einen Nachbarn hat.

Ignoriert.

positive Zahl

Der positive Wert, der nicht null ist, wird als Grenzentfernung verwendet; Nachbarbeziehungen sind nur unter Features innerhalb dieser Entfernung voneinander vorhanden.

Für das feste Entfernungsband sind nur Features innerhalb dieses angegebenen Grenzwertes voneinander Nachbarn. Für die Indifferenzzone sind Features innerhalb dieses angegebenen Grenzwertes voneinander Nachbarn; Features außerhalb des Grenzwertes sind auch Nachbarn, aber diesen ist eine kleinere Gewichtung und ein kleinerer Einfluss zugewiesen, wenn die Entfernung zunimmt.

Ignoriert.

Optionen für Entfernungsband

Anzahl der Nachbarn

Geben Sie eine positive Ganzzahl an, um die Anzahl von Nachbarn darzustellen, die in die Analyse für jedes Ziel-Feature eingeschlossen werden soll. Wenn der für die Konzeptualisierung von räumlichen Beziehungen ausgewählte Wert Nächste Nachbarn (K) ist, wird jedes Ziel-Feature innerhalb des Kontexts der nächsten K Features ausgewertet (wobei K die Anzahl der Nachbarn ist, die angegeben wurde). Bei der inversen Entfernung oder dem festen Entfernungsband wird beim Ausführen des Werkzeugs Räumliche Gewichtungsmatrix erstellen durch Angabe eines Wertes für den Parameter Anzahl der Nachbarn sichergestellt, dass jedes Features mindestens K Nachbarn hat. Bei der Polygonnachbarschaft wird der für Anzahl der Nachbarn angegebene Wert nur auf Inselpolygone angewendet: Die K nächsten Polygone zu jedem Zielinselpolygon werden für die Analyse als Nachbarn betrachtet. Beim Werkzeug Räumliche Gewichtung des Netzwerks generieren wird durch Angeben eines Wertes für den Parameter Maximale Anzahl von Nachbarn sichergestellt, dass kein Feature über mehr Nachbarn als festgelegt verfügt. Beim Werkzeug Gruppierungsanalyse wird durch Angeben eines Wertes für die Anzahl der Nachbarn die Nähe der Features innerhalb jeder Gruppe gefördert. Wenn Sie beispielsweise 6 Nachbarn angeben, beschränken Sie die Gruppen auf Features, die mindestens einen von sechs nächsten Nachbarn mit anderen Features in der Gruppe gemeinsam haben.

Datei mit Gewichtungsmatrix

Mit einigen Werkzeugen können Sie räumliche Beziehungen unter Features definieren, indem Sie einen Pfad zu einer Datei mit räumlichen Gewichtungsmatrix angeben. Räumliche Gewichtungen sind Zahlen, die die Entfernung, Zeit oder andere Kosten zwischen jedem Feature und allen anderen Features im Dataset widerspiegeln. Die Datei mit räumlicher Gewichtungsmatrix kann mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen oder Werkzeug Räumliche Gewichtung des Netzwerkes generieren erstellt werden oder kann eine einfache ASCII-Datei sein.

Wenn die Datei mit räumlicher Gewichtungsmatrix eine einfache ASCII-Textdatei ist, sollte die erste Zeile der Name eines eindeutigen ID-Feldes sein. Dies gibt Ihnen die Flexibilität, ein beliebiges Zahlenfeld im Dataset als ID zu verwenden, wenn Sie diese Datei generieren; das ID-Feld muss jedoch vom Typ INTEGER sein und Einzelwerte für jedes Feature aufweisen. Nach der ersten Zeile sollte die Datei mit räumlichen Gewichtungen in drei Spalten formatiert werden:

Nehmen wir zum Beispiel an, Sie besitzen drei Tankstellen. Das Feld, das Sie als ID-Feld verwenden, hat den Namen StationID, und die Feature-IDs lauten 1, 2 und 3. Sie möchten räumlichen Beziehungen unter diesen drei Tankstellen mithilfe der Fahrzeit in Minuten modellieren. Sie können eine ASCII-Datei erstellen, die folgendermaßen aussieht:

ASCII-Datei

Wenn Gewichtungen eine Entfernung oder Zeit darstellen, werden sie in der Regel invertiert (z. B. 1/10, wenn die Entfernung 10 Kilometer oder 10 Minuten ist), damit nähere Features eine größere Gewichtung haben als Features, die weiter entfernt sind. Beachten Sie bei den Gewichtungen oben, dass Tankstelle 1 10 Minuten von Tankstelle 2 entfernt ist. Beachten Sie auch, dass die Fahrzeit in diesem Beispiel nicht symmetrisch ist (die Fahrt von Tankstelle 1 zu Tankstelle 3 beträgt 7 Minuten, die Fahrt von Tankstelle 3 zu Tankstelle 1 beträgt jedoch nur 6 Minuten). Die Gewichtung zwischen Tankstelle 1 und sich selbst beträgt 0, und es ist kein Eintrag für die Tankstelle 2 zu sich selbst vorhanden. Bei fehlenden Einträgen wird eine Gewichtung von 0 angenommen.

Das Eingeben der Werte für die Datei mit räumlicher Gewichtungsmatrix ist sehr mühevoll, auch bei kleinen Datasets. Ein besserer Ansatz besteht darin, das Werkzeug Räumliche Gewichtungsmatrix erstellen zu verwenden oder ein kurzes Python-Skript zu schreiben, das diesen Task für Sie ausführt.

Datei mit räumlicher Gewichtungsmatrix (SWM-Datei)

Mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen oder Räumliche Gewichtung des Netzwerkes generieren wird eine Binärdatei mit räumlicher Gewichtungsmatrix (SWM-Datei) erstellt, die die räumlichen Beziehungen unter allen Features im Dataset auf Grundlage der angegebenen Parameter definiert. Diese Datei wird in binärem Dateiformat erstellt, sodass die Werte in der Datei nicht direkt angezeigt werden können. Zum Anzeigen oder Bearbeiten der Feature-Beziehungen in einer SWM-Datei verwenden Sie das Werkzeug Räumliche Gewichtungsmatrix in Tabelle konvertieren.

Wenn die räumlichen Beziehungen zwischen den Features in einer Tabelle gespeichert werden, können Sie das Werkzeug Räumliche Gewichtungsmatrix erstellen verwenden, um diese Tabelle in eine Datei mit einer räumlichen Gewichtungsmatrix (SWM) zu konvertieren. Die Tabelle benötigt die folgenden Felder:

Feldname

Beschreibung

<Eindeutiger ID-Feldname>

Ein Ganzzahlfeld, das in der Eingabe-Feature-Class mit einer eindeutigen ID für jedes Feature vorhanden ist. Dies ist die Quell-Feature-ID.

NID

Ein Ganzzahlfeld, das die Feature-IDs der Nachbarn enthält. Dies ist die Ziel-Feature-ID.

GEWICHTUNG

Dies ist die numerische Gewichtungsquantifizierung der räumlichen Beziehung zwischen den Quell- und Ziel-Features. Größere Werte spiegeln größere Gewichtungen und stärkeren Einfluss bzw. Interaktion zwischen zwei Features wider.

Erforderliche Tabellenfelder

Freigeben von Dateien mit räumlicher Gewichtungsmatrix

Die Ausgabe der Werkzeuge Räumliche Gewichtungsmatrix erstellen und Räumliche Gewichtung des Netzwerkes generieren ist eine SWM-Datei. Diese Datei wird beim Erstellen mit der Eingabe-Feature-Class, dem eindeutigen ID-Feld und den Einstellungen für das Ausgabe-Koordinatensystem verknüpft. Andere Personen können die räumlichen Beziehungen duplizieren, die Sie für die Analyse definieren, indem sie die SWM-Datei und entweder dieselbe Eingabe-Feature-Class oder eine Feature-Class verwenden, die alle oder einige Features mit einem passenden eindeutigen ID-Feld verknüpft. Insbesondere, wenn Sie planen, die SWM-Dateien für andere freizugeben, sollten Sie versuchen, Situationen zu vermeiden, in denen sich das Ausgabe-Koordinatensystem von dem Raumbezug unterscheidet, der mit der Eingabe-Feature-Class verknüpft ist. Eine bessere Strategie besteht darin, die Eingabe-Feature-Class zu projizieren und dann vor dem Erstellen der Dateien mit räumlicher Gewichtungsmatrix das Ausgabe-Koordinatensystem auf denselben Wert wie die Eingabe-Feature-Class festzulegen.

Verwandte Themen

9/12/2013