Raum-Zeit-Cluster-Analysen
Daten verfügen sowohl über einen räumlichen als auch zeitlichen Kontext: Alles passiert an einem bestimmten Ort und zu einem bestimmten Zeitpunkt. Mit verschiedenen Werkzeugen, darunter Hot-Spot-Analyse, Cluster- und Ausreißeranalyse und Gruppierungsanalyse, können Sie diese Aspekte der Daten optimal nutzen. Wenn Sie sowohl den räumlichen als auch den zeitlichen Kontext der Daten heranziehen, lassen sich dadurch beispielsweise folgende Fragen beantworten:
- Wo befinden sich die zeitlichen und räumlichen Kriminalitäts-Hot-Spots? Wenn Sie auf die Kriminalitätsanalyse spezialisiert sind, können Sie mithilfe der Ergebnisse, die eine räumliche und zeitliche Hot-Spot-Analyse liefert, sicherstellen, dass Polizeikräfte möglichst effektiv eingesetzt werden. Die Polizeikräfte müssen zur richtigen Zeit und am richtigen Ort eingesetzt werden.
- Wo treten Zahlungsunstimmigkeiten auf? Bei der Betrugsbekämpfung können Sie mithilfe der Cluster- und Ausreißeranalyse das Ausgabeverhalten untersuchen und dabei räumliche und zeitliche Ausreißer ermitteln. Wenn sich die Ausgabemuster oder die Ausgabehäufigkeit plötzlich ändern, kann dies auf verdächtige Aktivitäten hinweisen.
- Wie sehen die Charakteristiken eines Bakterienausbruchs aus? Angenommen, Sie untersuchen Salmonellenproben von Milchbetrieben in Ihrem Bundesland. Um einzelne Ausbrüche zu charakterisieren, können Sie eine Gruppenanalyse für die Probendaten ausführen, wobei die Gruppenzugehörigkeit sowohl räumlich als auch zeitlich eingeschränkt wird. Zeitlich und räumlich ähnliche Proben sind mit hoher Wahrscheinlichkeit demselben Ausbruch zuzuordnen.
Mehrere Werkzeuge der Toolbox "Spatial Statistics" werten einzelne Features innerhalb des Kontexts ihrer benachbarten Features aus. Wenn Nachbarbeziehungen sowohl räumlich als auch zeitlich definiert sind, wird die herkömmliche räumliche Analyse zu einer Zeit-Raum-Analyse. Um Nachbarbeziehungen mit räumlichen und zeitlichen Parametern zu definieren, verwenden Sie das Werkzeug Räumliche Gewichtungsmatrix erstellen und wählen die Option SPACE_TIME_WINDOW für den Parameter Konzeptualisierung von räumlichen Beziehungen aus. Geben Sie dann einen Entfernungsschwellenwert und ein Zeitintervall (Intervalltyp von Datum/Uhrzeit und Intervallwert von Datum/Uhrzeit) an. Wenn Sie zum Beispiel eine Entfernung von 1 Kilometer und ein Zeitintervall von 7 Tagen angeben, werden solche Features zusammen analysiert, die sich in einer Entfernung innerhalb eines Kilometers befinden und über einen Datums-/Zeitstempel verfügen, der innerhalb von sieben Tagen zwischen den Features liegt. Auf ähnliche Weise werden Features, die innerhalb eines Kilometers beieinander liegen, jedoch nicht in das Zeitintervall von sieben Tagen fallen, nicht als benachbarte Features betrachtet.
Zeitschnappschüsse und mehr
Eine häufige Vorgehensweise, um die räumlichen und zeitlichen Trends von Daten zu ermitteln, besteht darin, die Daten in eine Reihe von Zeitschnappschüssen zu unterteilen. Sie können zum Beispiel separate Datasets für Woche 1, Woche 2, Woche 3, Woche 4 und Woche 5 erstellen. Anschließend können Sie die einzelnen Wochen separat analysieren und die Analyseergebnisse als eine Reihe von Karten oder eine Animation präsentieren. Auch wenn dies eine effektive Möglichkeit ist, Trends darzustellen, erfolgt die Aufteilung der Daten jedoch eher willkürlich. Wenn Sie die Daten zum Beispiel auf Wochenbasis analysieren, wie entscheiden Sie, wo eine Woche endet und die neue Woche beginnt? Beginnt die neue Woche am Sonntag oder am Montag? Oder sollen die Daten von Montag bis Donnerstag und dann erneut von Freitag bis Sonntag analysiert werden? Und warum soll die Analyse gerade in Wochenintervallen erfolgen? Ist eine tägliche oder monatliche Analyse möglicherweise nicht sinnvoller? Die Auswirkungen sind möglicherweise bedeutsam, wenn durch die Aufteilung (z. B. Ereignisse am Sonntag werden von Ereignissen am Montag getrennt) Features voneinander getrennt werden, die eigentlich zusammengehören. In dem unten aufgeführten Beispiel fallen sechs Features in das Raum-Zeit-Fenster von 1 km und 7 Tagen des Features Jan 31. Es wird jedoch nur ein Feature als Nachbar einbezogen, wenn die Daten in monatlichen Schnappschüssen analysiert werden.
Wenn Sie Feature-Beziehungen mit dem SPACE_TIME_WINDOW definieren, erstellen Sie keine Schnappschüsse der Daten. Stattdessen werden alle Daten für die Analyse herangezogen. Features, die räumlich und zeitlich nahe beieinander liegen, werden zusammen analysiert, da alle Feature-Beziehungen in Bezug auf die Position und den Zeitstempel des Ziel-Features ausgewertet werden. Im oben aufgeführten Beispiel (A.) werden durch das Raum-Zeit-Fenster von 1 km und 7 Tagen sechs Nachbarn für das Feature Jan 31 ermittelt.
Angenommen, Sie analysieren Waldbrände in einer Region. Wenn Sie das Werkzeug Hot-Spot-Analyse mit der standardmäßigen FIXED_DISTANCE_BAND-Konzeptualisierung zum Definieren der Feature-Beziehungen verwenden, erhalten Sie als Ergebnis eine Karte mit statistisch relevanten Waldbrand-Hot-Spots und -Cold-Spots. Wenn Sie die Analyse dann erneut ausführen, dabei jedoch die räumlichen Beziehungen dieses Mal als ein SPACE-TIME WINDOW definieren, können Sie sehen, dass einige dieser Hot-Spots jahreszeitlich bedingt sind. Die Einsicht in die zeitlichen Eigenschaften der Waldbrände hat wichtige Auswirkungen auf die Zuteilung der Ressourcen für die Brandbekämpfung.
Visualisieren von Raum-Zeit-Ergebnissen
Auf Heatmaps werden Bereiche mit hoher Intensität (Hot Spots) in der Regel rot und Bereiche mit geringer Intensität (Cold Spots) blau dargestellt. In der unten dargestellten Grafik stellen die roten Bereiche die Orte dar, an denen die meisten Notrufe getätigt werden. In den blauen Bereichen werden relativ wenige Notrufe getätigt. Wie können Sie der unten dargestellten Karte Informationen über die zeitliche Dimension von Notrufen hinzufügen? Wie können Sie auf effektive Weise Dinge wie einzelne Ausbrüche, eine Verbrechensserie, die Auswirkungen der Akzeptanz einer neuen Technologie oder die jahreszeitlichen Schwingungen von Sturmmustern anhand von Karten darstellen?
Die Darstellung von dreidimensionalen Daten (x- und y-Position plus Zeit) in einer zweidimensionalen Karte ist schwierig. Beachten Sie, dass Sie im unten dargestellten Beispiel erst dann erkennen können, dass es zwei deutliche Hot-Spots gibt (räumlich nahe beieinander, zeitlich jedoch voneinander entfernt), wenn die Daten dreidimensional dargestellt werden. Indem die Features basierend auf einem Zeitfeld extrudiert werden, wird deutlicher, welche Features zeitlich verbunden und zeitlich getrennt sind.
Es gibt mindestens zwei Möglichkeiten, die Ausgabe von Raum-Zeit-Analysen zu visualisieren. Die dreidimensionale Visualisierung ist effektiv, wenn Sie über einen kleineren Untersuchungsbereich mit einer begrenzten Anzahl von Features verfügen. Hierbei können Sie die Raum-Zeit-Beziehungen in einer einzelnen Karte darstellen. Animationen sind eine andere sehr effektive Möglichkeit, Raum-Zeit-Prozesse darzustellen. Die unten dargestellten Beispiele beziehen sich speziell auf die Visualisierung von Raum-Zeit-Clustern.
Animation
Um Raum-Zeit-Cluster zu animieren, aktivieren Sie die Zeit für die Ergebnis-Features, öffnen Sie in der Werkzeugleiste "Extras" den Zeitschieberegler, und klicken Sie auf Wiedergabe. Legen Sie ein Zeitfenster fest, mit dem Sie in einem Schritt ausreichende Daten auf einmal anzeigen können. Wenn Sie mit der Erstellung von Animationen noch nicht vertraut sind, folgen Sie den unten aufgeführten Links.
3D
Eine andere äußerst wirkungsvolle Methode zum Visualisieren der Ergebnisse einer Raum-Zeit-Cluster-Analyse ist die 3D-Visualisierung. Bei dieser Methode stellt die Zeit die dritte Dimension dar und Punkt-Features werden zur Darstellung des zeitlichen Fortschritts extrudiert. In der oben dargestellten 3D-Grafik befinden sich die ältesten Ereignisse zum Beispiel am weitesten unten und die aktuelleren Ereignisse werden weiter oben dargestellt, sodass sie dem Betrachter näher erscheinen.
Um eine 3D-Darstellung Ihrer Daten ähnlich der oben aufgeführten zu erstellen, müssen Sie ArcGlobe verwenden (in der Standardinstallation von ArcGIS for Desktop enthalten).
Führen Sie zunächst die Raum-Zeit-Cluster-Analyse in ArcGlobe durch, und erstellen Sie dann ein neues Feld in der Ausgabe-Feature-Class, um die Höhe der einzelnen Features wiederzugeben. In diesem Beispiel basieren die Höhen auf der Anzahl der Tage, die seit dem Auftreten des ersten Ereignisses im Dataset vergangen sind. Zum Berechnen der Zeitspanne verwenden Sie ein VB-Skript und die Datumsfunktion "DateDiff", wie nachfolgend dargestellt.
Wenn Sie der Ausgabe-Feature-Class aufgrund einer Sperre kein neues Feld hinzufügen können, speichern Sie das ArcGlobe-Dokument und öffnen Sie es erneut, oder exportieren Sie die Ausgabe-Feature-Class in ein neues Dataset, fügen Sie es dem Kartendokument hinzu, und symbolisieren Sie es entsprechend der Ausgabe-Feature-Class.
Sortieren Sie die Features anschließend nach Datum, sodass Sie das früheste Datum ermitteln können. Anhand dieses Datums werden die Werte für das neue Zeitspannenfeld berechnet. Klicken Sie mit der rechten Maustaste auf das gerade erstellte Feld, und wählen Sie Feldberechnung. Klicken Sie in der Feldberechnung auf die Typfunktionen Datum, und wählen Sie im rechten Bereich der Feldberechnung die OptionDateDiff, wie unten dargestellt. Geben Sie DateDiff ( "d", "3/1/2011", [DateField] ) ein, wobei Sie die Datumszeichenfolge durch das früheste Datum in Ihrer Feature-Class ersetzen und für den Parameter [DateField] den Namen Ihres neuen Feldes eingeben ("d" gibt an, dass das Differenzintervall in Tagen angegeben wird).
Im Beispiel oben wird VB zum Berechnen von Datum/Zeit-Feldern verwendet. Die entsprechende Python-Anweisung lautet wie folgt:
(datetime.datetime.strptime(!Date_Con!, "%m/%d/%Y ").date() - datetime.date(2011, 3, 11)).days
Als Nächstes müssen Sie die Anzeigeeigenschaften in ArcGlobe so ändern, dass die Features im Dataset als erhöht dargestellt werden. Klicken Sie hierzu mit der rechten Maustaste auf die Ausgabe-Feature-Class, und wählen Sie Eigenschaften. Klicken Sie im Dialogfeld "Eigenschaften" auf die Registerkarte Höhe. Wählen Sie im Abschnitt Höhe aus Features die Option Konstanten Wert oder Ausdruck verwenden, und klicken Sie dann auf die Schaltfläche "Berechnungs" . Geben Sie das mit der Funktion "DateDiff" erstellte neue Feld an. ArcGlobe erhöht die Features nun entsprechend dem Zeitspannenfeld. Wenn Sie feststellen, dass die Features keine ausreichende Höhe aufweisen, können Sie das Zeitspannenfeld mit einer Konstanten multiplizieren. Für die Eigenschaft Konstanten Wert oder Ausdruck verwenden auf der Registerkarte Höhe sieht dies in etwa wie folgt aus: [TimeLapse] *100, wie nachfolgend dargestellt.
Sie können dann das ArcGlobe-Navigationswerkzeug verwenden, um die Cluster-Ergebnisse von verschiedenen Betrachtungswinkeln und -punkten aus anzuzeigen. Die resultierende Karte sieht in etwa wie folgt aus: