Gruppierungsanalyse (Spatial Statistics)

Lizenzstufe:BasicStandardAdvanced

Zusammenfassung

Gruppiert Features anhand von Feature-Attributen und optionalen räumlichen/zeitlichen Einschränkungen.

Weitere Informationen zur Funktionsweise der Gruppierungsanalyse

Bild

Diagramm "Gruppierungsanalyse"

Verwendung

Syntax

GroupingAnalysis_stats (Input_Features, Unique_ID_Field, Output_Feature_Class, Number_of_Groups, Analysis_Fields, Spatial_Constraints, {Distance_Method}, {Number_of_Neighbors}, {Weights_Matrix_File}, {Initialization_Method}, {Initialization_Field}, {Output_Report_File}, {Evaluate_Optimal_Number_of_Groups})
ParameterErläuterungDatentyp
Input_Features

Die Feature-Class bzw. der Feature-Layer, für die/den Sie Gruppen erstellen möchten.

Feature Layer
Unique_ID_Field

Ein Ganzzahlfeld, das für jedes Feature im Eingabe-Feature-Dataset einen anderen Wert enthält.

Field
Output_Feature_Class

Die neu erstellte Ausgabe-Feature-Class mit allen Features, den angegebenen Analysefeldern und einem Feld, das angibt, zu welcher Gruppe die einzelnen Features gehören.

Feature Class
Number_of_Groups

Die Anzahl der zu erstellenden Gruppen. Der Parameter Ausgabebericht wird deaktiviert, sobald mehr als 15 Gruppen angegeben werden.

Long
Analysis_Fields
[analysis_field,...]

Eine Liste mit Feldern, mit deren Hilfe Sie die Gruppen voneinander abgrenzen können. Der Parameter Ausgabebericht wird deaktiviert, sobald mehr als 15 Felder angegeben werden.

Field
Spatial_Constraints

Gibt an, ob und inwiefern sich durch räumliche Beziehungen zwischen den Features Einschränkungen für die erstellten Gruppen ergeben.

  • CONTIGUITY_EDGES_ONLYGruppen enthalten angrenzende Polygon-Features. Nur Polygone, die eine gemeinsame Kante aufweisen, können derselben Gruppe angehören.
  • CONTIGUITY_EDGES_CORNERSGruppen enthalten angrenzende Polygon-Features. Nur Polygone, die eine gemeinsame Kante oder einen gemeinsamen Stützpunkt aufweisen, können derselben Gruppe angehören.
  • DELAUNAY_TRIANGULATIONFeatures derselben Gruppe haben mindestens einen gemeinsamen neutralen Nachbarn mit einem anderen Feature der Gruppe. Beziehungen mit natürlichen Nachbarn basieren auf der Delaunay-Triangulation. Bei der Delaunay-Triangulation wird konzeptionell, ausgehend von den Schwerpunkten der Features, ein nicht überlappendes Netz aus Dreiecken erstellt. Jedes Feature entspricht einem Dreiecksknoten. Knoten, die über eine gemeinsame Kante verfügen, gelten als Nachbarn.
  • K_NEAREST_NEIGHBORSFeatures derselben Gruppe liegen dicht aneinander, und jedes Feature ist Nachbar von mindestens einem anderen Feature der Gruppe. Nachbarbeziehungen basieren auf den nächsten K-Features, wobei der Ganzzahlwert K für den Parameter "Anzahl der Nachbarn" anzugeben ist.
  • GET_SPATIAL_WEIGHTS_FROM_FILERäumliche und optional auch zeitliche Beziehungen werden in einer räumlichen Gewichtungsdatei (mit der Erweiterung .swm) definiert. Sie können die räumliche Gewichtungsmatrix mithilfe des Werkzeugs "Räumliche Gewichtungsmatrix erstellen" anlegen.
  • NO_SPATIAL_CONSTRAINTDie Features werden ausschließlich basierend auf der Proximität im Datenbereich gruppiert. Die Features müssen sich weder räumlich noch zeitlich nah sein, um derselben Gruppe anzugehören.
String
Distance_Method
(optional)

Gibt an, wie Entfernungen von den einzelnen Features zu benachbarten Features berechnet werden.

  • EUCLIDEANDie geradlinige Entfernung zwischen zwei Punkten (die als Luftlinie gemessene Entfernung).
  • MANHATTANDie Entfernung zwischen zwei Punkten, die entlang von rechtwinkligen Achsen gemessen werden (Gebäudeblock). Für die Berechnung werden die (absoluten) Differenzen zwischen den X- und Y-Koordinaten berechnet.
String
Number_of_Neighbors
(optional)

Dieser Parameter ist aktiviert, wenn der Parameter Räumliche Einschränkungen auf K_NEAREST_NEIGHBORS oder auf eine der CONTIGUITY-Methoden eingestellt ist. Die Anzahl der Nachbarn ist standardmäßig 8. Beim Wert K_NEAREST_NEIGHBORS entspricht diese Ganzzahl genau der Anzahl der bei der Erstellung von Gruppen zu berücksichtigenden Kandidaten für den nächsten Nachbarn. Ein Feature wird nur dann in eine Gruppe aufgenommen, wenn eines der anderen Features der Gruppe ein nächster Nachbar (K) ist. Bei den CONTIGUITY-Methoden entspricht dieser Wert genau der Anzahl der zu berücksichtigenden Kandidaten für Insel-Polygone. Da Insel-Polygone keine angrenzenden Nachbarn haben, werden ihnen Nachbarn zugewiesen, die zwar nicht direkt angrenzen, sich aber in der Nähe befinden.

Long
Weights_Matrix_File
(optional)

Der Pfad zu einer Datei, die räumliche Gewichtungen enthält, mit denen die räumlichen Beziehungen zwischen Features definiert werden.

File
Initialization_Method
(optional)

Gibt an, wie anfängliche Ursprungswerte ermittelt werden, wenn der Parameter Räumliche Einschränkungen auf NO_SPATIAL_CONSTRAINT gesetzt ist. Ursprungswerte werden für die Bildung von Gruppen verwendet. Wenn Sie beispielsweise angeben, dass drei Gruppen erstellt werden sollen, beginnt die Analyse mit drei Ursprungswerte.

  • FIND_SEED_LOCATIONSUrsprungswert-Features werden ausgewählt, um die Performance zu optimieren.
  • GET_SEEDS_FROM_FIELDEinträge ungleich 0 im Initialisierungsfeld werden als Startpunkte für die Bildung der Gruppen herangezogen.
  • USE_RANDOM_SEEDSAnfängliche Ursprungswert-Features werden nach dem Zufallsprinzip ausgewählt.
String
Initialization_Field
(optional)

Das numerische Feld, durch das Ursprungswert-Features identifiziert werden. Features, die in diesem Feld den Wert 1 aufweisen, werden für die Bildung von Gruppen herangezogen.

Field
Output_Report_File
(optional)

Der vollständige Pfad für die zu erstellende Berichtsdatei mit der Erweiterung .pdf, die eine Zusammenfassung der Gruppeneigenschaften enthält. Der Bericht umfasst eine Reihe von Diagrammen, mit deren Hilfe Sie die Eigenschaften der einzelnen Gruppen besser vergleichen können. Die Erstellung der Berichtsdatei kann sehr viel Zeit in Anspruch nehmen.

File
Evaluate_Optimal_Number_of_Groups
(optional)
  • EVALUATEGruppierungen von 2 bis 15 werden überprüft.
  • DO_NOT_EVALUATEDie Gruppenanzahl wird nicht überprüft. Dies ist die Standardeinstellung.
Boolean

Codebeispiel

GroupingAnalysis – Beispiel 1 (Python-Fenster)

Mit dem folgenden Skript im Python-Fenster wird veranschaulicht, wie Sie das Werkzeug "GroupingAnalysis" verwenden.

import arcpy
import arcpy.stats as SS
arcpy.env.workspace = r"C:\GA"
SS.GroupingAnalysis("Dist_Vandalism.shp", "TARGET_FID", "outGSF.shp", "4",
                    "Join_Count;TOTPOP_CY;VACANT_CY;UNEMP_CY",
                    "NO_SPATIAL_CONSRAINT", "EUCLIDEAN", "", "", "FIND_SEED_LOCATIONS", "",
                    "outGSF.pdf", "DO_NOT_EVALUATE")
GroupingAnalysis – Beispiel 2 (eigenständiges Python-Skript)

Das folgende eigenständige Python-Skript veranschaulicht, wie das Werkzeug "GroupingAnalysis" verwendet wird.

# Grouping Analysis of Vandalism data in a metropolitan area
# using the Grouping Analysis Tool

# Import system modules
import arcpy, os
import arcpy.stats as SS

# Set geoprocessor object property to overwrite existing output, by default
arcpy.gp.overwriteOutput = True

try:
    # Set the current workspace (to avoid having to specify the full path to
    # the feature classes each time)
    arcpy.env.workspace = r"C:\GA"

    # Join the 911 Call Point feature class to the Block Group Polygon feature class
    # Process: Spatial Join
    fieldMappings = arcpy.FieldMappings()
    fieldMappings.addTable("ReportingDistricts.shp")
    fieldMappings.addTable("Vandalism2006.shp")

    sj = arcpy.SpatialJoin_analysis("ReportingDistricts.shp", "Vandalism2006.shp", "Dist_Vand.shp",
                               "JOIN_ONE_TO_ONE",
                               "KEEP_ALL",
                               fieldMappings,
                               "COMPLETELY_CONTAINS", "", "")
    
    # Use Grouping Anlysis tool to create groups based on different variables or analysis fields
    # Process: Group Similar Features  
    ga = SS.GroupingAnalysis("Dist_Vand.shp", "TARGET_FID", "outGSF.shp", "4",
                                       "Join_Count;TOTPOP_CY;VACANT_CY;UNEMP_CY",
                                       "NO_SPATIAL_CONSRAINT", "EUCLIDEAN", "", "", "FIND_SEED_LOCATIONS", "",
                                       "outGSF.pdf", "DO_NOT_EVALUATE")
    
    # Use Summary Statistic tool to get the Mean of variables used to group
    # Process: Summary Statistics
    SumStat = arcpy.Statistics_analysis("outGSF.shp", "outSS", "Join_Count MEAN; \
                               VACANT_CY MEAN;TOTPOP_CY MEAN;UNEMP_CY MEAN", 
                                       "GSF_GROUP")

except:
    # If an error occurred when running the tool, print out the error message.
    print arcpy.GetMessages()

Umgebung

Ausgabe-Koordinatensystem

Die Feature-Geometrie wird vor der Analyse auf das Ausgabe-Koordinatensystem projiziert. Alle mathematischen Berechnungen basieren auf dem Raumbezug des Ausgabe-Koordinatensystems. Wenn das Ausgabekoordinatensystem auf Grad, Minuten und Sekunden basiert, werden geodätische Entfernungen mithilfe von Sehnenentfernungen geschätzt.

Verwandte Themen

Lizenzierungsinformationen

ArcGIS for Desktop Basic: Ja
ArcGIS for Desktop Standard: Ja
ArcGIS for Desktop Advanced: Ja
6/5/2014