Análisis de agrupamiento (Estadística espacial)

Resumen

Entidades de grupos basadas en atributos de entidad y limitaciones espaciales/temporales opcionales.

Más información sobre cómo funciona Análisis de agrupamiento

Ilustración

Group Analysis diagram

Uso

Sintaxis

GroupingAnalysis_stats (Input_Features, Unique_ID_Field, Output_Feature_Class, Number_of_Groups, Analysis_Fields, Spatial_Constraints, {Distance_Method}, {Number_of_Neighbors}, {Weights_Matrix_File}, {Initialization_Method}, {Initialization_Field}, {Output_Report_File}, {Evaluate_Optimal_Number_of_Groups})
ParámetroExplicaciónTipo de datos
Input_Features

La clase de entidad o capa de entidades para la que desea crear grupos.

Feature Layer
Unique_ID_Field

Un campo de entero que contiene un valor diferente para cada entidad en el dataset Entidades de entrada.

Field
Output_Feature_Class

La nueva clase de entidad de salida creada que contiene todas las entidades, los campos de análisis especificados, y un campo que indica a qué Grupo pertenece a cada entidad.

Feature Class
Number_of_Groups

El número de grupos a crear. El parámetro Informe de salida estará deshabilitado para más de 15 grupos.

Long
Analysis_Fields
[Analysis_Fields,...]

Una lista de los campos que desea utilizar para distinguir a un grupo de otro. El parámetro Informe de salida estará deshabilitado para más de 15 campos.

Field
Spatial_Constraints

Especifica si y cómo las relaciones espaciales entre entidades deben restringir los grupos creados.

  • CONTIGUITY_EDGES_ONLYGrupos que contienen entidades de polígono contiguos. Solo los polígonos que comparten un borde pueden ser parte del mismo grupo.
  • CONTIGUITY_EDGES_CORNERSGrupos que contienen entidades de polígono contiguos. Solo los polígonos que comparten un borde o un vértice pueden ser parte del mismo grupo.
  • DELAUNAY_TRIANGULATIONLas entidades en un mismo grupo tendrá al menos un vecino natural en común con otra entidad en el grupo. Las relaciones de vecinos naturales se basan en triangulación de Delaunay. Conceptualmente, la triangulación de Delaunay crea una malla de triángulos no superpuestos a partir de los centroides de la entidad. Cada entidad es un nodo de triángulo y nodos que comparten bordes y que se consideran vecinos.
  • K_NEAREST_NEIGHBORSLas entidades en el mismo grupo estarán cerca unos de otros; cada entidad es vecina de por lo menos otra entidad en el grupo. Las relaciones de vecino más cercano se basan en las entidades K donde especifica un valor entero, K, para el parámetro Cantidad de vecinos.
  • GET_SPATIAL_WEIGHTS_FROM_FILEDe manera espacial y opcionalmente temporal, las relaciones se definen por un archivo de ponderaciones espaciales (.swm). Crear el archivo de matriz de ponderaciones espaciales utilizando la herramienta Generar matriz de ponderaciones espaciales.
  • NO_SPATIAL_CONSTRAINTLas entidades se agruparán utilizando el espacio de datos solo de proximidad. Las entidades no tienen que estar cerca unas de otras en el espacio o tiempo para formar parte del mismo grupo.
String
Distance_Method
(Opcional)

Especifica cómo se calculan las distancias desde cada entidad hasta las entidades vecinas.

  • EUCLIDIANOLa distancia en línea recta entre dos puntos
  • MANHATTANLa distancia entre dos puntos medida a lo largo de los ejes en ángulos rectos (manzana); se calcula al sumar la diferencia (absoluta) entre las coordenadas x e y
String
Number_of_Neighbors
(Opcional)

Este parámetro está habilitado cuando el parámetro Restricciones espaciales es K_NEAREST_NEIGHBORS o uno de los métodos de CONTIGÜIDAD. El número de vecinos predeterminado es 8. Para K_NEAREST_NEIGHBORS, este valor entero refleja el número exacto de los posibles vecinos más próximos a considerar al crear los grupos. Una entidad no se incluirán en un grupo a menos que una de las demás entidades en este grupo sea un vecino K más próximo. Para los métodos de CONTIGÜIDAD, este valor refleja el número exacto de posibles vecinos a considerar solo para los polígonos islas. Puesto que los polígonos islas no tienen vecinos contiguos, se les asignará vecinos que no son contiguos, pero que están cerca.

Long
Weights_Matrix_File
(Opcional)

La ruta a un archivo que contiene las ponderaciones espaciales que definen las relaciones espaciales entre las entidades.

File
Initialization_Method
(Opcional)

Especifica cómo se obtienen seeds iniciales cuando el parámetro Restricción espacial seleccionado es NO_SPATIAL_CONSTRAINT. Los seeds se utilizan para aumentar los grupos. Si usted indicar que desea 3 grupos, por ejemplo, el análisis comenzará con tres seeds.

  • FIND_SEED_LOCATIONSLas entidades seed se seleccionarán para optimizar el rendimiento.
  • GET_SEEDS_FROM_FIELDLas entradas que no son cero en el Campo de inicialización se utilizarán como puntos para los grupos de aumento.
  • USE_RANDOM_SEEDSLas entidades seed se seleccionarán de manera aleatoria.
String
Initialization_Field
(Opcional)

El campo numérico identifica entidades seed. Las entidades con un valor de 1 para este campo se utilizarán para grupos de aumento.

Field
Output_Report_File
(Opcional)

La ruta de acceso completa para el archivo de informe .pdf se creará resumiendo las características de grupo. Este informe ofrece una serie de gráficos para ayudarle a comparar las características de cada grupo. Crear el archivo de informe puede agregar tiempo de procesamiento sustancial.

File
Evaluate_Optimal_Number_of_Groups
(Opcional)
  • EVALUARLas agrupaciones de 2 a 15 serán evaluadas.
  • DO_NOT_EVALUATENo se realizará evaluación del número de grupos. Esta es la opción predeterminada.
Boolean

Ejemplo de código

Ejemplo 1 GroupingAnalysis 1 (ventana de Python)

La siguiente secuencia de comandos de la ventana de Python demuestra cómo utilizar la herramienta GroupingAnalysis.

import arcpy import arcpy.stats as SS arcpy.env.workspace = r"C:\GA" SS.GroupingAnalysis("Dist_Vandalism.shp", "TARGET_FID", "outGSF.shp", "4",                     "Join_Count;TOTPOP_CY;VACANT_CY;UNEMP_CY",                     "NO_SPATIAL_CONSRAINT", "EUCLIDEAN", "", "", "FIND_SEED_LOCATIONS", "",                     "outGSF.pdf", "DO_NOT_EVALUATE")
Ejemplo 2 GroupingAnalysis (secuencia de comandos Python independiente)

La siguiente secuencia de comandos de Python independiente muestra cómo utilizar la herramienta GroupingAnalysis.

# Grouping Analysis of Vandalism data in a metropolitan area # using the Grouping Analysis Tool  # Import system modules import arcpy, os import arcpy.stats as SS  # Set geoprocessor object property to overwrite existing output, by default arcpy.gp.overwriteOutput = True  try:     # Set the current workspace (to avoid having to specify the full path to     # the feature classes each time)     arcpy.env.workspace = r"C:\GA"      # Join the 911 Call Point feature class to the Block Group Polygon feature class     # Process: Spatial Join     fieldMappings = arcpy.FieldMappings()     fieldMappings.addTable("ReportingDistricts.shp")     fieldMappings.addTable("Vandalism2006.shp")      sj = arcpy.SpatialJoin_analysis("ReportingDistricts.shp", "Vandalism2006.shp", "Dist_Vand.shp",                                "JOIN_ONE_TO_ONE",                                "KEEP_ALL",                                fieldMappings,                                "COMPLETELY_CONTAINS", "", "")          # Use Grouping Anlysis tool to create groups based on different variables or analysis fields     # Process: Group Similar Features       ga = SS.GroupingAnalysis("Dist_Vand.shp", "TARGET_FID", "outGSF.shp", "4",                                        "Join_Count;TOTPOP_CY;VACANT_CY;UNEMP_CY",                                        "NO_SPATIAL_CONSRAINT", "EUCLIDEAN", "", "", "FIND_SEED_LOCATIONS", "",                                        "outGSF.pdf", "DO_NOT_EVALUATE")          # Use Summary Statistic tool to get the Mean of variables used to group     # Process: Summary Statistics     SumStat = arcpy.Statistics_analysis("outGSF.shp", "outSS", "Join_Count MEAN; \                                VACANT_CY MEAN;TOTPOP_CY MEAN;UNEMP_CY MEAN",                                         "GSF_GROUP")  except:     # If an error occurred when running the tool, print out the error message.     print arcpy.GetMessages()

Entornos

Sistema de coordenadas de salida

La geometría de la entidad se proyecta al Sistema de coordenadas de salida antes del análisis, por lo tanto los valores introducidos para el parámetro Banda de distancia o distancia de umbral deben coincidir con los que se especificaron en el Sistema de coordenadas de salida. Todos los cálculos matemáticos se basan en la referencia espacial del sistema de coordenadas de salida.

Temas relacionados

9/11/2013