生成空间权重矩阵 (Spatial Statistics)
插图
用法
-
此工具的输出是空间权重矩阵文件 (SWM)。需要指定空间关系的概念化的工具(例如热点分析)将接受空间权重矩阵文件;为空间关系的概念化参数选择 GET_SPATIAL_WEIGHTS_FROM_FILE,并且为权重矩阵文件参数指定使用此工具创建的空间权重文件的完整路径。
此工具还会报告所生成的空间权重矩阵文件的特征:要素数量、连通性以及最小相邻要素数、最大相邻要素数和平均相邻要素数。通过结果窗口可以访问此汇总,右键单击结果 窗口中的消息条目并选择视图即可查看。使用此汇总时,请确保所有要素至少具有 1 个相邻要素。通常,最好至少具有 8 个相邻要素且让要素连通性具有一个低值,尤其是大型数据集更是如此。
对于空间/时间分析, 为空间关系的概念化参数选择 SPACE_TIME_WINDOW。可通过指定阈值距离值定义空间;也可通过指定日期/时间字段以及日期/时间类型(例如 HOURS 或 DAYS)和日期/时间间隔值定义时间。日期/时间间隔值为整数。例如,如果输入 1000 英尺,选择 HOURS,并为日期/时间间隔值提供值 3,则距离在 1000 英尺范围内且在彼此 3 小时内出现的要素将被视为相邻要素。
空间权重矩阵文件 (*.swm) 旨在用于生成、存储、重用和共享一组要素之间关系的概念化。为了提高性能,文件采用二进制文件格式创建。要素关系存储为稀疏矩阵,因此,只有非零关系会被写入 SWM 文件。通常,即使 SWM 文件包含的非零关系超过 1500 万个,工具也会正常运行。如果在使用 SWM 文件时遇到内存错误,则应重新编辑定义要素关系的方法。根据经验,您应该以空间权重矩阵为目标,也就是说,每个要素至少具有 1 个相邻要素,最多具有大约 8 个相邻要素,任何要素的相邻要素都不会超过 1000 个。
如果未投影输入要素类(即,坐标单位为度、分和秒),或者将输出坐标系设置为地理坐标系,则采用弦测量方法计算距离。使用弦距离测量法是因为此方法不仅计算速度快,而且提供真实测地线距离的良好估测,至少对于彼此 30 度以内的点是这样。弦距离以球体为基础,而不是以地球实际的扁椭圆体为基础。给定地球表面上的任意两点,两点之间的弦距离是从三维地球穿过然后连接该两点的一条线的长度。弦距离以米为单位报告。
警告:如果您的研究区延伸超过 30 度,则需确保投影数据。测地线距离超过 30 度时,弦距离不是理想的估测方法。
分析时若使用弦距离,阈值距离参数(如指定)应以米为单位。
在 ArcGIS 10.2.1 之前的版本中,如果所选的参数和环境设置要求通过地理坐标(度、分、秒)计算结果,则会显示一条警告消息。该警告消息建议您投影数据到投影坐标系中,以使距离计算结果更为准确。但自 10.2.1 起,每当需要使用地理坐标系进行计算时,该工具都将计算弦距离。
警告:由于该变化,如果您通过 ArcGIS 10.2.1 之前版本创建模型,且模型包含硬编码的地理坐标系参数值,则可能需要修改包含该工具的模型。例如,如果将距离参数设置为 0.0025 度,则需要将固定值的单位从度转化为米,然后重新保存模型。
-
对于线和面要素,距离计算中会使用要素的质心。对于多点、折线或由多部件组成的面,将会使用所有要素部件的加权平均中心来计算质心。点要素的加权项是 1,线要素的加权项是长度,而面要素的加权项是面积。
-
唯一 ID 字段与运行此工具后所获得的要素关系关联。因此,每个要素的唯一 ID 值都必须唯一,而且通常应该位于与要素类一同保留的永久性字段中。如果没有“唯一 ID”字段,则可以轻松地创建一个,方法是向要素类表添加一个新的整型字段(添加字段),然后将此字段的值计算为与 FID 或 OBJECTID 字段的值相等(计算字段)。由于复制或编辑要素类时 FID/OID 字段值会发生变化,所以不能直接对唯一 ID参数使用这些字段。
-
相邻要素的数目参数可以覆盖“空间关系反距离或固定距离概念化”的阈值距离参数。如果指定的阈值距离为 10 英里,相邻要素数目为 3,则所有要素都至少会接收 3 个相邻要素(即使必须增加该阈值才能找到它们)。只有在未达到最小相邻要素数时,才增加距离阈值。
空间关系的概念化参数的 CONVERT_TABLE 选项可用来将 ASCII 空间权重矩阵文件转换为 SWM 格式的空间权重矩阵文件。首先,需要将 ASCII 权重置入一个有格式的表(例如,使用 Excel)中。
对于面要素,几乎始终需要为行标准化参数选择行。如果每个要素所具有的邻域数目由聚合方案或者采样过程决定,而不是反映您所分析的变量的实际空间分布,则行标准化将减少偏移。
-
空间关系建模帮助主题提供了有关此工具的参数的附加信息。
可以使用空间权重矩阵文件的工具会在进行分析之前将要素几何投影到先前的输出坐标系,并且所有数学计算均基于输出坐标系。因此,如果输出坐标系设置与输入要素类空间参考不匹配,对于使用空间权重矩阵文件的所有分析,请确保输出坐标系与在创建空间权重矩阵文件时使用的设置匹配;或者对输入要素类进行投影,使得输入要素类与空间权重矩阵文件相关的空间参考相匹配。
在使用 shapefile 时,请注意 shapefile 无法存储空值。根据非 shapefile 输入创建 shapefile 的工具或其他过程可能会将空值存储(或解释)为零。某些情况下,空值则以极大的负值储存于 shapefile 中。这会产生意外的结果。有关详细信息,请参阅 shapefile 输出的地理处理注意事项。
语法
参数 | 说明 | 数据类型 |
Input_Feature_Class |
将被评估要素空间关系的要素类。 | Feature Class |
Unique_ID_Field |
包含输入要素类中每个要素不同值的整型字段。 | Field |
Output_Spatial_Weights_Matrix_File |
要创建的空间权重矩阵文件 (SWM) 的完整路径。 | File |
Conceptualization_of_Spatial_Relationships |
指定要素空间关系的概念化方式。
注:只有具有 ArcGIS for Desktop Advanced 级别许可才能使用面邻接方法。 | String |
Distance_Method (可选) |
指定计算每个要素与邻近要素之间的距离的方式。
| String |
Exponent (可选) |
反距离计算参数。典型值是 1 或 2。 | Double |
Threshold_Distance (可选) |
为空间关系的“反距离”和“固定距离”概念化指定中断距离。使用在环境输出坐标系中指定的单位输入此值。为空间关系的“空间时间窗”概念化定义“空间”窗的大小。 零值表明应未应用任何距离阈值。此参数留空时,将根据输出要素类范围和要素数量计算默认阈值。 | Double |
Number_of_Neighbors (可选) |
用于表示相邻要素最小数目或精确数目的整数。对于 K 最近邻,每个要素的相邻要素数正好等于这个指定数目。对于反距离或固定距离,每个要素将至少具有这些数量的相邻要素(如有必要,距离阈值将临时增大以确保达到这个相邻要素数)。如果存在一些岛屿面,并且选择了一个有关邻接的空间关系的概念化,则指定的最近面的数目将与这些岛屿面关联。 | Long |
Row_Standardization (可选) |
当要素的分布由于采样设计或施加的聚合方案而可能出现偏离时,建议使用行标准化。
| Boolean |
Input_Table (可选) |
由输入要素类中每个要素相对于其他要素的数字权重组成的表。必填字段是“输入要素类唯一 ID”字段、“NID”(相邻要素 ID)和“权重”。 | Table |
Date_Time_Field (可选) |
包含每个要素的时间戳的日期字段。 | Field |
Date_Time_Interval_Type (可选) |
用于测量时间的单位。
| String |
Date_Time_Interval_Value (可选) |
反映构成时间窗的时间单位数量的整数。 例如,如果为“日期/时间间隔类型”选择 HOURS,为“日期/时间间隔值”选择 3,则时间窗为 3 小时;位于指定空间窗和指定时间窗内的要素将成为相邻要素。 | Long |
代码实例
下面的 Python 窗口脚本演示了如何使用生成空间权重矩阵 (GenerateSpatialWeightsMatrix) 工具。
import arcpy
arcpy.env.workspace = "C:/data"
arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID","euclidean6Neighs.swm","K_NEAREST_NEIGHBORS","#", "#", "#", 6,"NO_STANDARDIZATION")
下面的独立 Python 脚本演示了如何使用 GenerateSpatialWeightsMatrix 工具。
# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Hot-Spot Analysis Tool (Local Gi*)
# Import system modules
import arcpy
# Set geoprocessor object property to overwrite existing output, by default
arcpy.gp.overwriteOutput = True
# Local variables...
workspace = "C:/Data"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Copy the input feature class and integrate the points to snap
# together at 500 feet
# Process: Copy Features and Integrate
cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
"#", 0, 0, 0)
integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")
# Use Collect Events to count the number of calls at each location
# Process: Collect Events
ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")
# Add a unique ID field to the count feature class
# Process: Add Field and Calculate Field
af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
"NON_NULLABLE", "NON_REQUIRED", "#",
"911Count.shp")
cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")
# Create Spatial Weights Matrix for Calculations
# Process: Generate Spatial Weights Matrix...
swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
"euclidean6Neighs.swm",
"K_NEAREST_NEIGHBORS",
"#", "#", "#", 6,
"NO_STANDARDIZATION")
# Hot Spot Analysis of 911 Calls
# Process: Hot Spot Analysis (Getis-Ord Gi*)
hs = arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp",
"GET_SPATIAL_WEIGHTS_FROM_FILE",
"EUCLIDEAN_DISTANCE", "NONE",
"#", "#", "euclidean6Neighs.swm")
except:
# If an error occurred when running the tool, print out the error message.
print arcpy.GetMessages()
环境
- 输出坐标系
在分析之前,会将要素几何投影到“输出坐标系”,这样,为距离阈值参数输入的值会与“输出坐标系”中指定的值一致。所有数学计算都基于“输出坐标系”的空间参考进行。输出坐标系基于度、分、秒时,测地线距离用弦距离(米)估测。