表分析和表管理
几乎所有 GIS 数据都以简单数据库表的形式存储或表示。例如,要素类是具有 shape 属性(表中的一种属性,也称为字段或列)的表,栅格可视为属性表,而大多数 GIS 数据库具有包含属性的独立表,这些表可通过公用属性与其他表相关联。构造数据库或执行分析时,大量时间将用于对表进行管理:添加和计算新属性、将表或表中的行从某一位置复制到另一位置、将包含坐标值文本字符串的表转换为要素、将一个表与另一个表相关联或者计算汇总统计数据。
某些分析需要为其他应用程序以表的形式提取 GIS 数据,而来自其他应用程序的表格数据也可作为 GIS 的输入数据。通常,将使用多个地理处理步骤修改和合并多组数据,从而生成一个具有多个获取自其他数据的属性的要素类,可对这些属性进行选择或汇总以生成表格结果。
基于表创建 GIS 数据
连接表
一种常用的方法是将包含数据(例如,人口统计数据或医疗统计数据)的表连接到一组地理要素以进行可视化。这需要表和地理要素共用一个关键字段,例如,名称字段或 ID 编码字段。
下方的示例显示的是如何通过连接其他表中的数据赋予 GIS 要素更多的属性。此要素类(由爱荷华州各县组成)具有名称属性和 FIPS 编码属性,这些属性可用作表连接的关键字段。
此独立表包含有关爱荷华州各县大豆产量的信息。此独立表还具有名称属性和 FIPS 编码属性,因此,可使用任一属性将此表连接到县要素。
将产量数据连接到县要素之后,可以使用产量表中的字段对县要素进行符号化、标注或选择。
连接来自多个不同数据源的数据时,重要的是确保关键字段的数据类型和值完全匹配。如果某一字段是数值字段而另一字段是文本字段,则无法使用这两个字段进行连接。为解决此问题,可在其中一个表中创建一个与另一个表中相应字段的数据类型匹配的新字段,然后对不匹配字段的值进行计算以得出新的匹配字段。此外,如果某个键值出现拼写错误、具有多种不同的拼写方式,或者包含印刷错误或多余字符(例如,尾端有一个空格字符),将不会连接包含不匹配键的记录。
基于表创建要素
另一种常用方法是基于表格数据创建空间信息。
XY 事件
完成此操作的最简单方法可能是使用 XY 事件图层工具基于包含 x 坐标字段和 y 坐标字段的表创建一个图层。下方的示例显示的是如何将包含坐标和其他数据的简单表转换为点事件。
基于此表创建的点事件与要素类作用相同,并且可使用此表中的属性进行符号化和标注。
地理编码
还可通过将表中的值与参考要素类进行匹配来创建点。进行此操作的一种方法是地理编码,在表中包含地址信息且参考要素类中包含街道和区域信息的情况下可使用此方法。
下方的示例显示的是基于地址创建的点,创建方法为根据参考街道数据对地址进行地理编码。
线性参考
进行此操作的另一种方法是根据某条线的沿线距离来匹配位置,这种方法称为线性参考。此方法可用于在某条线沿线的指定距离处创建点事件或创建沿这条线从某一指定位置到另一位置的线事件。
下方的示例显示的是一组点事件,这些点事件是通过将一个包含距离测量值和路径标识符的表与一个包含具有测量值的路径要素的线要素类进行匹配生成的。
下方的示例显示的是一组线事件,这些线事件是通过将一个包含起始测量值和终止测量值以及路径标识符的表与一个包含具有测量值的路径要素的线要素类进行匹配生成的。
表格数据分析
分析表格数据通常包括确定某些事物中有多少事物属于指定类别或查看一组事物的值的分布。通常,您所关注的特定事物的周围具有很多差异不大(或差异显著)的其他事物。基于这些差异查找要素通常需要通过将表进行连接或通过空间连接和叠加来合并多个不同数据源的数据,然后选择并计算字段中的值。
确定数量
有时,GIS 中的要素具有您要分析的属性,分析方法为确定所选要素中某一字段的总数或某一特定类型的要素的出现次数。可使用“统计分析”工具箱中的汇总统计数据工具和频数工具针对某一字段或多个字段计算这些统计数据并根据另一字段中的值汇总计算结果。此方法既可用于创建报表也可用于执行分析。
使用频数工具计算频数是了解某些事物中有多少事物属于指定类别的好方法。例如,可对一组宗地运行此工具,以了解多个土地利用类别中各类别的宗地都有多少块。查看分类数据的频数分布在多种分析中均为重要的第一步。
此频数表显示,居住用宗地的数量大约是办公用宗地的五倍,而只有少量宗地属于公用设施类别或公共机构类别。
您还可通过以下方式在 ArcMap 中获得表中某字段的频数信息:在表窗口中右键单击字段的标题,然后单击“统计数据”。
查看值的分布
汇总统计数据工具可用于量化某些事物中有多少事物属于某组要素。例如,您可以针对宗地使用“汇总统计数据”工具计算每个类别的宗地的总面积(面积总和)或计算每个类别的宗地的平均面积,而不是仅使用“频数”工具统计每种类型的宗地的数量。
此汇总统计数据表显示,虽然工业用宗地的数量多于公共机构宗地,但这两个类别的宗地在城市中的总面积大致相同。此表还显示,公共机构宗地和公用设施宗地的平均面积大于办公用宗地、居住用宗地或工业用宗地的平均面积。
还可以使用“汇总统计数据”工具查看某组要素的值的分布。例如,可以比较某研究区域中多个植物种类的最小高程值和最大高程值、某区域中一种指定类型的房屋的价格范围,或者该类型房屋的个体价格与平均价格的差异的平均量(标准差)。
您还可在 ArcMap 中对多个表进行汇总,方法为在表窗口中右键单击字段的列标题,然后单击“汇总”。
有关在 GIS 中使用统计分析的详细信息,请参阅统计分析主题。
对记录进行计数
某些情况下,需要了解某个表中或某个选择内容中的记录的数量。您可在自动执行分析或报告创建过程的模型或脚本中使用此信息。获取计数工具将返回某个要素类、表或图层中要素或行的数量。此工具可应用于选择内容、表视图和基于查询的图层。您可在循环脚本中使用“获取计数”工具,此脚本将使用逐渐增大的距离对某一位置进行缓冲并在缓冲区中选择指定数量的要素。
表格数据管理
计算值
计算字段工具用于以数学方式合并或运算一个或多个字段中的值。这些计算可能如以下计算一样简单:将所有要素的某一指定字段计算为 23 或将全部所选要素的某一指定字段计算为真,或者合并多个字段中的值。例如,您可以使用 population 字段除以面积字段以获得人口密度值,或将门牌号字段、街道名称字段和街道类型字段中的文本合并到一个地址字段中。在很多情况下,需要使用添加字段工具添加一个新字段以包含计算结果。
连接表
添加连接工具通常用于合并使用其他数据进行分析的某一步骤中所获得的表格数据。如果多个表共用一个键值(例如,要素 ID 或名称),则可以将这些表进行连接。两个表中的数据随即可供进行同时分析。此工具仅适用于 ArcMap 内容列表中的要素图层或表视图或者通过创建要素图层工具和创建表视图工具创建的要素图层和表视图。此连接是临时连接,仅在会话过程中有效。您可将连接结果保存为新的要素类或表,方法为使用复制要素或复制行工具或者导出 ArcMap 中的数据。
属性索引
为字段建立索引可使选择具有该属性的行的过程效率更高。您可使用添加属性索引工具为字段建立索引。
子类型和属性域
如果表存储在地理数据库中,则可为要素和属性创建子类型。通过子类型,可根据属性值将要素类或表分为多个逻辑分组并处理要素类中的要素子集或表中的行。可使用子类型为这些子集指定相同的属性和行为。
可通过属性域来定义可用于多个属性字段的值的范围。使用属性域可针对特定字段限制可供选择的值,从而有助于确保数据完整性。
表视图
表是磁盘上或地理数据库中的一种物理表。表视图是保存在计算机内存中的一种临时表,表视图的使用方式与物理表的使用方式相同。通常,将使用查询(例如 SQL SELECT 语句)创建表视图,这样,表视图中将只显示物理表的一个记录子集。
创建表视图工具将基于一个输入表创建表视图,而创建查询表工具将基于多个可连接的输入表创建表视图。
如果想要将表视图保存为物理表,请使用复制行工具。
对表进行透视
数据透视表工具可用于减少较大的表中的冗余。此工具可用于将某些 CAD 数据结构转换为 GIS 要素,或将大量以逗号分隔的测量站点和测量值转换为表。某一字段(透视表字段)中的唯一值将变为输出表中的列标题。
表工具
提供多种用于管理和操作表及其属性的工具。这些工具大部分位于数据管理工具箱中。
Toolbox |
描述 |
---|---|
包含“频数”工具和“汇总统计数据”工具 | |
将数据转换为 ArcGIS 格式 | |
可将地址表转换为点要素 | |
可将包含 [路径, 测量值] 坐标的表转换为点要素 |