得鹿梦鱼 得鹿梦鱼

GIS中的数据

数据涵义与数据类型

数据是用以载荷信息的载体, 虽然数据是信息的载体,但并非就是信息,只有理解了数据的含义、对数据做出解释,才能得到数据中所包含的信息
数据的处理和解释是非常重要的环节。所谓数据处理,是指对数据进行收集、筛选、排序、归并、转换、检索、计算以及分析、模拟和预测的操作,其目的就是把数据转换成便于观察、分析、传输或进一步处理的形式;把数据加工成对正确管理和决策有用的数据;把数据编辑后存储起来,以供不断使用。数据处理是为了解释,而数据解释需要人的智慧、学识和经验

地理数据(空间数据)的基本特征

属性特征(非定位数据),表示实际现象或特征,例如变量、级别、数量特征和名称等等
空间特征(定位数据):表示现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示,例如笛卡尔坐标等
时间特征(时间尺度):指现象或物体随时间的变化,其变化的周期有超短期的、短期的、中期的、长期的等等

空间数据的类型

空间特征数据(定位数据):记录的是空间实体的位置、拓扑关系和几何特征
时间属性数据(尺度数据): 地理实体所具有的各种性质,如地形的坡度、坡向、某地的年降雨量、土地酸缄类型、人口密度、交通流量、空气污染程度等
专题属性数据(非定位数据): 地理实体的时间变化或数据采集的时间等

数据的测量尺度

命名

定性而非定量,不能进行任何算术运算,如一个城市的名字,,只对特定现象进行标识,赋予一定的数值或符号而不定量描述。

次序

线性坐标上不按值的大小,而是按顺序排列的数,例如,事故发生危险程度的级别由大到小被标为1,2,3,…,级别的序号越低,其危险性越大,但危险性到底有多大并未给予定量的表达。序数值相互之间可以比较大小,但不能进行加、减、乘、除等算术运算
次序测量尺度是基于对现象进行排序来标识的,不同次序之间的间隔大小可以不同。对次序数据的逻辑运算除了“等于”与“不等于”之外,还可以比较它们的大小,即“大于”或“小于”

间隔

不参照某个固定点,而是按间隔表示相对位置的数。按间隔量测的值相互之间可以比较大小,并且它们之间的差值大小是有意义的

比例

比例测量尺度的测量值指那些有真零值而且测量单位的间隔是相等的数据,比例测量尺度与使用的测量单位无关,如年降雨量、海拔高度、人口密度、发病率等。

地理信息系统的数据质量

准确性;即一个记录值(测量或观察值)与它的真实值之间的接近程度
精度:即对现象描述的详细程度
空间分辨率: 两个可测量数值之间最小的可辩识的差异
比例尺: 地图上一个记录的距离和它所表现的“真实世界的”距离之间的一个比例
误差: 定义出一个所记录的测量和它的事实之间的准确性, 包括:位置误差和属性误差
不确定性: 空间位置的不确定性、属性不确定性、时域不确定性、逻辑上的不一致性及数据的不完整性

空间数据质量问题的来源

  1. 空间现象自身存在的不稳定性
  2. 空间现象的表达:数据采集中的测量方法以及量测精度的选择等受到人类自身的认识和表达的影响,这对于数据的生成会出现误差
  3. 空间数据处理中的误差: 投影变换、数据格式转换、数据抽象、建立拓扑关系、数据叠加操作和更新、数据集成处理、数据的可视化表达、数据处理过程中误差的传递和扩散

常见空间数据的误差分析

数据的误差主要有四大类,即几何误差、属性误差、时间误差和逻辑误差

空间数据的元数据

元数据,是描述数据的数据,在地理空间数据中,元数据是说明数据内容、质量、状况和其他有关特征的背景信息

元数据的类型

根据元数据的内容分类

  1. 科研型元数据
  2. 评估型元数据
  3. 模型元数据

根据元数据描述对象分类

  1. 数据层元数据
  2. 属性元数据
  3. 实体元数据

根据元数据在系统中的作用分类

  1. 系统级别元数据
  2. 应用层元数据

根据元数据的作用分类

  1. 说明元数据
  2. 控制元数据