空间数据模型

空间数据模型的基本问题

人类生活和生产所在的现实世界是由事物或实体组成的，有着错综复杂的组成结构。从系统的角度来看，空间事物或实体的运动状态（在特定时空中的性状和态势）和运动方式（运动状态随时空变化而改变的式样和规律）不断发生变化，系统的诸多组成要素（实体）之间又存在着相互作用、相互制约的依存关系，表现为人口、物质、能量、信息、价值的流动和作用，反映出不同的空间现象和问题。为了控制和调节空间系统的物质流、能量流和人流等，使之转移到期望的状态和方式，实现动态平衡和持续发展，人们开始考虑对其中诸组成要素的空间状态、相互依存关系、变化过程、相互作用规律、反馈原理、调制机理等进行数字模拟和动态分析，这在客观上为地理信息系统提供了良好的应用环境和重要发展动力

概念

地理空间是指物质、能量、信息的存在形式在形态、结构过程、功能关系上的分布方式和格局及其在时间上的延续。
地理信息系统中的地理空间分为绝对空间和相对空间两种形式。绝对空间是具有属性描述的空间位置的集合，它由一系列不同位置的空间坐标值组成；相对空间是具有空间属性特征的实体的集合，由不同实体之间的空间关系构成

空间数据模型是关于现实世界中空间实体及其相互间联系的概念，它为描述空间数据的组织和设计空间数据库模式提供着基本方法

空间数据模型的类型

在GIS中与空间信息有关的信息模型有三个，即基于对象（要素）（Feature）的模型、网络（Network）模型以及场（Field）模型。基于对象（要素）的模型强调了离散对象，根据它们的边界线以及组成它们或者与它们相关的其它对象，可以详细地描述离散对象。网络模型表示了特殊对象之间的交互，如水或者交通流。场模型表示了在二维或者三维空间中被看作是连续变化的数据

场模型

对于模拟具有一定空间内连续分布特点的现象来说，基于场的观点是合适的。例如，空气中污染物的集中程度、地表的温度、土壤的湿度水平以及空气与水的流动速度和方向。根据应用的不同，场可以表现为二维或三维。一个二维场就是在二维空间中任何已知的地点上，都有一个表现这一现象的值；而一个三维场就是在三维空间中对于任何位置来说都有一个值

场模型可以表示为如下的数学公式：

$*z:s zs*$
$*z$ 为可度量的函数, $s$ 表示空间中的位置,因此该式表示了从空间域（甚至包括时间坐标）到某个值域的映射

下表给出了地理研究中一些场模型的案例

模型函数	定义域维度	值域维度	自变量	因变量
$Tz$	1	1	空间坐标（高程）	高度z处的气温
$Et$	1	3	时间坐标	某时刻的静电力
$Hx,y$	2	1	空间坐标	地表高程
$Px,y$	2	1	空间坐标	土壤的孔隙度
$v\lambda, \mu\, z$	3	1	空间坐标	风速
$\Theta\lambda,\mu,p, z$	4	1	压力面、时间	温度

特征

场经常被视为由一系列等值线组成，一个等值线就是地面上所有具有相同属性值的点的有序集合

空间结构特征和属性域

在实际应用中，“空间”经常是指可以进行长度和角度测量的欧几里德空间。空间结构可以是规则的或不规则的，但空间结构的分辨率和位置误差则十分重要，它们应当与空间结构设计所支持的数据类型和分析相适应。属性域的数值可以包含以下几种类型：名称、序数、间隔和比率。属性域的另一个特征是支持空值，如果值未知或不确定则赋予空值

连续的、可微的、离散的

如果空间域函数连续的话，空间域也就是连续的，即随着空间位置的微小变化，其属性值也将发生微小变化，不会出现像数字高程模型中的悬崖那样的突变值。只有在空间结构和属性域中恰当地定义了“微小变化”，“连续”的意义才确切

当空间结构是二维（或更多维）时，坡度——或者称为变化率——不仅取决于特殊的位置，而且取决于位置所在区域的方向分布。连续与可微分两个概念之间有逻辑关系，每个可微函数一定是连续的，但连续函数不一定可微

与方向无关的和与方向有关的（各向同性和各向异性）

空间场内部的各种性质是否随方向的变化而发生变化，是空间场的一个重要特征。如果一个场中的所有性质都与方向无关，则称之为各向同性场

空间自相关是空间场中的数值聚集程度的一种量度。距离近的事物之间的联系性强于距离远的事物之间的联系性

如果一个空间场中的类似的数值有聚集的倾向，则该空间场就表现出很强的正空间自相关；如果类似的属性值在空间上有相互排斥的倾向，则表现为负空间自相关

栅格数据模型

栅格数据模型是基于连续铺盖的，它是将连续空间离散化，即用二维铺盖或划分覆盖整个连续空间；铺盖可以分为规则的和不规则的，后者可当做拓扑多边形处理

基于栅格的空间模型把空间看作像元（Pixel）的划分（Tessellation），每个像元都与分类或者标识所包含的现象的一个记录有关。像元与“栅格”两者都是来自图像处理的内容，其中单个的图像可以通过扫描每个栅格产生。GIS中栅格数据经常是来自人工和卫星遥感扫描设备中，以及用于数字化文件的设备中。采用栅格模型的信息系统，通常应用了前面所述的分层的方法。在每个图层中栅格像元记录了特殊的现象的存在。每个像元的值表明了在已知类中现象的分类情况

由于像元具有固定的尺寸和位置，所以栅格趋向于表现在一个“栅格块”中的自然及人工现象。因此分类之间的界限被迫采用沿着栅格像元的边界线。一个栅格图层中每个像元通常被分为一个单一的类型。这可能造成对现象的分布的误解，其程度则取决与所研究的相关的像元的大小。如果像元针对特征而言是非常小的，栅格可以是一个来表现自然现象的边界随机分布的特别有效的方式，该现象趋于逐渐地彼此结合，而不是简单地划分。如果每个像元限定为一个类，栅格模型就不能充分地表现一些自然现象的转换属性。除非抽样被降低到一个微观的水平，否则许多数据类事实上都是混合类。模糊的特征通过混合像元，在一个栅格内可以被有效地表达，其中组成分类通过像元所有组成度量的或者预测的百分比来表示。尽管如此，也应该强调一个栅格的像元仅仅被赋予一个单一的值

为了GIS数据处理，栅格模型的一个重要的特征就是每个栅格中的像元的位置被预先确定，所以很容易进行重叠运算以比较不同图层中所存储的特征。由于像元位置是预先确定的，且是相同的，在一个具体的应用的不同的图层中，每个属性可以从逻辑上或者从算法上与其它图层中的像元的属性相结合以便产生相应的重叠中一个的属性值。其不同于基于图层的矢量模型之处，在于图层中的面单元彼此是独立的，直接地比较图层必须作进一步处理以识别重叠的属性。

体元（Voxels）：GIS中基于的栅格表示可以被扩展到三维以产生一个体元（Voxel）模型，其中像元是由长方形，典型是立方体、立体元素所组成。地理数据的一些类型，并不总是由边界表示的，因为数据值可能与一个属性相关，而该属性随着位置的变化而变化，而且并不是清楚地理解边界。这类模型的数据的一个比较合适的模型就是体元模型。

要素模型

欧式空间和欧式空间中的三类地物要素

许多地理现象模型建立的基础是嵌入在一个坐标空间中，在这种坐标空间中，根据常用的公式就可以测量点之间的距离以及方向，这个带坐标的空间模型被称为欧式空间，他把空昂见特性转化为实数的元组特性，两维的模型叫做欧式平面，在欧式空间中，最经常使用的参照坐标是笛卡尔坐标系，他是一个固定的、特殊的点为原点，一对互相垂直且经过原点的线维坐标轴，此外在某些特殊情况下，也采用其他的坐标系统，例如极坐标系

将地理要素嵌入到欧式空间中，形成了三类地理要素对象，即点、线和多边形

点对象

点事具有特定的位置。维数是零的物体，包括点实体、注记点、内点、结点

线对象

线对象是GIS中非常常用的维度为一的空间组分，表示对象和他们边界的空间数据，由一系列的坐标表示，并具有以下特征

实体长度：从起点到终点的总长
弯曲度：用于表示像道路拐弯时弯曲的程度
方向性：水流方向和公路方向

线状实体包括线段、边界、链、弧段、网格等

多边形对象

面状实体也被称为多边形，是对湖泊、岛屿、地块等一类对象的描述，通常在数据库中由一封闭曲线加内点来表示，面状实体具有如下特征

面积范围
周长
独立性或与其他物体的邻近性
形状
重叠性与非重叠性

要素模型的基本概念

基于要素的空间模型强调了个体现象，该现象以独立的方式或者以与其他现象之间的关系来研究，任何现象，无论大小、都可以被确定为一个对象，假设他可以从概念上与前天领域现象相分离，要素可以由不同的对象所组成，而且它们可以与其它的相分离的对象有特殊的关系

基于要素的空间信息模型把信息空间分解为对象（Object）或实体（Entity）。一个实体必须符合三个条件：

可被识别
重要（与问题相关）
可被描述（有特征）

欧氏平面上的空间对象类型

欧氏空间的平面因连续而不可计算，必须离散化后才适合于计算

对象行为是由一些操作定义的。这些操作用于一个或多个对象（运算对象），并产生一个新的对象（结果）。可将作用于空间对象的空间操作分为两类：静态的和动态的。静态操作不会导致运算对象发生本质的改变，而动态操作会改变（甚至生成或删除）一个或多个运算对象

场和对象可以在多种水平上共存，对于空间数据建模来说，基于场的方法和基于要素的方法并不互相排斥。有些应用可以很自然地应用场来建模，如前面例子中提到的某一区域的气候属性变化就适合于建立场模型；但是，即使是在这种情况下，场模型也并不是适合所有情况。例如，如果采集降雨数据的各个点在空间上很分散且分布无规律，加之这些采集点还有各自的特征，那么，一个包含两个属性，即位置和平均降雨量的对象也许更适合于区域气候属性变化的描述。总之，基于场的模型和基于要素的模型各有长处，应该恰当地综合运用这两种方法来建模

要素模型和场模型的比较

基于要素的空间关系分析

在地理信息系统中集中存储了以下的内容

空间分布位置信息
属性信息
拓扑空间关系信息

地理要素之间的部分拓扑空间关系

点与点
点与线
点与面
线与线
线与面
面与面

拓扑空间关系分析

拓扑学是几何学的一个分支，它研究在拓扑变换下能够保持不变的几何属性——拓扑属性。为了得到一些拓扑的感性认识，假设欧氏平面是一张高质量无边界的橡皮，该橡皮能够伸长和缩短到任何理想的程度。想象一下基于这张橡皮所绘制的图形，允许这张纸伸长但是不能撕破或者重叠，这样原来图形的一些属性将保留，而有些属性将会失去。例如，在橡皮表面有一个多边形，多边形内部有一个点。无论对橡皮进行压缩或拉伸，点依然存在于多边形内部，点和多边形之间的空间位置关系不改变，而多边形的面积则会发生变化。前者则是空间的拓扑属性，后者则不是拓扑属性

拓扑属性

点在一个弧段的端点
点在区域的边界上
点在区域内部
点在区域外部
点在环内部
面的连续性
两点的距离

非拓扑属性

弧段的长度
区域的周长
区域的面积

度量空间关系分析

基本空间对象度量关系包含点/点、点/线、点/面、线/线、线/面、面/面之间的距离。在基本目标之间关系的基础上，可构造出点群、线群、面群之间的度量关系

空间指标量算

定量量测区域空间指标和区域地理景观间的空间关系是地理信息系统特有的能力

几何指标：位置、长度（距离）、面积、体积、形状、方位等指标
自然地理参数：坡度、坡向、地表辐照度、地形起伏度、河网密度、切割程度、通达性等
人文地理指标：如集中指标、区位商、差异指数、地理关联系数、吸引范围、交通便利程度、人口密度等

地理空间的距离度量

地理空间中两点间的距离度量可以沿着实际的地球表面进行，也可以沿着地球椭球体的距离量算

大地测量距离：该距离即沿着地球大圆经过两个城市中心的距离
曼哈顿距离：纬度差加上经度差（名字“曼哈顿距离”是由于在曼哈顿，街道的格局可以被模拟成两个垂直方向的直线的一个集合）
旅行时间距离：从一个城市到另一个城市的最短的时间可以用一系列指定的航线来表示
词典编纂距离：在一个固定的地名册中一系列城市中它们位置之间的绝对差值

网络结构模型

在网络模型中，地物被抽象为链、节点等对象，同时要关注其间连通关系。基于网络的空间模型与基于要素的模型在一些方面有共同点，因为它们经常处理离散的地物，但是最基本的特征就是需要多个要素之间的影响和交互，通常沿着与它们相连接的通道。相关的现象的精确形状并不是非常重要的，重要的是具体现象之间距离或者阻力的度量。网络模型的典型的例子就是研究交通，包括陆上、海上及航空线路，以及通过管线与隧道分析水、汽油及电力的流动
网状模型的基本特征是，结点数据间没有明确的从属关系，一个结点可与其它多个结点建立联系。网状模型将数据组织成有向图结构。结构中结点代表数据记录，连线描述不同结点数据间的关系

有向图结构比树结构具有更大的灵活性和更强的数据建模能力。网状模型可以表示多对多的关系，其数据存储效率高于层次模型，但其结构的复杂性限制了它在空间数据库中的应用

网状模型反映了现实世界中常见的多对多关系，在一定程度上支持数据的重构，具有一定的数据独立性和共享特性，并且运行效率较高。但它在应用时也存在以下问题：

网状结构的复杂，增加了用户查询和定位的困难。它要求用户熟悉数据的逻辑结构，知道自身所处的位置
网状数据操作命令具有过程式性质
不直接支持对于层次结构的表达
基本不具备演绎功能
基本不具备操作代数基础

时空模型

传统的地理信息系统应用只涉及地理信息的两个方面：空间维度和属性维度，因此也叫SGISStatic GIS，而能够同时处理时间维度的GIS叫TGIS（Temporal GIS）

在GIS中，具有时间维度的数据可以分为两类，一类是可以称为结构化的数据，如一个测站历史数据的积累，它可以通过在属性数据表记录中简单地增加一个时间戳（Time Stamp）实现其管理；另一类是非结构化的，最典型的例子是土地利用状况的变化（图3-17），描述这种数据，是TGIS数据模型的重点要解决的问题

TGIS数据模型特点是语义更丰富、对现实世界的描述更准确，其物理实现的最大困难在于海量数据的组织和存取。TGIS技术的本质特点是“时空效率”。当前主要的TGIS模型包括：空间时间立方体模型（Space-time Cube）；序列快照模型（Sequent Snapshots）；基图修正模型（Base State with Amendments）；空间时间组合体模型（Space-time Composite）。其中序列快照模型和GIS分类中的模拟GIS（Analog GIS）一样，只是一种概念上的模型，不具备实用的开发价值，而其它几种模型都有自己的特点和适用范围，

时空数据模型设计的基本思想

地籍变更、海岸线变化、土地城市化、道路改线、环境变化等应用领域，需要保存并有效地管理历史变化数据，以便将来重建历史状态、跟踪变化、预测未来。这就要求有一个组织、管理、操作时空数据的高效时空数据模型。时空数据模型是一种有效组织和管理时态地理数据，属性、空间和时间语义更完整的地理数据模型

一个合理的时空数据模型必须考虑以下几方面的因素：节省存储空间、加快存取速度、表现时空语义。时空语义包括地理实体的空间结构、有效时间结构、空间关系、时态关系、地理事件、时空关系。时空数据模型设计的基本指导思想

根据应用领域的特点（如宏观变化观测与微观变化观测）和客观现实变化规律（同步变化与异步变化、频繁变化与缓慢变化），折中考虑时空数据的空间/属性内聚性和时态内聚性的强度，选择时间标记的对象。对于属性，有属性数据项时间标记、实体时间标记、数据库时间标记；对于空间，有坐标点时间标记、弧段时间标记、实体时间标记、数据库时间标记
同时提供静态（变化不活跃）、动态（变化活跃）数据建模手段（静态、动态数据类型和操作）
数据结构里显式表达两种地理事件：地理实体进化事件和地理实体存亡事件
时空拓扑关系一般指地理实体空间拓扑关系的拓扑事件间的时态关系。时空拓扑关系揭示了地理实体在时间和空间上的相关性。为了有效地表达时空拓扑关系，需要存储空间拓扑关系的时变序列

三维模型

三维GIS的功能

数据编码：是采集三维数据和对其进行有效性检查的工具，有效性检查将随着数据的自然属性、表示方法和精度水平的不同而不同
数据的组织和重构：这包括对三维数据的拓扑描述以及一种表示法到另一种表示法的转换（如从矢量的边界表示转换为栅格的八叉树表示）
变换：既能对所有物体或某一类物体，又能对某个物体进行平移、旋转、剪裁、比例缩放等变换。另外还可以将一个物体分解成几个以及将几个物体组合成一个
查询：此功能依赖于单个物体的内在性质（如位置、形状、组成）和不同物体间的关系（如连接、相交、形状相似或构成相似）
逻辑运算：通过与、或、非及异或运算符对物体进行组合运算
计算：计算物体的体积、表面积、中心、物体之间的距离及交角等
分析：如计算某一类地物的分布趋势，或其它指标，以及进行模型的比较
建立模型
视觉变换：在用户选择的任何视点，以用户确定的视角、比例因子、符号来表示所有地物或某些指定物体
系统维护：包括数据的自动备份、安全性措施、以及网络工作管理

数据结构

三维数据结构同二维一样，也存在栅格和矢量两种形式。栅格结构使用空间索引系统，它包括将地理实体的三维空间分成细小的单元，称之为体元或体元素。存储这种数据的最简单形式是采用三维行程编码，它是二维行程编码在三维空间的扩充。这种编码方法可能需要大量的存储空间，更为复杂的技术是八叉树，它是二维的四叉树的延伸。三维矢量数据结构表示有多种方法，其中运用最普遍的是具有拓扑关系的三维边界表示法和八叉树表示法。

八叉树三维数据结构

用八叉树来表示三维形体，既可以看成是四叉树方法在三维空间的推广，也可以是用三维体素列阵表示形体方法的一种改进。八叉树的逻辑结构如下：假设要表示的形体V可以放在一个充分大的正方体C内，C的边长为2的n次方，形体VC，它的八叉树可以用以下的递归方法来定义：八叉树的每个节点与C的一个子立方体对应，树根与C本身相对应，如果V=C，那么V的八叉树仅有树根，如果V不等于C，则C等分为八个子立方体，每个子立方体与树根的一个子节点相对应。只要某个子立方体不是完全空白或完全为V所占据，就要被八等分，从而对应的节点也就有了八个子节点。这样的递归判断、分割一直要进行到结点所对应的立方体或是完全空白，或者是完全为V占据，或是其大小已是预先定义的体素大小，并且对它与V之交作一定的“舍入”，使体素或认为是空白的，或认为是V占据的

如此所生成的八叉树上的节点可分为三类：

灰节点:对应的立方体部分地为V所占据
白节点:所对应的立方体中无V的内容
黑节点:所对应的立方体全为V所占据

后两类又称为叶结点。由于八叉树的结构与四叉树的结构是非常相似的，所以八叉树的存储结构方式可以完全沿用四叉树的有关方法。根据不同的存储方式，八叉树也可以分别称为常规的、线形的、一对八的八叉树等等

三维数据的显示

三维显示通常采用截面图、等距平面、多层平面和立体块状图等多种表现形式，大多数三维显示技术局限于CRT屏幕和绘图纸的二维表现形式，人们可以观察到地理现象的三维形状，但不能将它们作为离散的实体进行分析，如立体不能被测量、拉伸、改变形状或组合。借助三维显示技术，通过离散的高程点形成等高线图、截面图、多层平面和透视图，可以把这些最初都是人工完成的工作，用各种计算机程序迅速高效地完成