浅谈空间数据库建库时空间数据质量控制

更新时间:2024-04-13 作者:用户投稿原创标记本站原创
摘要:本文主要探讨从空间数据位置精度、属性精度、时间精度、数据完整性、逻辑一致性、数据安全性和数据情况说明等方面对数据质量进行全面控制, 目的是建立一个质量可靠的空间数据库。
关键词:空间数据;空间数据库;质量控制;地理信息系统
0引言
随着信息技术在测绘科学中的广泛应用,传统的测绘成果已逐步转化为数字化的测绘成果,随着地理信息系统的开发和应用的发展,开始利用空间数据库来存储、管理和应用测绘成果。空间数据库是一种应用于空间数据处理与信息分析领域的具有工程性质的数据库,是各个地理信息系统应用的前题和基础。在空间数据库中,空间数据质量的好坏,直接决定着系统的分析质量以及整个应用的成败。因此数据质量管理与控制在整个空间数据建库中具有重要的地位。
1空间数据库分析
要做好空间数据的质量控制,就需要了解空间数据的特点、数据的生产、建库和应用过程以及空间数据库中存在的误差来源,给出正确的评价和质量控制方法。
1.1 空间数据的特点
空间数据的最大的特点是需要支撑软件、数据定义严格,且与软件联系紧密。第二个重要的特点是在数据的背后有许多隐含的信息,例如:图形要素具有层、扩展属性信息等相关信息。第三个特点是电于数据没有容忍性,必须严格生产。
因此,空间数据控制(主要是数据检查)的重点是在统一的支撑软件平台上,根据统一的数据标准检查数据的逻辑合理性、属性正确性以及图形与属性的一致性。使数据统一到一个数据标准上,形成有规律的数据,从而体现该数据的价值。
1.2空间数据的生产过程

图1空间数据的生产过程
空间数据生产一般由测绘队完成,通常包含两过程:首先生产图形数据和属性数据,在此基础上进行数据转换、属性挂接完成空间数据的生产。如图1所示是一种典型的生产过程:
测绘队完成空问数据的生产后,提交到空可数据管理部门,由空间数据管理部门建库,提供应用。这里把测绘队生产完的空问数据称之为“原始数据”。
1.3空间数据库中的误差
空间数据库建立后,数据库中的误差包含了原始数据的误差和数据库建库所引入的误差。
原始数据的误差:除了数据采集和录入中产生的误差(我们把这部分误差称之为“源误差”,包括遥感数据、地面测量数据、属性记录、GPs数据、地图制图、地图数字化精度等的误差),还包括数据入库前对数据址理操作过程中产生的误差,这部分操作环节包括几何改正、坐标变换和比例变换、投影变换(在不同投影形式下,数据的地理特征:位置、面积和方向的表现会有差异)、几何数据编辑、属性数据编辑、空间分析、图形化简(数据压缩和曲线光滑)、数据格式转换(在矢量格式和栅格格式之间的数据格式转换中,数据所表达的空间特征的位置具有差异性)、裁切、空间内插等,此外,数据的完整性、现势性虽不属于原始数据的误差范畴,但也影响空间数据库的应用。
空间数据库建库所引入的误差:在把原始数据入库过程中还会引入新的误差,包括:由计箅机字长引起的误差、由拓扑叠加分析引起的误差、由数据抽象引起的误差以及GIS空间操作中的误差传播问题。
由计算机字长引起的误差:计算机能否按需要的精度存储和处理数据,主要取决于计算机字长。在计算机字长不够的情况下进行许多大数据的运箅时,会出现较大的舍入误差。图形图像处理的算法选择也与计算误差相关。
由拓扑叠加分析引起的误差:叠加分析是GIs中很常用的一种分析方法。通过同一地区不同内容的多幅地图的叠加组合,产生新的图形和属性信息。在这个过程中,往往产生拓扑匹配、位置和属性方面的数据质量问题。由于叠加时,多边形的边界可能不完全重合,从而产生若干无意义的多边形。对这些无意义多边形进行处理的结果往往会改变边界线的位置。叠加后形成的新的多边形,其属性值的确定也可能存在属性组合带来的误差。由数据抽象引起的误差:在数据发生比例尺度变按时,对数据进行的聚类、归并、台井等操作时产生的误差。
GIS空间操作中的误差传播问题:地理信息系统中,由于从数据来源 、空间数据库建立到空间数据库的操作和使用都引入了各种误差因素,误差是累计和扩散的,前一过程的累计误差可能成为下一个阶段的误差起源,从而导致新的误差的产生,这些误摘自:毕业论文 格式www.808so.com
差有在算术关系下传播的,有在逻辑关系下传播的。这些误差因素的影响对空间数据库系统应用分析结果会产生影响。因此,研究误差传播对理解地理信息系统数据、数据产品和空间数据库的可靠性将是十分有益的。
以上讨论了空间数据库中原始数据本身含有的误差和随后空间数据库操作中引人的误差。一般来说,原始数据的误差远远大于空间数据库操作中引入的误差,因此,要想控制空间数据库的数据质量,数据获取生产过程中对数据的质量控制是至关重要的。
2空间数据质量
空间数据质量是指空间数据的可靠性和精度,通常用空可数据的误差来度量。空间数据的质量控制是针对空间数据的特点来进行的,主要包括数据完整性、数据逻辑一致性、位置精度、属性精度、时间精度以及一些关于数据的说明。空间数据的质量控制就是通过采用科学的方法,制定出空间数据的生产技术规程,并采取一系列切实有效的方法在空间数据的生产过程中,针对关键性问题予以精度控制和错误改正,以保证空间数据的质量。
空间数据质量标准要素的具体内容为: 空间数据的完整性主要是指数据是否覆盖到应该覆盖的范围,如全国的数据就应该覆盖到全国范围, 一个省的居民地就应该包括全省的居民地数据;空间数据的逻辑一致性主要是指数据定义的统一性,在同一个基础地理信息数据库中,数据的定义应该保持一致;空间数据的位置精度主要是指数据的地理位置精度;空间数据的属性精度主要是指数据所载负的地理信息的正确性,比如同一线状地物的分类码赋值是否连续、合理,一条河流的名称及分级是否正确和一致,一个居民地的名称及其行政隶属关系是否正确等等;空间数据的时间精度是数据本身所代表的时间信息的正确性,如50年代的湖泊数据与90年代的湖泊数据就有很大的差别;关于数据的说明称为元数据是对基础地理信息数据源的注释,如数据种类、投影方式、平高系统、生产单位和时间等;空间数据表达形式的合理性是指数据抽象、数据表达与真实地理世界的吻合性,包括空间特征、专题特征和时间特征表达的合理性等。
3空间数据入库时的质量控制
原始数据是由测绘队按照数据生产的相关规范进行生产的,然后提供给入库部门。在这里不对数据生产过程中的数据质量控制进行叙述,而主要针对入库过程中的数据质量控制,即数据质量检查。
3.1空间数据的检查
其内容主要包括:(1)入库数据文件是否齐全、完备;(2)空间数据的地理参考系统是否正确,是否满足整个数据库入库的基本要求;(3)数据格式检查:不同软件数据格式及转换的可行性;(4)空间位置的几何精度;(5)空间地理特征的完整性:是否所有的内容均数字化,数据是否漏空或重叠等;(6)空间特征表达的完整性:面状特征是否以面状的多边形进行表达;(7)类型一致性检查:分类、分层,线状地物是否连续,代码的一致性,矢量几何精度一致性、影像像元大小一致性、DEM格网大小一致性等;(8)拓扑一致性检查:拓扑关系、多边形闭合关系等;(9)数据接边检查:同比例尺接边处理、相邻图幅要素属性及几何图形接边检查、各时期各种类型数据接边检查。空间数据的质量检查因产品类型和数据采集的手段不同,检查方法也略有不同,但检验内容大致相当。

点赞:24230 浏览:108200