地理信息数据录入的数据质量控制研究
【摘要】 随着地理信息技术的发展,针对空间数据库的应用越来越广泛,空间数据库中的数据源包括各种异构的可操作的数据库及其他数据。数据源中可能包含地形图数据、管线数据、气象数据、人口数据、噪声数据、重复数据和不一致数据。以上数据的生产过程和质量,常常只是对数据的生产者来说是透明的,而对数据的使用者却不透明,这样必然导致数据生产过程中大量的重复采集数据的工作。为防止造成大量的人力、物力等资源的浪费,关于数据共享的研究成为现代GIS技术的热点问题,然而这些地理信息数据要实现在网络上共享,就要解决目前地理信息数据不同格式集成的问题,更进一步说,数据的质量问题是实现集成的根本因素,因此,地理信息数据共享问题的研究与地理信息数据的质量有直接关系。所以实现地理数据集成的首要问题是控制地理信息数据的质量。论文本着精简实用的原则,设计面向对象约束条件的数据特征模型来对不同格式的原始数据进行质量检查和质量加强。这个面向对象的数据质量检查模型,可以通过对要素关系、行为和有效规则的定义来实现对现实世界系统更好地表达和描述。它必须对任何两个特征之间所具备的联系、每个特征所允许的联系的个数,任何需要的属性数值或者几何约束和特征操作,以及各种有效法则,比如属性域、应用语义关系和拓扑几何关系规则等等。然后利用ESRI公司的Geodatabase这种已有的能够支持特征关系、行为和规则定义的高级特征模型来演示这种面向对象思想的数据检查模型是如何对不同格式的原始地理数据质量进行控制检查和约束加强。为了实现这种基于对数据属性设定约束条件思想的的表达以及原有的仍然有效的历史地理数据的集成、共享,本论文把数据质量检查模型内部的基本几何元素、属性域、关系类以及拓扑关系类用GML模式进行了编码。这也为能够把海量原始地理空间数据进一步用编程语言转换成GML文档提供了检验标准。在转换到GML这种能表达各种数据,并且可以在数据库间非常容易进行交换的格式后,海量原始地理พ信息数据也就实现了最大意义上的地理数据的集成和共享。
【Abstract】 Along with the development of GIS, more and more data are produced. But magnanimous historical Geo-data and new-produced Geo-data are being wasted without efficient disposal and using. Because there are relative obturating among technologies of different ♀GIS and different requests on Geo-data from different specialties, the spatial data produced by different departments with individual method is stored in different medium . As we all know, if we want to realize 유the real data sharing, we must solve the bottle-neck problem of data integration .In addition, there is another key factor as Geo-data quality which can influence the realization of Geo-data sharing. As a result, the research of Geo-data sharing has something to do with the quality of spatial data. So we must ensure the quality of Geo-data before we integrate and share the Geo-data.The reliability of the historical Geo-data which is mostly produced by digitalization usually is unknown to the users because the original material and relative information may not be available to users. this paper designs the constraint-based Data quality check model which includes three parts: attribute domain, relationship class and topology class.Then, select Geodatabase that can support relationships, behaviors and validation rules to demonstrate how the constraint-based AFM check and control the Geo-data application quality .In this paper, different validation rules are used to check and control the quality of Geo-data. In addition, GML Schema-based spatial data is the important approach for integrating and sharing spatial data and the use of GML is us½eful for the realization of distributed GIS in addition to the key technology for solving WebGIS problem.
【关键词】 约束条件; 数据质量检查模型; 数据集成; 共享; GML模式
【Key words】 CONSTRAINED CONDITION; DATA QUALITY CHECK MODEL; DATA INTEGRATION; SHARING; GEOGRAPHY MARKUP LANGUAGE SCHEMA
地理信息数据录入的数据质量控制研究
摘要 5-6
ABSTRACT 6
1 地理信息系统发展现状 9-17
1.1 论文选题背景和研究意义 9-14
1.1.1 国内外空间基础数据库组成及应用现状 9-10 1.1.3 不断积累增加的海量地理数据 10-12 1.1.5 空间基础数据共享平台建设 13-14 1.2.1 研究的主要目的 14 1.3 实现方法 15-17
1.3.1 从现实ห世界抽象到地理要素集合的数字化转换模型 15 1.3.3 通过Geodatabase 定义属性域及规则来检查和加强空间数据质量 15-16
1.3.4 用GML Schema 表达数据模型 16-17 2.1 数据模型 17-19
2.1.1 数据模型概述 17 2.2 基于约束规则数据模型的提出 19-21 2.2.2 ESRI 的Geodatabase 20-21 2.3.1 数据质量的决定意义 21-22
2.3.2 关于地理数据质量的描述框架 22-23
2.4 传统的数据质量检查和控制措施 23-25 2.4.2 传统GIS 数据的质量检查控制方法的弊端 23-25
3 地理数据质量检查模型的设计和应用 25-42 3.1.1 属性的定义 25-27 3.1.3 拓扑关系类的定义 30-35
3.2 GEODATABASE在地理数据质量检查和加强中的应用 35-42
3.2.1 属性数据质量检查和控制 35-37
3.2.2 利用拓扑关系规则来检查和控制空间数据的空间分布正确性 37-42
4 用GML SCHEMA 实现数据检查模型 42-58
4.1 XML 概述 43-44
4.1.1 XML 技术 43 4.2 GML 概述 44-45
4.2.1 GML 的优势 44-45
4.2.2 GML 模型 45
4.3 数据检查模型中基本几何要素的GML 模式编码 45-51
4.3.1 数据检查模型中基本几何要素的编码 45-49
4.3.2 特征编码 49-51
4.4 数据检查模型的GML 表达 51-58
4.4.1 属性域约束的GML 编码 51
4.4.2 关系类约束的GML 编码 51-55
4.4.3 拓扑关系类的GML 编码 55-58
5 结论与展望 58-61
5.1 论文结论 58-59
5.2 展望 59-61
参考文献 61-63
致谢 63