- 相關(guān)推薦
地理信息數(shù)據(jù)錄入的數(shù)據(jù)質(zhì)量控制研究
【摘要】 隨著地理信息技術(shù)的發(fā)展,針對空間數(shù)據(jù)庫的應(yīng)用越來越廣泛,空間數(shù)據(jù)庫中的數(shù)據(jù)源包括各種異構(gòu)的可操作的數(shù)據(jù)庫及其他數(shù)據(jù)。數(shù)據(jù)源中可能包含地形圖數(shù)據(jù)、管線數(shù)據(jù)、氣象數(shù)據(jù)、人口數(shù)據(jù)、噪聲數(shù)據(jù)、重復(fù)數(shù)據(jù)和不一致數(shù)據(jù)。以上數(shù)據(jù)的生產(chǎn)過程和質(zhì)量,常常只是對數(shù)據(jù)的生產(chǎn)者來說是透明的,而對數(shù)據(jù)的使用者卻不透明,這樣必然導(dǎo)致數(shù)據(jù)生產(chǎn)過程中大量的重復(fù)采集數(shù)據(jù)的工作。為防止造成大量的人力、物力等資源的浪費,關(guān)于數(shù)據(jù)共享的研究成為現(xiàn)代GIS技術(shù)的熱點問題,然而這些地理信息數(shù)據(jù)要實現(xiàn)在網(wǎng)絡(luò)上共享,就要解決目前地理信息數(shù)據(jù)不同格式集成的問題,更進一步說,數(shù)據(jù)的質(zhì)量問題是實現(xiàn)集成的根本因素,因此,地理信息數(shù)據(jù)共享問題的研究與地理信息數(shù)據(jù)的質(zhì)量有直接關(guān)系。所以實現(xiàn)地理數(shù)據(jù)集成的首要問題是控制地理信息數(shù)據(jù)的質(zhì)量。論文本著精簡實用的原則,設(shè)計面向?qū)ο蠹s束條件的數(shù)據(jù)特征模型來對不同格式的原始數(shù)據(jù)進行質(zhì)量檢查和質(zhì)量加強。這個面向?qū)ο蟮臄?shù)據(jù)質(zhì)量檢查模型,可以通過對要素關(guān)系、行為和有效規(guī)則的定義來實現(xiàn)對現(xiàn)實世界系統(tǒng)更好地表達和描述。它必須對任何兩個特征之間所具備的聯(lián)系、每個特征所允許的聯(lián)系的個數(shù),任何需要的屬性數(shù)值或者幾何約束和特征操作,以及各種有效法則,比如屬性域、應(yīng)用語義關(guān)系和拓撲幾何關(guān)系規(guī)則等等。然后利用ESRI公司的Geodatabase這種已有的能夠支持特征關(guān)系、行為和規(guī)則定義的高級特征模型來演示這種面向?qū)ο笏枷氲臄?shù)據(jù)檢查模型是如何對不同格式的原始地理數(shù)據(jù)質(zhì)量進行控制檢查和約束加強。為了實現(xiàn)這種基于對數(shù)據(jù)屬性設(shè)定約束條件思想的的表達以及原有的仍然有效的歷史地理數(shù)據(jù)的集成、共享,本論文把數(shù)據(jù)質(zhì)量檢查模型內(nèi)部的基本幾何元素、屬性域、關(guān)系類以及拓撲關(guān)系類用GML模式進行了編碼。這也為能夠把海量原始地理空間數(shù)據(jù)(數(shù)據(jù)庫文件或文檔)進一步用編程語言轉(zhuǎn)換成GML文檔提供了檢驗標(biāo)準(zhǔn)。在轉(zhuǎn)換到GML這種能表達各種數(shù)據(jù),并且可以在數(shù)據(jù)庫間非常容易進行交換的格式后,海量原始地理信息數(shù)據(jù)也就實現(xiàn)了最大意義上的地理數(shù)據(jù)的集成和共享。
【Abstract】 Along with the development of GIS, more and more data are produced. But magnanimous historical Geo-data and new-produced Geo-data are being wasted without efficient disposal and using. Because there are relative obturating among technologies of different GIS and different requests on Geo-data from different specialties, the spatial data produced by different departments with individual method is stored in different medium . As we all know, if we want to realize the real data sharing, we must solve the bottle-neck problem of data integration .In addition, there is another key factor as Geo-data quality which can influence the realization of Geo-data sharing. As a result, the research of Geo-data sharing has something to do with the quality of spatial data. So we must ensure the quality of Geo-data before we integrate and share the Geo-data.The reliability of the historical Geo-data which is mostly produced by digitalization usually is unknown to the users because the original material and relative information may not be available to users. this paper designs the constraint-based Data quality check model which includes three parts: attribute domain, relationship class and topology class.Then, select Geodatabase that can support relationships, behaviors and validation rules to demonstrate how the constraint-based AFM check and control the Geo-data application quality .In this paper, different validation rules are used to check and control the quality of Geo-data. In addition, GML Schema-based spatial data is the important approach for integrating and sharing spatial data and the use of GML is useful for the realization of distributed GIS in addition to the key technology for solving WebGIS problem.
【關(guān)鍵詞】 約束條件; 數(shù)據(jù)質(zhì)量檢查模型; 數(shù)據(jù)集成; 共享; GML模式
【Key words】 CONSTRAINED CONDITION; DATA QUALITY CHECK MODEL; DATA INTEGRATION; SHARING; GEOGRAPHY MARKUP LANGUAGE SCHEMA
地理信息數(shù)據(jù)錄入的數(shù)據(jù)質(zhì)量控制研究
摘要 5-6
ABSTRACT 6
1 地理信息系統(tǒng)發(fā)展現(xiàn)狀 9-17
1.1 論文選題背景和研究意義 9-14
1.1.1 國內(nèi)外空間基礎(chǔ)數(shù)據(jù)庫組成及應(yīng)用現(xiàn)狀 9-10
1.1.2 地理數(shù)據(jù)是GIS 系統(tǒng)的關(guān)鍵因素 10
1.1.3 不斷積累增加的海量地理數(shù)據(jù) 10-12
1.1.4 數(shù)據(jù)格式轉(zhuǎn)換模式中的質(zhì)量約束與加強 12-13
1.1.5 空間基礎(chǔ)數(shù)據(jù)共享平臺建設(shè) 13-14
1.2 研究的主要目的和內(nèi)容 14-15
1.2.1 研究的主要目的 14
1.2.2 論文的主要內(nèi)容 14-15
1.3 實現(xiàn)方法 15-17
1.3.1 從現(xiàn)實世界抽象到地理要素集合的數(shù)字化轉(zhuǎn)換模型 15
1.3.2 從基于約束的數(shù)據(jù)模型研究到設(shè)計數(shù)據(jù)質(zhì)量檢查模型 15
1.3.3 通過Geodatabase 定義屬性域及規(guī)則來檢查和加強空間數(shù)據(jù)質(zhì)量 15-16
1.3.4 用GML Schema 表達數(shù)據(jù)模型 16-17
2 數(shù)據(jù)質(zhì)量檢查模型的研究背景和現(xiàn)狀 17-25
2.1 數(shù)據(jù)模型 17-19
2.1.1 數(shù)據(jù)模型概述 17
2.1.2 現(xiàn)代GIS 發(fā)展對數(shù)據(jù)模型提出新的要求 17-19
2.2 基于約束規(guī)則數(shù)據(jù)模型的提出 19-21
2.2.1 早期的Coverage 模型 19-20
2.2.2 ESRI 的Geodatabase 20-21
2.3 地理數(shù)據(jù)質(zhì)量的描述 21-23
2.3.1 數(shù)據(jù)質(zhì)量的決定意義 21-22
2.3.2 關(guān)于地理數(shù)據(jù)質(zhì)量的描述框架 22-23
2.4 傳統(tǒng)的數(shù)據(jù)質(zhì)量檢查和控制措施 23-25
2.4.1 傳統(tǒng)GIS 數(shù)據(jù)的質(zhì)量檢查和控制措施 23
2.4.2 傳統(tǒng)GIS 數(shù)據(jù)的質(zhì)量檢查控制方法的弊端 23-25
3 地理數(shù)據(jù)質(zhì)量檢查模型的設(shè)計和應(yīng)用 25-42
3.1 數(shù)據(jù)檢查模型的設(shè)計 25-35
3.1.1 屬性的定義 25-27
3.1.2 關(guān)系類的定義 27-30
3.1.3 拓撲關(guān)系類的定義 30-35
3.2 GEODATABASE在地理數(shù)據(jù)質(zhì)量檢查和加強中的應(yīng)用 35-42
3.2.1 屬性數(shù)據(jù)質(zhì)量檢查和控制 35-37
3.2.2 利用拓撲關(guān)系規(guī)則來檢查和控制空間數(shù)據(jù)的空間分布正確性 37-42
4 用GML SCHEMA 實現(xiàn)數(shù)據(jù)檢查模型 42-58
4.1 XML 概述 43-44
4.1.1 XML 技術(shù) 43
4.1.2 XML 對萬維網(wǎng)空間數(shù)據(jù)技術(shù)產(chǎn)生的影響 43-44
4.2 GML 概述 44-45
4.2.1 GML 的優(yōu)勢 44-45
4.2.2 GML 模型 45
4.3 數(shù)據(jù)檢查模型中基本幾何要素的GML 模式編碼 45-51
4.3.1 數(shù)據(jù)檢查模型中基本幾何要素的編碼 45-49
4.3.2 特征編碼 49-51
4.4 數(shù)據(jù)檢查模型的GML 表達 51-58
4.4.1 屬性域約束的GML 編碼 51
4.4.2 關(guān)系類約束的GML 編碼 51-55
4.4.3 拓撲關(guān)系類的GML 編碼 55-58
5 結(jié)論與展望 58-61
5.1 論文結(jié)論 58-59
5.2 展望 59-61
參考文獻 61-63
致謝 63
【地理信息數(shù)據(jù)錄入的數(shù)據(jù)質(zhì)量控制研究】相關(guān)文章:
局域網(wǎng)數(shù)據(jù)庫環(huán)境下數(shù)據(jù)采集及處理05-08
數(shù)據(jù)庫開題報告10-29
數(shù)據(jù)建模論文格式06-29
復(fù)卷機TNT耦合作用原理與質(zhì)量控制研究05-08
探析改進大專院校圖書館書目數(shù)據(jù)庫質(zhì)量之我見06-02
淺析電力調(diào)度數(shù)據(jù)專網(wǎng)05-18
檔案利用數(shù)據(jù)統(tǒng)計與實際效益05-12
計算機數(shù)據(jù)庫論文07-21
計算機數(shù)據(jù)庫論文07-20