第1章 緒論 1
1.1 環(huán)境保護檔案概述 1
1.1.1 環(huán)境保護檔案的內容 1
1.1.2 環(huán)境保護檔案的種類 3
1.1.3 環(huán)境保護檔案的特點 4
1.2 環(huán)保檔案的重要作用及其數據挖掘的需求 5
1.2.1 環(huán)境保護檔案的重要作用 5
1.2.2 環(huán)境保護檔案數據挖掘的迫切需求 7
1.3 本體、文本信息抽取及空間數據挖掘研究現(xiàn)狀 8
1.3.1 本體研究現(xiàn)狀 8
1.3.2 文本信息抽取研究現(xiàn)狀 13
1.3.3 空間數據挖掘研究現(xiàn)狀 15
1.4 數據挖掘與相近領域的關系 18
1.5 環(huán)境保護檔案數據挖掘研究的主要內容 20
1.5.1 環(huán)境保護本體研究 20
1.5.2 環(huán)境保護檔案的信息抽取方法研究 21
1.5.3 環(huán)境保護信息的空間數據挖掘方法探討 22
1.5.4 環(huán)境保護檔案數據挖掘原型系統(tǒng)構建與應用實踐 23
第2章 環(huán)境保護本體 24
2.1 環(huán)境保護本體的定義 24
2.1.1 本體的定義與分類 25
2.1.2 環(huán)境保護本體的定義 30
2.2 環(huán)境保護本體的結構 32
2.2.1 環(huán)境保護本體的邏輯構成 32
2.2.2 環(huán)境保護本體的概念框架 35
2.3 環(huán)境保護本體的構建方法 39
2.3.1 環(huán)境保護本體的構建原則 39
2.3.2 環(huán)境保護本體的構建過程 41
2.3.3 環(huán)境保護本體的描述語言 46
2.3.4 環(huán)境保護本體的構建工具 49
第3章 環(huán)境保護檔案文本信息抽取方法 52
3.1 信息抽取的關鍵問題 52
3.1.1 信息抽取的主要任務 52
3.1.2 文本的表示模型 55
3.1.3 語義單元的粒度 57
3.1.4 中文文本的自動分詞 58
3.2 信息抽取方法分析 60
3.2.1 基于自然語言處理的信息抽取方法 61
3.2.2 基于規(guī)則方式的信息抽取方法 61
3.2.3 基于統(tǒng)計學習的信息抽取方法 63
3.3 基于本體和隱馬爾可夫模型的 自由文本信息抽取方法 64
3.3.1 隱馬爾可夫模型 64
3.3.2 基于本體和隱馬爾可夫模型的自由文本信息抽取思路 67
3.3.3 基于本體和隱馬爾可夫模型的自由文本信息抽取實現(xiàn)方法 68
3.3.4 應用案例分析 72
3.4 基于本體和語義相似度的 表格信息抽取方法 75
3.4.1 語義相似度及其計算方法 76
3.4.2 基于本體和語義相似度的表格信息抽取思路 80
3.4.3 基于本體和語義相似度的表格信息抽取實現(xiàn)方法 82
3.4.4 應用案例分析 85
第4章 環(huán)境保護檔案空間關聯(lián)規(guī)則挖掘方法 88
4.1 空間關聯(lián)規(guī)則挖掘 89
4.1.1 空間關聯(lián)規(guī)則及其分類 89
4.1.2 空間關聯(lián)挖掘的過程模型 92
4.1.3 空間關聯(lián)規(guī)則挖掘的算法 93
4.2 環(huán)境保護檔案的空間信息 及其概念層次關系 96
4.2.1 環(huán)境保護檔案的空間信息及特點 96
4.2.2 環(huán)境保護空間信息中的空間關系及其描述模型 98
4.2.3 環(huán)境保護檔案空間信息的概念層次關系 102
4.3 基于本體的環(huán)境保護檔案多層 空間關聯(lián)規(guī)則挖掘方法 105
4.3.1 基于本體的環(huán)保檔案多層空間關聯(lián)規(guī)則挖掘思路 105
4.3.2 基于本體的環(huán)境保護檔案多層空間關聯(lián)規(guī)則挖掘實現(xiàn)步驟 107
4.4 環(huán)境保護檔案多層空間關聯(lián)規(guī)則挖掘分析 111
4.4.1 火電廠與配套設施的多層距離關聯(lián)規(guī)則挖掘 112
4.4.2 火電廠與居民點空氣污染物濃度的多層方位關聯(lián)規(guī)則挖掘 113
第5章 環(huán)境保護檔案數據挖掘實踐 117
5.1 環(huán)境保護本體構建 117
5.1.1 火電行業(yè)建設項目環(huán)境影響評價本體設計 118
5.1.2 火電建設項目環(huán)境影響評價本體的實現(xiàn) 120
5.2 火電建設項目環(huán)境影響報告 數據挖掘原型系統(tǒng)設計 126
5.2.1 系統(tǒng)總體架構 126
5.2.2 系統(tǒng)功能體系 128
5.2.3 系統(tǒng)開發(fā)環(huán)境 130
5.3 火電建設項目環(huán)境影響報告數據 挖掘系統(tǒng)關鍵技術實現(xiàn) 131
5.3.1 基于VSTO的文本檔案數據處理技術實現(xiàn) 131
5.3.2 基于本體和ICTCLAS的中文文本分詞技術實現(xiàn) 139
5.3.3 基于Jena的本體解析與推理技術實現(xiàn) 144
5.4 環(huán)境保護檔案數據挖掘及效果分析 149
5.4.1 環(huán)境保護檔案數據挖掘的數據范圍 149
5.4.2 環(huán)境保護檔案數據挖掘的結果展示 150
5.4.3 環(huán)境保護檔案數據挖掘的效果分析 152
第6章 環(huán)境保護檔案數據挖掘總結與展望 155
6.1 環(huán)境保護檔案數據挖掘總結 155
6.2 環(huán)境保護檔案數據挖掘展望 158
附錄A 火電行業(yè)建設項目環(huán)境影響評價本體核心概念OWL描述 160
參考文獻 177