注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書工具書社科工具書海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動分類研究

海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動分類研究

海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動分類研究

定 價:¥38.00

作 者: 王效岳,白如江 等 著
出版社: 人民出版社
叢編項:
標(biāo) 簽: 社會科學(xué) 圖書館學(xué)/檔案學(xué) 文獻(xiàn)學(xué)

ISBN: 9787010148472 出版時間: 2016-01-01 包裝: 平裝
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書針對文本分類方法在發(fā)展過程中出現(xiàn)的問題,圍繞“本體及其在文本分類中的應(yīng)用”和“海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動分類”兩個方面展開探討。深入研究了海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)處理技術(shù),比較分析了適合網(wǎng)絡(luò)文獻(xiàn)自動獲取及并行處理的工具;設(shè)計了基于Heritrix與Hadoop平臺的海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)獲取及并行處理模型和基于WordNet與SUMO本體集成的語義驅(qū)動自動文檔分類模型;梳理了本體以及本體集成理論、方法和工具;開發(fā)了海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)并行獲取和自動分類原型系統(tǒng)。

作者簡介

  王效岳,男,1961年生,工學(xué)博士,教授,山東理工大學(xué)科技信息研究所所長。中國圖書館學(xué)會高等學(xué)校圖書館分會委員,山東省科技情報學(xué)會副理事長,山東省圖書館學(xué)會常務(wù)理事。研究方向為數(shù)據(jù)挖掘與信息處理技術(shù)。主編及參編學(xué)術(shù)著作6部,省部級課題6項、廳局級課題10余項,發(fā)表學(xué)術(shù)論文80余篇,其中被EI、CSSCI索引30余篇。授權(quán)發(fā)明專利3項。獲省科技進(jìn)步3等獎l項,廳局級科技進(jìn)步2等獎2項、3等獎3項。白如江,男,1979年生,管理學(xué)博士,副研究館員,山東理工大學(xué)圖書館數(shù)字資源部主任。研究領(lǐng)域包括文本數(shù)據(jù)挖掘、自然語言處理、信息檢索技術(shù)、高科技戰(zhàn)略情報研究等。主持國家社科青年基金項目l項,教育部人文社會科學(xué)青年基金項目等省部級課題多項。

圖書目錄


緒論
第一章 網(wǎng)絡(luò)爬蟲
第一節(jié) 網(wǎng)絡(luò)爬蟲
一、開源網(wǎng)絡(luò)爬蟲工具
二、爬蟲工具比較分析
第二節(jié) Hadoop平臺
一、Hadoop與其他系統(tǒng)的比較
二、Hadoop項目及結(jié)構(gòu)
三、Hadoop分布式文件系統(tǒng)
四、MapReduce編程模型
五、Hadoop平臺搭建
第二章 海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)獲取及并行處理模型
第一節(jié) 網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)的主要來源及常用文件格式
一、網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)的主要來源及特點
二、網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)的常用文件格式
第二節(jié) 網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動獲取實驗
一、實驗環(huán)境
二、實驗平臺搭建
第三節(jié) 網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)資源獲取
一、網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)獲取方案
二、種子站點的選擇
三、抓取任務(wù)的配置
四、文件類型和大小過濾
五、網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)獲取實驗結(jié)果
第四節(jié) 網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)資源判定
第五節(jié) 網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)并行處理
一、數(shù)據(jù)預(yù)處理
二、并行處理
第六節(jié) MapReduce任務(wù)優(yōu)化
一、任務(wù)調(diào)度
二、任務(wù)數(shù)量
三、Combine函數(shù)
四、文件壓縮
五、重用JVM
六、網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)并行處理模塊實驗結(jié)果
第三章 本體集成
第一節(jié) 本體研究
一、本體概念
二、本體基本構(gòu)成要素
三、本體類型
四、本體表示語言
第二節(jié) 本體庫研究
一、國內(nèi)外主要本體庫
二、本體庫比較分析
第三節(jié) 本體集成基本過程
第四節(jié) 本體集成工具
一、工具介紹
二、工具比較與分析
第五節(jié) 本體集成方法
一、基于形式概念分析(FCA)的本體集成方法
二、基于范疇論的本體集成方法
三、基于RDFS圖閉包的本體集成方法
第四章 基于語義驅(qū)動文本自動分類研究
第一節(jié) 文檔自動分類基本理論
一、文檔自動分類基本概念
二、文檔自動分類基本流程
三、文檔自動分類性能評價指標(biāo)
第二節(jié) 基于語義驅(qū)動文檔自動分類概念
第三節(jié) 基于語義驅(qū)動文檔自動分類實現(xiàn)基礎(chǔ)
第四節(jié) 基于語義驅(qū)動文檔自動分類方法模型
一、詞向量空間構(gòu)建
二、語義向量空間構(gòu)建
第五章 基于本體集成的文檔語義分類模型
第一節(jié) SUMO和WordNet本體庫概述
一、WordNet本體庫
二、SUMO本體庫
第二節(jié) WordNet與SUMO本體庫映射機制研究
一、映射動機
二、映射模型
三、映射實例
四、映射效果及應(yīng)用分析
第三節(jié) 基于WordNet與SUMO本體集成文檔語義分類模型設(shè)計與實現(xiàn)
一、實驗平臺構(gòu)建
二、實驗數(shù)據(jù)集及方法
三、集成本體庫構(gòu)建
四、詞向量空間到概念向量空間的映射
五、概念向量空間通用化
六、分類模型訓(xùn)練與測試過程描述
七、實驗評估指標(biāo)
八、實驗及結(jié)果分析
第六章 海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動分類系統(tǒng)
第一節(jié) 海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動分類系統(tǒng)
一、開發(fā)環(huán)境
二、海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動獲取模塊
三、海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)詞一文檔矩陣處理模塊
四、本體集成模塊
五、基于語義驅(qū)動的分類模塊
第二節(jié) 海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動分類系統(tǒng)實現(xiàn)
一、系統(tǒng)主要技術(shù)及標(biāo)準(zhǔn)
二、系統(tǒng)功能
第七章 總結(jié)及展望
第一節(jié) 總結(jié)
第二節(jié) 展望
附錄A
附錄B
附錄C
附錄D
參考文獻(xiàn)
索引
后記

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號