注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡計算機科學理論與基礎知識網(wǎng)絡信息檢索

網(wǎng)絡信息檢索

網(wǎng)絡信息檢索

定 價:¥32.00

作 者: 董守斌,袁華 著
出版社: 西安電子科技大學出版社
叢編項:
標 簽: 計算機理論

ISBN: 9787560623788 出版時間: 2010-04-01 包裝: 平裝
開本: 16開 頁數(shù): 348 字數(shù):  

內容簡介

  《網(wǎng)絡信息檢索》詳細介紹了網(wǎng)絡信息檢索的原理和技術,內容包括信息檢索模型、網(wǎng)絡信息的自動獲取、網(wǎng)絡信息預處理和索引、查詢語言和查詢優(yōu)化等。針對網(wǎng)絡信息檢索的廣泛應用,書中對搜索引擎、中文和跨語言信息檢索、多媒體檢索、并行和分布式信息檢索、信息分類和聚類、信息提取與自動問答等重要應用的關鍵技術也進行了深入的探討?!毒W(wǎng)絡信息檢索》層次分明,深入淺出;既有原理闡述和理論推導,也有大量的實例分析,闡述力求系統(tǒng)性和科學性?!毒W(wǎng)絡信息檢索》可作為高等院校計算機科學與技術、信息管理與信息系統(tǒng)、電子商務等專業(yè)的高年級本科生或研究生的教科書和參考書,對廣大從事網(wǎng)絡信息檢索、數(shù)字圖書館、信息管理、人工智能、Web數(shù)據(jù)挖掘等研究和應用開發(fā)的科技人員也有較大的參考價值。

作者簡介

暫缺《網(wǎng)絡信息檢索》作者簡介

圖書目錄

第1章 緒論
1.1 網(wǎng)絡信息檢索概述
1.1.1 網(wǎng)絡信息
1.1.2 信息檢索
1.1.3 網(wǎng)絡信息檢索
1.2 信息檢索的發(fā)展
1.2.1 手工檢索
1.2.2 脫機批處理檢索
1.2.3 聯(lián)機檢索
1.2.4 網(wǎng)絡信息檢索
1.3 網(wǎng)絡信息檢索的應用
1.3.1 搜索引擎
1.3.2 多媒體信息檢索
1.3.3 話題識別與跟蹤
1.3.4 信息過濾
1.3.5 問題回答
思考題
參考文獻
第2章 信息檢索模型
2.1 檢索模型定義
2.2 布爾模型
2.3 向量模型
2.3.1 索引項權重
2.3.2 相似度量
2.3.3 計算方法
2,4 概率模型
2.5 擴展的布爾模型
2.5.1 模糊集合模型
2.5.2 擴展布爾模型
2.6 擴展的向量模型
2.6.1 廣義向量空間模型
2.6.2 潛語義標引模型
2.6.3 神經(jīng)網(wǎng)絡模型
2.7 擴展的概率模型
2.7.1 推理網(wǎng)絡模型
2.7.2 信任度網(wǎng)絡模型
2.7.3 語言模型
2.8 小結
思考題
習題
參考文獻
第3章 網(wǎng)絡信息的自動搜集
3.1 網(wǎng)絡信息的特點
3.1.1 Web的組成
3.1.2 Web的特點
3.2 網(wǎng)絡信息搜集的原理
3.2.1 信息搜集的基本流程
3.2.2 遍歷策略
3.2.3 頁面解析
3.3 網(wǎng)絡信息搜集的禮貌原則
3.3.1 機器人排斥協(xié)議
3.3.2 機器人元標簽
3.4 高性能信息搜集
3.4.1 并行搜集
3.4.2 DNS優(yōu)化
3.4.3 優(yōu)先搜集策略
3.4.4 網(wǎng)頁更新
3.4.5 網(wǎng)頁消重
3.4.6 避免蜘蛛陷阱
3.5 專題信息搜集
3.5.1 網(wǎng)頁的主題特性
3.5.2 專題信息搜集算法
3.6 小結
思考題
習題
參考文獻
第4章 網(wǎng)頁文本處理和索引
4.1 文本的特性
4.1.1 信息熵
4.1.2 統(tǒng)計定律
4.2 網(wǎng)頁信息的特征
4.2.1 網(wǎng)頁結構
4.2.2 網(wǎng)頁類型
4.3 網(wǎng)頁去噪
4.3.1 基于網(wǎng)頁結構的方法
4.3.2 基于模板的方法
4.4 文本處理
4.4.1 詞匯分析
4.4.2 排除停用詞
4.4.3 詞干提取
4.4.4 索引詞選擇
4.5 索引
4.5.1 Trie樹
4.5.2 后綴樹
4.5.3 簽名檔
4.5.4 倒排文件
4.6 小結
思考題
習題
參考文獻
第5章 查詢語言與查詢處理
5.1 Web查詢語言
5.1.1 WebSQL查詢語言
5.1.2 W3QL查詢語言
5.1.3 WebOQL查詢語言
5.2 查詢方式
5.2.1 基于關鍵字的查詢
5.2.2 模式匹配
5.3 相關反饋
5.3.1 向量空間模型中的相關反饋
5.3.2 概率模型中的相關反饋
5.4 查詢擴展
5.4.1 基于字典的簡單查詢擴展
5.4.2 自動局部分析
5,4.3 自動全局分析
5.5 小結
思考題
習題
參考文獻
第6章 信息檢索性能評價
6.1 信息檢索評價指標
6.1.1 查全率和查準率
6.1.2 其他評價指標
6.2 信息檢索評價基準
6.2.1 基準測試
6.2.2 TREC評測
6.2.3 Web檢索評價
6.2.4 CWIRF評測
6.3 小結
思考題
習題
參考文獻
第7章 搜索引擎
7.1 概述
7.1.1 發(fā)展概況
7.1,2 術語與定義
7.1.3 工作原理
7.2 鏈接分析
7.2.1 PageRank
7.2.2 HITS
7.2.3 算法比較
7.3 相關排序
7.3.1 Lucene檢索模型
7.3.2 Nutch排序算法
7.4 大規(guī)模搜索引擎
7.4.1 體系架構
7.4.2 數(shù)據(jù)結構
7.4.3 檢索算法
7.4.4 相關排序
7.5 小結
思考題
習題
參考文獻
第8章 并行和分布式信息檢索
8.1 并行信息檢索
8.1.1 并行計算的概念
8.1.2 并行信息檢索體系架構
8.1.3 并行編程
8.1.4 數(shù)據(jù)并行
8.2 分布式信息檢索
8.3 元搜索引擎
8.3.1 系統(tǒng)架構
8.3.2 資源選擇
8.3.3 文檔選擇
8.3.4 信息融合
8.4 P2P網(wǎng)絡信息檢索
8.4.1 P2P網(wǎng)絡信息檢索的原理
8.4.2 非結構化P2P網(wǎng)絡信息檢索
8.4.3 結構化P2P網(wǎng)絡信息檢索
8.5 小結
思考題
習題
參考文獻
第9章 中文和跨語言信息檢索
9.1 中文預處理
9.1.1 中文編碼及轉換
9.1.2 中文分詞
9.2 中文信息檢索
9.2.1 中文檢索模型
9.2.2 中文索引
9.3 跨語言信息檢索
9.3.1 基本原理
9.3.2 基于GVSM的跨語言檢索
9.3.3 基于LSI的跨語言檢索
9,4 小結
思考題
習題
參考文獻
第10章 多媒體信息檢索
10.1 基于內容的圖像信息檢索
10.2 圖像特征提取
10.2.1 顏色特征
10.2.2 形狀特征提取
10.2.3 紋理特征提取
10.3 圖像相似量度
10.4 基于內容的視頻信息檢索
10.4.1 鏡頭分割
10.4.2 關鍵幀提取
10.5 基于內容的音頻信息檢索
10.6 小結
思考題
習題
參考文獻
第11章 信息分類與聚類
11.1 基本知識
11.1.1 類的概念
11.1.2 對象特征描述
11.1.3 文檔相似性
11.1.4 類間距離
11.2 特征描述及提取
11.2.1 特征提取
11.2.2 特征選擇
11.3 聚類方法
11.3.1 劃分聚類法
11.3.2 層次聚類法
11.3.3 其他聚類方法
11.4 分類方法
11.4.1 NaiveBayes算法
11.4.2 kNN算法
11.4.3 Rocchio算法
11.4.4 SVM算法
11.5 方法評測
11.5.1 聚類方法評測
11.5.2 分類方法評測
11.5.3 顯著性檢驗
11.6 小結
思考題
習題
參考文獻
第12章 Web信息抽取與問答系統(tǒng)
12.1 信息抽取概述
12.1.1 信息抽取的發(fā)展
12.1.2 信息抽取的評價指標
12.2 Web信息抽取
12.2.1 基于關鍵字的Web信息抽取
12.2.2 基于模式的Web信息抽取
12.2.3 基于樣本的Web信息抽取
12.3 問答系統(tǒng)
12.3.1 問題分析
12.3.2 信息檢索
12.3.3 答案抽取
12.6 小結
思考題
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號