注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)電子商務(wù)與計(jì)算機(jī)文化搜索引擎:信息檢索實(shí)踐

搜索引擎:信息檢索實(shí)踐

搜索引擎:信息檢索實(shí)踐

定 價(jià):¥56.00

作 者: (美)克羅夫特 等著,劉挺 等譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 計(jì)算機(jī)科學(xué)叢書(shū)
標(biāo) 簽: 檔案學(xué)

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111288084 出版時(shí)間: 2010-06-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 309 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《搜索引擎:信息檢索實(shí)踐》介紹了信息檢索中的關(guān)鍵問(wèn)題,以及這些問(wèn)題如何影響搜索引擎的設(shè)計(jì)與實(shí)現(xiàn),很好地兼顧了信息檢索理論以及搜索引擎的設(shè)計(jì)、實(shí)現(xiàn)和使用中的知識(shí)面廣度與深度問(wèn)題,重點(diǎn)關(guān)注于那些對(duì)于實(shí)現(xiàn)搜索引擎組件以及組件背后的信息檢索模型最重要的部分,以及網(wǎng)絡(luò)上使用的搜索技術(shù)?!端阉饕妫盒畔z索實(shí)踐》適合作為高等院校計(jì)算機(jī)科學(xué)或計(jì)算機(jī)工程專(zhuān)業(yè)本科生或研究生的教材。

作者簡(jiǎn)介

  克羅夫特(W.Bruce Croft),馬薩諸塞大學(xué)阿默斯特分校計(jì)算機(jī)科學(xué)特聘教授、ACM會(huì)士。他創(chuàng)建了智能信息檢索研究中心,發(fā)表了200余篇論文,多次獲獎(jiǎng),其中包括2003年由ACM SIGIR頒發(fā)的Gerard Salton獎(jiǎng)。Donald Metzler,馬薩諸塞大學(xué)阿默斯特分校博士,是位于加州Santa Clara的雅虎研究中心搜索與計(jì)算機(jī)廣告組的研究科學(xué)家。Trevor Strohman,馬薩諸塞大學(xué)阿默斯特分校博士。他開(kāi)發(fā)了Galago搜索引擎,也是Indri搜索引擎的主要開(kāi)發(fā)者。

圖書(shū)目錄

出版者的話(huà)
譯者序
前言
第1章 搜索引擎和信息檢索
 1.1 什么是信息檢索
 1.2 重要問(wèn)題
 1.3 搜索引擎
 1.4 搜索工程師
 參考文獻(xiàn)和深入閱讀
 練習(xí)
第2章 搜索引擎的架構(gòu)
 2.1 什么是軟件架構(gòu)
 2.2 基本的構(gòu)件
 2.3 組件及其功能
  2.3.1 文本采集
  2.3.2 文本轉(zhuǎn)換
  2.3.3 索引的創(chuàng)建
  2.3.4 用戶(hù)交互
  2.3.5 排序
  2.3.6 評(píng)價(jià)
 2.4 搜索引擎是如何工作的
 參考文獻(xiàn)和深入閱讀
 練習(xí)
第3章 信息采集和信息源
 3.1 確定搜索的內(nèi)容
 3.2 網(wǎng)絡(luò)信息爬取
  3.2.1 抓取網(wǎng)頁(yè)
  3.2.2 網(wǎng)絡(luò)爬蟲(chóng)
  3.2.3 時(shí)新性
  3.2.4 面向主題的信息采集
  3.2.5 深層網(wǎng)絡(luò)
  3.2.6 網(wǎng)站地圖
  3.2.7 分布式信息采集
 3.3 文檔和電子郵件的信息采集
 3.4 文檔信息源
 3.5 轉(zhuǎn)換問(wèn)題
 3.6 存儲(chǔ)文檔
  3.6.1 使用數(shù)據(jù)庫(kù)系統(tǒng)
  3.6.2 隨機(jī)存取
  3.6.3 壓縮和大規(guī)模文件
  3.6.4 更新
   3.6.5 BigTable
 3.7 重復(fù)檢測(cè)
 3.8 去除噪聲
 參考文獻(xiàn)和深入閱讀
 練習(xí)
第4章 文本處理
 4.1 從詞到詞項(xiàng)
 4.2 文本統(tǒng)計(jì)
  4.2.1 詞表增長(zhǎng)
  4.2.2 估計(jì)數(shù)據(jù)集和結(jié)果集大小
 4.3 文檔解析
  4.3.1 概述
  4.3.2 詞素切分
  4.3.3 停用詞去除
  4.3.4 詞干提取
  4.3.5 短語(yǔ)和n元串
 4.4 文檔結(jié)構(gòu)和標(biāo)記
  4.5 鏈接分析
  4.5.1 錨文本
  4.5.2 PageRank
  4.5.3 鏈接質(zhì)量
 4.6 信息抽取
 4.7 國(guó)際化
 參考文獻(xiàn)和深入閱讀
 練習(xí)
第5章 基于索引的相關(guān)排序
 5.1 概述
 5.2 抽象的相關(guān)排序模型
 5.3 倒排索引
  5.3.1 文檔
  5.3.2 計(jì)數(shù)
  5.3.3 位置
  5.3.4 域與范圍
  5.3.5 分?jǐn)?shù)
  5.3.6 排列
 5.4 壓縮
  5.4.1 熵與歧義
  5.4.2 Delta編碼
  5.4.3 位對(duì)齊碼
  5.4.4 字節(jié)對(duì)齊碼
  5.4.5 實(shí)際應(yīng)用中的壓縮
  5.4.6 展望
  5.4.7 跳轉(zhuǎn)和跳轉(zhuǎn)指針
 5.5 輔助結(jié)構(gòu)
 5.6 索引構(gòu)建
  5.6.1 簡(jiǎn)單構(gòu)建
  5.6.2 融合
  5.6.3 并行與分布式
  5.6.4 更新
 5.7 查詢(xún)處理
  5.7.1 document-at-a-time評(píng)價(jià)
  5.7.2 term-at-a-time評(píng)價(jià)
  5.7.3 優(yōu)化技術(shù)
  5.7.4 結(jié)構(gòu)化查詢(xún)
  5.7.5 分布式的評(píng)價(jià)
  5.7.6 緩存
 參考文獻(xiàn)和深入閱讀
 練習(xí)
第6章 查詢(xún)與界面
 6.1 信息需求與查詢(xún)
 6.2 查詢(xún)轉(zhuǎn)換與提煉
  6.2.1 停用詞去除和詞干提取
  6.2.2 拼寫(xiě)檢查和建議
  6.2.3 查詢(xún)擴(kuò)展
  6.2.4 相關(guān)反饋
  6.2.5 上下文和個(gè)性化
 6.3 搜索結(jié)果顯示
  6.3.1 搜索結(jié)果頁(yè)面與頁(yè)面摘要
  6.3.2 廣告與搜索
  6.3.3 結(jié)果聚類(lèi)
 6.4 跨語(yǔ)言搜索
 參考文獻(xiàn)和深入閱讀
 練習(xí)
第7章 檢索模型
 7.1 檢索模型概述
  7.1.1 布爾檢索
  7.1.2 向量空間模型
 7.2 概率模型
  7.2.1 將信息檢索作為分類(lèi)問(wèn)題
  7.2.2 BM25排序算法
 7.3 基于排序的語(yǔ)言模型
  7.3.1 查詢(xún)項(xiàng)似然排序
  7.3.2 相關(guān)性模型和偽相關(guān)反饋
 7.4 復(fù)雜查詢(xún)和證據(jù)整合
  7.4.1 推理網(wǎng)絡(luò)模型
  7.4.2 Galago查詢(xún)語(yǔ)言
 7.5 網(wǎng)絡(luò)搜索
 7.6 機(jī)器學(xué)習(xí)和信息檢索
  7.6.1 排序?qū)W習(xí)
  7.6.2 主題模型和詞匯不匹配
 7.7 基于應(yīng)用的模型
 參考文獻(xiàn)和深入閱讀
 練習(xí)
第8章 搜索引擎評(píng)價(jià)
 8.1 搜索引擎評(píng)價(jià)的意義
 8.2 評(píng)價(jià)語(yǔ)料
 8.3 日志
 8.4 效果評(píng)價(jià)
  8.4.1 召回率和準(zhǔn)確率
  8.4.2 平均化和插值
  8.4.3 關(guān)注排序靠前的文檔
  8.4.4 使用用戶(hù)偏好
 8.5 效率評(píng)價(jià)
 8.6 訓(xùn)練、測(cè)試和統(tǒng)計(jì)
  8.6.1 顯著性檢驗(yàn)
  8.6.2 設(shè)置參數(shù)值
  8.6.3 在線(xiàn)測(cè)試
 8.7 基本要點(diǎn)
 參考文獻(xiàn)和深入閱讀
 練習(xí)
第9章 分類(lèi)和聚類(lèi)
 9.1 分類(lèi)
  9.1.1 樸素貝葉斯
  9.1.2 支持向量機(jī)
  9.1.3 評(píng)價(jià)
  9.1.4 分類(lèi)器和特征選擇
  9.1.5 垃圾、情感及在線(xiàn)廣告
 9.2 聚類(lèi)
  9.2.1 層次聚類(lèi)和K均值聚類(lèi)
  9.2.2 K近鄰聚類(lèi)
  9.2.3 評(píng)價(jià)
  9.2.4 如何選擇K
  9.2.5 聚類(lèi)和搜索
 參考文獻(xiàn)和深入閱讀
 練習(xí)
第10章 社會(huì)化搜索
 10.1 什么是社會(huì)化搜索
 10.2 用戶(hù)標(biāo)簽和人工索引
  10.2.1 搜索標(biāo)簽
  10.2.2 推測(cè)缺失的標(biāo)簽
  10.2.3 瀏覽和標(biāo)簽云
 10.3 社區(qū)內(nèi)搜索
  10.3.1 什么是社區(qū)
  10.3.2 社區(qū)發(fā)現(xiàn)
  10.3.3 基于社區(qū)的問(wèn)答
  10.3.4 協(xié)同搜索
 10.4 過(guò)濾和推薦
  10.4.1 文檔過(guò)濾
  10.4.2 協(xié)同過(guò)濾
 10.5 P2P搜索和元搜索
  10.5.1 分布式搜索
  10.5.2 P2P網(wǎng)絡(luò)
 參考文獻(xiàn)和深入閱讀
 練習(xí)
第11章 超越詞袋
 11.1 概述
 11.2 基于特征的檢索模型
 11.3 詞項(xiàng)依賴(lài)模型
 11.4 再談結(jié)構(gòu)化
  11.4.1 XML檢索
  11.4.2 實(shí)體搜索
 11.5 問(wèn)題越長(zhǎng),答案越好
 11.6 詞語(yǔ)、圖片和音樂(lè)
 11.7 搜索能否適用于所有情況
 參考文獻(xiàn)和深入閱讀
 練習(xí)
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)