注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡軟件與程序設計Elasticsearch大數(shù)據(jù)搜索引擎

Elasticsearch大數(shù)據(jù)搜索引擎

Elasticsearch大數(shù)據(jù)搜索引擎

定 價:¥49.00

作 者: 羅剛 著
出版社: 電子工業(yè)出版社
叢編項: 人工智能系列
標 簽: 計算機/網(wǎng)絡 數(shù)據(jù)庫 數(shù)據(jù)庫理論

ISBN: 9787121332333 出版時間: 2018-01-01 包裝: 平裝
開本: 16開 頁數(shù): 228 字數(shù):  

內(nèi)容簡介

  Elasticsearch搜索集群系統(tǒng)在生產(chǎn)和生活中發(fā)揮著越來越重要的作用。本書介紹了Elasticsearch的使用、原理、系統(tǒng)優(yōu)化與擴展應用。本書用例子說明了Java、Python、Scala和PHP的編程API,其中在Java搜索界面實現(xiàn)上,介紹了使用Spring實現(xiàn)微服務開發(fā)。為了擴展Elasticsearch的功能,本書以中文分詞和英文文本分析為例介紹了插件開發(fā)方法。本書介紹了使用Elasticsearch作為數(shù)據(jù)管理平臺的日志監(jiān)控與分析方法,介紹了使用OCR從圖像中提取文本以及問答式搜索的開發(fā)方法。

作者簡介

  獵兔搜索技術創(chuàng)始人曾經(jīng)擔任國防大學科研處 技術顧問工信部 輿情開發(fā)顧問東南大學 社會導師首都師范大學 金融課程講師北京石油化工學院 社會導師北大光華管理學院 技術顧問藍汛公司搜索集群技術咨詢顧問新東方 創(chuàng)新研究院 研究員

圖書目錄

第1章 使用Elasticsearch\t1
1.1 基本概念\t1
1.2 安裝\t2
1.3 搜索集群\t5
1.4 創(chuàng)建索引\t6
1.5 使用Java客戶端接口\t9
1.5.1 創(chuàng)建索引\t11
1.5.2 增加、刪除與修改數(shù)據(jù)\t14
1.5.3 分析器\t16
1.5.4 數(shù)據(jù)導入\t17
1.5.5 通過攝取快速導入數(shù)據(jù)\t17
1.5.6 索引庫結構\t17
1.5.7 查詢\t18
1.5.8 區(qū)間查詢\t22
1.5.9 排序\t23
1.5.10 分布式搜索\t23
1.5.11 過濾器\t24
1.5.12 高亮顯示\t24
1.5.13 分頁\t25
1.5.14 通過聚合實現(xiàn)分組查詢\t26
1.5.15 文本列的聚合\t27
1.5.16 遍歷數(shù)據(jù)\t28
1.5.17 索引文檔\t29
1.5.18 Percolate\t29
1.6 RESTClient\t30
1.6.1 使用攝取\t31
1.6.2 代碼實現(xiàn)攝取\t33
1.7 使用Jest\t33
1.8 Python客戶端\t37
1.9 Scala客戶端\t40
1.10 PHP客戶端\t43
1.11 SQL支持\t44
1.12 本章小結\t48
第2章 開發(fā)插件\t49
2.1 搜索中文\t49
2.1.1 中文分詞原理\t49
2.1.2 中文分詞插件原理\t51
2.1.3 開發(fā)中文分詞插件\t53
2.1.4 中文AnalyzerProvider\t55
2.1.5 字詞混合索引\t57
2.2 搜索英文\t60
2.2.1 句子切分\t60
2.2.2 標注詞性\t62
2.3 使用測試套件\t64
2.4 本章小結\t68
第3章 管理搜索集群\t69
3.1 節(jié)點類型\t69
3.2 管理集群\t69
3.3 寫入權限控制\t70
3.4 使用X-Pack\t71
3.5 快照\t72
3.6 Zen發(fā)現(xiàn)機制\t73
3.7 聯(lián)合搜索\t74
3.8 緩存\t74
3.9 本章小結\t75
第4章 源碼分析\t76
4.1 Lucene源碼分析\t76
4.1.1 Ivy管理依賴項\t76
4.1.2 源碼結構介紹\t76
4.2 Gradle\t77
4.3 Guice\t77
4.4 Joda-Time\t79
4.5 Transport\t80
4.6 線程池\t80
4.7 模塊\t80
4.8 Netty\t81
4.9 分布式\t81
4.10 本章小結\t82
第5章 搜索相關性\t83
5.1 BM25檢索模型\t83
5.1.1 使用BM25檢索模型\t86
5.1.2 參數(shù)調(diào)優(yōu)\t86
5.2 學習評分\t86
5.2.1 基本原理\t87
5.2.2 準備數(shù)據(jù)\t87
5.2.3 Elasticsearch學習排名\t89
5.3 本章小結\t91
第6章 搜索引擎用戶界面\t92
6.1 JSP實現(xiàn)搜索界面\t92
6.1.1 用于顯示搜索結果的自定義標簽\t93
6.1.2 使用Listlib\t98
6.1.3 實現(xiàn)翻頁\t100
6.2 使用Spring實現(xiàn)的搜索界面\t102
6.2.1 實現(xiàn)REST搜索界面\t102
6.2.2 REST API中的HTTP PUT\t104
6.2.3 Spring-data-elasticsearch\t106
6.2.4 Spring HATEOAS\t112
6.3 實現(xiàn)搜索接口\t113
6.3.1 編碼識別\t113
6.3.2 布爾搜索\t116
6.3.3 搜索結果排序\t116
6.4 實現(xiàn)相似文檔搜索\t117
6.5 實現(xiàn)AJAX搜索聯(lián)想詞\t119
6.5.1 估計查詢詞的文檔頻率\t119
6.5.2 搜索聯(lián)想詞總體結構\t119
6.5.3 服務器端處理\t120
6.5.4 瀏覽器端處理\t125
6.5.5 拼音提示\t127
6.5.6 部署總結\t127
6.5.7 Suggester\t128
6.6 推薦搜索詞\t129
6.6.1 挖掘相關搜索詞\t130
6.6.2 使用多線程計算相關搜索詞\t132
6.7 查詢意圖理解\t133
6.7.1 拼音搜索\t133
6.7.2 無結果處理\t133
6.8 集成其他功能\t134
6.8.1 拼寫檢查\t134
6.8.2 分類統(tǒng)計\t135
6.8.3 相關搜索\t141
6.8.4 再次查找\t144
6.8.5 搜索日志\t144
6.9 查詢分析\t146
6.9.1 歷史搜索詞記錄\t146
6.9.2 日志信息過濾\t147
6.9.3 信息統(tǒng)計\t148
6.9.4 挖掘日志信息\t150
6.9.5 查詢詞意圖分析\t150
6.10 部署網(wǎng)站\t150
6.10.1 部署到Web服務器\t151
6.10.2 防止攻擊\t152
6.11 本章小結\t156
第7章 OCR文字識別\t157
7.1 Tesseract\t157
7.2 使用TensorFlow識別文字\t161
7.3 OpenCV\t164
7.3.1 預處理\t166
7.3.2 文字區(qū)域提取\t169
7.3.3 糾正偏斜\t171
7.3.4 Linux環(huán)境支持\t172
7.4 JavaCV\t172
7.5 本章小結\t174
第8章 問答式搜索\t176
8.1 生成表示語義的代碼\t176
8.2 信息整合\t181
8.2.1 實體對齊\t181
8.2.2 編輯距離\t181
8.2.3 Jaro-Winkler距離\t187
8.2.4 比較器\t189
8.2.5 Cleaner\t189
8.2.6 運行過程\t190
8.2.7 遺傳算法調(diào)整參數(shù)\t192
8.3 自動問答\t193
8.3.1 問句處理器\t193
8.3.2 自動發(fā)現(xiàn)答案\t198
8.4 本章小結\t199
第9章 Elastic系統(tǒng)監(jiān)控\t201
9.1 Logstash\t201
9.1.1 使用Logstash\t201
9.1.2 插件\t203
9.1.3 數(shù)據(jù)庫輸入插件\t206
9.2 Filebeat\t207
9.3 消息過期\t208
9.4 Kibana\t208
9.5 Flume\t209
9.6 Kafka\t210
9.7 Graylog\t211
9.8 物聯(lián)網(wǎng)數(shù)據(jù)\t215
9.9 本章小結\t216

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號