注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)人工智能自然語(yǔ)言處理與計(jì)算語(yǔ)言學(xué)

自然語(yǔ)言處理與計(jì)算語(yǔ)言學(xué)

自然語(yǔ)言處理與計(jì)算語(yǔ)言學(xué)

定 價(jià):¥59.00

作 者: 格夫·斯里尼瓦薩-德西坎(Bhargav Srinivasa-Desikan) 著,何煒 譯
出版社: 人民郵電出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書(shū)可以去


ISBN: 9787115540249 出版時(shí)間: 2020-08-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 217 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  自然語(yǔ)言處理是一門(mén)融語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué),研究人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的各種理論和方法。計(jì)算語(yǔ)言學(xué)是指通過(guò)建立形式化的數(shù)學(xué)模型來(lái)分析、處理自然語(yǔ)言,并在計(jì)算機(jī)上用程序來(lái)實(shí)現(xiàn)分析和處理的過(guò)程,旨在以機(jī)器來(lái)模擬人的部分或全部語(yǔ)言能力的目的?!蹲匀徽Z(yǔ)言處理與計(jì)算語(yǔ)言學(xué)》作為一本借助于Python編程語(yǔ)言以及各種開(kāi)源工具(如Gensim、spaCy等)來(lái)執(zhí)行文本分析、自然語(yǔ)言處理和計(jì)算語(yǔ)言學(xué)算法的圖書(shū),從應(yīng)用層面介紹了相關(guān)的理論知識(shí)和所涉及的技術(shù)。《自然語(yǔ)言處理與計(jì)算語(yǔ)言學(xué)》共分為15章,其內(nèi)容涵蓋了文本分析的定義、使用Python進(jìn)行文本分析的技巧、spaCy語(yǔ)言模型、Gensim工具、詞性標(biāo)注及其應(yīng)用、NER標(biāo)注及其應(yīng)用、依存分析、主題模型、高級(jí)主題建模、文本聚類和文本分類、查詢?cè)~相似度計(jì)算和文本摘要、詞嵌入、使用深度學(xué)習(xí)處理文本、使用Keras和spaCy進(jìn)行深度學(xué)習(xí)、情感分析與聊天機(jī)器人的原理介紹等?!蹲匀徽Z(yǔ)言處理與計(jì)算語(yǔ)言學(xué)》適合對(duì)自然語(yǔ)言處理的實(shí)現(xiàn)細(xì)節(jié)感興趣的Python程序開(kāi)發(fā)人員閱讀。如果讀者具備統(tǒng)計(jì)學(xué)的基本知識(shí),對(duì)學(xué)習(xí)本書(shū)內(nèi)容會(huì)大有裨益。

作者簡(jiǎn)介

  Bhargav Srinivasa-Desikan 是就職于法國(guó)INRIA公司(位于里爾)的一名研究人員。作為MODAL(數(shù)據(jù)分析與機(jī)器建模)小組的一員,致力于度量學(xué)習(xí)、預(yù)測(cè)聚合和數(shù)據(jù)可視化等研究領(lǐng)域。同時(shí),他也是Python開(kāi)源社區(qū)的一名活躍貢獻(xiàn)者,在2016年度Google的夏季編程賽上,他通過(guò)Gensim實(shí)現(xiàn)了動(dòng)態(tài)主題模型。Bhargav是歐洲和亞洲PyCons和PyDatas的??停⑹褂肞ython進(jìn)行文本分析教學(xué)。他也是Python機(jī)器學(xué)習(xí)軟件包pycobra的維護(hù)者,還在Machine Learning Research雜志上發(fā)表過(guò)相關(guān)文章。

圖書(shū)目錄

第 1章 什么是文本分析\t1
1.1 什么是文本分析 1
1.2 搜集數(shù)據(jù) 5
1.3 若輸入錯(cuò)誤數(shù)據(jù),則輸出亦為錯(cuò)誤數(shù)據(jù)(garbage in,garbage out) 8
1.4 為什么你需要文本分析 9
1.5 總結(jié) 11
第 2章 Python文本分析技巧 12
2.1 為什么用Python來(lái)做文本分析 12
2.2 用Python進(jìn)行文本操作 14
2.3 總結(jié) 18
第3章 spaCy語(yǔ)言模型 19
3.1 spaCy庫(kù) 19
3.2 spaCy的安裝步驟 21
3.3 故障排除 22
3.4 語(yǔ)言模型 22
3.5 安裝語(yǔ)言模型 23
3.6 安裝語(yǔ)言模型的方式及原因 25
3.7 語(yǔ)言模型的基本預(yù)處理操作 25
3.8 分詞 26
3.9 詞性標(biāo)注 28
3.10 命名實(shí)體識(shí)別 29
3.11 規(guī)則匹配 30
3.12 預(yù)處理 31
3.13 總結(jié) 33
第4章 Gensim:文本向量化、向量變換和n-grams的工具 34
4.1 Gensim庫(kù)介紹 34
4.2 向量以及為什么需要向量化 35
4.3 詞袋(bag-of-words) 36
4.4 TF-IDF(詞頻-反向文檔頻率) 37
4.5 其他表示方式 38
4.6 Gensim中的向量變換 38
4.7 n-grams及其預(yù)處理技術(shù) 42
4.8 總結(jié) 44
第5章 詞性標(biāo)注及其應(yīng)用 45
5.1 什么是詞性標(biāo)注 45
5.2 使用Python實(shí)現(xiàn)詞性標(biāo)注 49
5.3 使用spaCy進(jìn)行詞性標(biāo)注 50
5.4 從頭開(kāi)始訓(xùn)練一個(gè)詞性標(biāo)注模型 53
5.5 詞性標(biāo)注的代碼示例 57
5.6 總結(jié) 59
第6章 NER標(biāo)注及其應(yīng)用 60
6.1 什么是NER標(biāo)注 60
6.2 用Python實(shí)現(xiàn)NER標(biāo)注 64
6.3 使用spaCy實(shí)現(xiàn)NER標(biāo)注 67
6.4 從頭開(kāi)始訓(xùn)練一個(gè)NER標(biāo)注器 72
6.5 NER標(biāo)注應(yīng)用實(shí)例和可視化 77
6.6 總結(jié) 79
第7章 依存分析 80
7.1 依存分析 80
7.2 用Python實(shí)現(xiàn)依存分析 85
7.3 用spaCy實(shí)現(xiàn)依存分析 87
7.4 從頭開(kāi)始訓(xùn)練一個(gè)依存分析器 91
7.5 總結(jié) 98
第8章 主題模型 99
8.1 什么是主題模型 99
8.2 使用Gensim構(gòu)建主題模型 101
8.3 隱狄利克雷分配(Latent Dirichlet Allocation) 102
8.4 潛在語(yǔ)義索引(Latent Semantic Indexing) 104
8.5 分層狄利特雷過(guò)程(Hierarchical Dirichlet Process) 105
8.6 動(dòng)態(tài)主題模型 108
8.7 使用scikit-learn構(gòu)建主題模型 109
8.8 總結(jié) 112
第9章 高級(jí)主題建模 113
9.1 高級(jí)訓(xùn)練技巧 113
9.2 探索文檔 117
9.3 主題一致性和主題模型的評(píng)估 121
9.4 主題模型的可視化 123
9.5 總結(jié) 127
第 10章 文本聚類和文本分類 128
10.1 文本聚類 128
10.2 聚類前的準(zhǔn)備工作 129
10.3 K-means 132
10.4 層次聚類 134
10.5 文本分類 136
10.6 總結(jié) 138
第 11章 查詢?cè)~相似度計(jì)算和文本摘要 139
11.1 文本距離的度量 139
11.2 查詢?cè)~相似度計(jì)算 145
11.3 文本摘要 147
11.4 總結(jié) 153
第 12章 Word2Vec、Doc2Vec和Gensim 154
12.1 Word2Vec 154
12.2 用Gensim實(shí)現(xiàn)Word2Vec 155
12.3 Doc2Vec 160
12.4 其他詞嵌入技術(shù) 166
12.5 總結(jié) 172
第 13章 使用深度學(xué)習(xí)處理文本 173
13.1 深度學(xué)習(xí) 173
13.2 深度學(xué)習(xí)在文本上的應(yīng)用 174
13.3 文本生成 177
13.4 總結(jié) 182
第 14章 使用Keras和spaCy進(jìn)行深度學(xué)習(xí) 183
14.1 Keras和spaCy 183
14.2 使用Keras進(jìn)行文本分類 185
14.3 使用spaCy進(jìn)行文本分類 191
14.4 總結(jié) 201
第 15章 情感分析與聊天機(jī)器人 202
15.1 情感分析 202
15.2 基于Reddit的新聞數(shù)據(jù)挖掘 205
15.3 基于Twitter的微博數(shù)據(jù)挖掘 207
15.4 聊天機(jī)器人 209
15.5 總結(jié) 217

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)