定 價(jià):¥59.00
作 者: | (印度)克里希納·巴夫薩,(印度)納雷什·庫(kù)馬爾 等 |
出版社: | 機(jī)械工業(yè)出版社 |
叢編項(xiàng): | |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787111616436 | 出版時(shí)間: | 2019-02-01 | 包裝: | 平裝 |
開本: | 16開 | 頁(yè)數(shù): | 字?jǐn)?shù): |
譯者序
前言
作者簡(jiǎn)介
審校者簡(jiǎn)介
第1章 語(yǔ)料庫(kù)和WordNet 1
1.1 引言 1
1.2 訪問內(nèi)置語(yǔ)料庫(kù) 1
1.3 下載外部語(yǔ)料庫(kù),加載并訪問 3
1.4 計(jì)算布朗語(yǔ)料庫(kù)中三種不同類別的特殊疑問詞 5
1.5 探討網(wǎng)絡(luò)文本和聊天文本的詞頻分布 7
1.6 使用WordNet進(jìn)行詞義消歧 9
1.7 選擇兩個(gè)不同的同義詞集,使用WordNet探討上位詞和下位詞的概念 12
1.8 基于WordNet計(jì)算名詞、動(dòng)詞、形容詞和副詞的平均多義性 15
第2章 針對(duì)原始文本,獲取源數(shù)據(jù)和規(guī)范化 17
2.1 引言 17
2.2 字符串操作的重要性 17
2.3 深入實(shí)踐字符串操作 19
2.4 在Python中讀取PDF文件 21
2.5 在Python中讀取Word文件 23
2.6 使用PDF、DOCX和純文本文件,創(chuàng)建用戶自定義的語(yǔ)料庫(kù) 26
2.7 讀取RSS信息源的內(nèi)容 29
2.8 使用BeautifulSoup解析HTML 31
第3章 預(yù)處理 34
3.1 引言 34
3.2 分詞——學(xué)習(xí)使用NLTK內(nèi)置的分詞器 34
3.3 詞干提取——學(xué)習(xí)使用NLTK內(nèi)置的詞干提取器 36
3.4 詞形還原——學(xué)習(xí)使用NLTK中的WordnetLemmatizer函數(shù) 38
3.5 停用詞——學(xué)習(xí)使用停用詞語(yǔ)料庫(kù)及其應(yīng)用 40
3.6 編輯距離——編寫計(jì)算兩個(gè)字符串之間編輯距離的算法 42
3.7 處理兩篇短文并提取共有詞匯 44
第4章 正則表達(dá)式 50
4.1 引言 50
4.2 正則表達(dá)式——學(xué)習(xí)使用*、 和? 50
4.3 正則表達(dá)式——學(xué)習(xí)使用$和^,以及如何在單詞內(nèi)部(非開頭與結(jié)尾處)進(jìn)行模式匹配 52
4.4 匹配多個(gè)字符串和子字符串 54
4.5 學(xué)習(xí)創(chuàng)建日期正則表達(dá)式和一組字符集合或字符范圍 56
4.6 查找句子中所有長(zhǎng)度為5的單詞,并進(jìn)行縮寫 58
4.7 學(xué)習(xí)編寫基于正則表達(dá)式的分詞器 59
4.8 學(xué)習(xí)編寫基于正則表達(dá)式的詞干提取器 60
第5章 詞性標(biāo)注和文法 63
5.1 引言 63
5.2 使用內(nèi)置的詞性標(biāo)注器 63
5.3 編寫你的詞性標(biāo)注器 65
5.4 訓(xùn)練你的詞性標(biāo)注器 70
5.5 學(xué)習(xí)編寫你的文法 73
5.6 編寫基于概率的上下文無(wú)關(guān)文法 76
5.7 編寫遞歸的上下文無(wú)關(guān)文法 79
第6章 分塊、句法分析、依存分析 82
6.1 引言 82
6.2 使用內(nèi)置的分塊器 82
6.3 編寫你的簡(jiǎn)單分塊器 84
6.4 訓(xùn)練分塊器 87
6.5 遞歸下降句法分析 90
6.6 shift-reduce句法分析 93
6.7 依存句法分析和主觀依存分析 95
6.8 線圖句法分析 97
第7章 信息抽取和文本分類 101
7.1 引言 101
7.2 使用內(nèi)置的命名實(shí)體識(shí)別工具 102
7.3 創(chuàng)建字典、逆序字典和使用字典 104
7.4 特征集合選擇 109
7.5 利用分類器分割句子 113
7.6 文本分類 116
7.7 利用上下文進(jìn)行詞性標(biāo)注 120
第8章 高階自然語(yǔ)言處理實(shí)踐 124
8.1 引言 124
8.2 創(chuàng)建一條自然語(yǔ)言處理管道 124
8.3 解決文本相似度問題 131
8.4 主題識(shí)別 136
8.5 文本摘要 140
8.6 指代消解 143
8.7 詞義消歧 147
8.8 情感分析 150
8.9 高階情感分析 153
8.10 創(chuàng)建一個(gè)對(duì)話助手或聊天機(jī)器人 157
第9章 深度學(xué)習(xí)在自然語(yǔ)言處理中的應(yīng)用 163
9.1 引言 163
9.2 利用深度神經(jīng)網(wǎng)絡(luò)對(duì)電子郵件進(jìn)行分類 168
9.3 使用一維卷積網(wǎng)絡(luò)進(jìn)行IMDB情感分類 175
9.4 基于雙向LSTM的IMDB情感分類模型 179
9.5 利用詞向量實(shí)現(xiàn)高維詞在二維空間的可視化 183
第10章 深度學(xué)習(xí)在自然語(yǔ)言處理中的高級(jí)應(yīng)用 188
10.1 引言 188
10.2 基于莎士比亞的著作使用LSTM技術(shù)自動(dòng)生成文本 188
10.3 基于記憶網(wǎng)絡(luò)的情景數(shù)據(jù)問答 193
10.4 使用循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM進(jìn)行語(yǔ)言建模以預(yù)測(cè)最優(yōu)詞 199
10.5 使用循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM構(gòu)建生成式聊天機(jī)器人 203