注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)程序設(shè)計(jì)綜合文本挖掘與Python實(shí)踐

文本挖掘與Python實(shí)踐

文本挖掘與Python實(shí)踐

定 價(jià):¥68.00

作 者: 劉金花
出版社: 四川大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787569045383 出版時(shí)間: 2021-08-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 204 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書從文本數(shù)據(jù)具有的特點(diǎn)以及文本挖掘具有的價(jià)值和意義開(kāi)始,講解了文本數(shù)據(jù)的獲取和預(yù)處理的方法(包括中英文的文本預(yù)處理),給出了文本向量化表示方法。本書從統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法和深度神經(jīng)網(wǎng)絡(luò)兩個(gè)角度,介紹了包括向量空間模型以及詞、句子和文檔級(jí)的分布式表示;針對(duì)文本分類問(wèn)題,介紹了傳統(tǒng)文本分類方法、深度神經(jīng)網(wǎng)絡(luò)分類方法(多層感知機(jī)文本分類、卷積神經(jīng)網(wǎng)絡(luò)文本分類和循環(huán)神經(jīng)網(wǎng)絡(luò)文本分類)和文本分類的評(píng)價(jià)指標(biāo);針對(duì)文本聚類,包括文檔相似度度量方法,介紹了基于劃分、層次、密度的基礎(chǔ)性聚類算法,以及譜聚類等高級(jí)聚類方法和文本聚類的評(píng)價(jià)指標(biāo);在理論學(xué)習(xí)的基礎(chǔ)上,介紹了文本主題的挖掘技術(shù),包括潛在語(yǔ)義分析、非負(fù)矩陣分解、概率潛在語(yǔ)義分析和潛在狄利克雷分布等;最后從文本內(nèi)容、主題和基于時(shí)間信息三個(gè)方面介紹了文本數(shù)據(jù)可視化的方法與工具。本書不僅對(duì)文本挖掘的相關(guān)理論模型進(jìn)行了詳細(xì)的推理和全面介紹,而且在每個(gè)算法模型之后都會(huì)給出實(shí)例,在理論與實(shí)踐之間做了很好的平衡與銜接。

作者簡(jiǎn)介

  劉金花,1987年生,碩士,山西醫(yī)科大學(xué)汾陽(yáng)學(xué)院講師。主要研究方向?yàn)闄C(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘。

圖書目錄

1 概述
1.1 文本數(shù)據(jù)
1.2 文本挖掘與分析
1.3 小結(jié)
2 數(shù)據(jù)獲取及預(yù)處理
2.1 數(shù)據(jù)獲取
2.2 數(shù)據(jù)清洗
2.3 數(shù)據(jù)預(yù)處理
2.4 N元語(yǔ)法模型
2.5 小結(jié)
3 文本向量化
3.1 向量空間模型
3.2 分布文本表示模型
3.3 句子向量化
3.4 文檔向量化
3.5 小結(jié)
4 文本分類
4.1 文本分類基礎(chǔ)
4.2 傳統(tǒng)文本分類算法
4.3 深度神經(jīng)網(wǎng)絡(luò)方法
4.4 文本分類評(píng)價(jià)
4.5 小結(jié)
5 文本聚類
5.1 文本聚類基礎(chǔ)
5.2 基于劃分的聚類
5.3 基于層次的聚類
5.4 基于密度的聚類
5.5 譜聚類
5.6 文本聚類評(píng)價(jià)
5.7 小結(jié)
6 主題模型
6.1 潛在語(yǔ)義分析
6.2 非負(fù)矩陣分解(NMF)
6.3 概率潛在語(yǔ)義分析(PLSA)
6.4 潛在狄利克雷分布(LDA)
6.5 小結(jié)
7 文本數(shù)據(jù)可視化
7.1 文本內(nèi)容可視化
7.2 文本主題可視化
7.3 基于時(shí)間信息的數(shù)據(jù)可視化
7.4 小結(jié)
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)