注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python中文文本分析

Python中文文本分析

Python中文文本分析

定 價:¥36.00

作 者: 景永霞,茍和平 著
出版社: 蘭州大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購買這本書可以去


ISBN: 9787311058364 出版時間: 2020-12-01 包裝: 平裝
開本: 16開 頁數(shù): 211 字?jǐn)?shù):  

內(nèi)容簡介

  本書對中文文本分析的實(shí)現(xiàn)環(huán)境、相關(guān)關(guān)鍵算法、文本數(shù)據(jù)類型和結(jié)構(gòu)等進(jìn)行了詳細(xì)的分析,并利用國內(nèi)相關(guān)研究機(jī)構(gòu)提供的幾種標(biāo)準(zhǔn)中文文本數(shù)據(jù)集進(jìn)行了算法的測試分析,同時也采用數(shù)據(jù)獲取工具從網(wǎng)絡(luò)上獲取部分實(shí)際平臺的中文文本數(shù)據(jù),對相關(guān)算法的適應(yīng)性進(jìn)行分析,使讀者能夠掌握中文文本分析的具體流程和方法。

作者簡介

  景永霞,碩士研究生,副教授,畢業(yè)于西北師范大學(xué)計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)。目前為瓊臺師范學(xué)院信息科學(xué)技術(shù)學(xué)院教師、瓊臺師范學(xué)院教育大數(shù)據(jù)與人工智能研究所主要成員。主要研究方向?yàn)閿?shù)據(jù)倉庫與數(shù)據(jù)挖掘,參編教材3部,主持和參與省部級以上科研項(xiàng)目8項(xiàng),發(fā)表學(xué)術(shù)論文40多篇。

圖書目錄

第1章 概述
1.1 文本分析的意義
1.2 文本分析的目的
1.3 本書內(nèi)容安排
第2章 文本分析的環(huán)境
2.1 Python運(yùn)行環(huán)境
2.2 文本分析的常用庫
2.3 Anaconda
第3章 Python基礎(chǔ)
3.1 Pvthon基本概念
3.2 Python腳本創(chuàng)建與運(yùn)行
3.3 Python核心數(shù)據(jù)類型
3.4 Python控制結(jié)構(gòu)
3.5 Python函數(shù)
3.6 正則表達(dá)式
第4章 文本預(yù)處理
4.1 幾種常見的中文文本語料庫
4.2 文本清洗
4.3 文本分詞
4.4 刪除停用詞與詞頻統(tǒng)計(jì)
第5章 文本特征選擇與向量化
5.1 基本概念
5.2 詞袋模型
5.3 TF—IDF模型
5.4 IG模型
5.5 卡方檢驗(yàn)
第6章 特征抽取
6.1 特征抽取的意義
6.2 奇異值分解(SvD)
6.3 主成分分析(PCA)
6.4 潛在狄利克雷分布(LDA)
6.5 非負(fù)矩陣分解(NMF)
6.6 案例分析
第7章 詞向量
7.1 詞向量基本概念
7.2 Word2Vec
7.3 采用Gensim工具訓(xùn)練詞向量
7.4 詞向量在文本分析中的應(yīng)用
第8章 文本分類
8.1 文本分類基本概念
8.2 文本分類類型
8.3 分類模型評估
8.4 基于傳統(tǒng)機(jī)器學(xué)習(xí)的文本分類模型
8.5 特征抽取在文本分類中的應(yīng)用
8.6 特征選擇結(jié)合特征抽取在文本分類中的應(yīng)用
第9章 情感分析
9.1 情感分析概述
9.2 情感分析層次
9.3 基于情感詞的文本情感分析
9.4 基于機(jī)器學(xué)習(xí)的文本情感分析
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號