注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計Python社會媒體挖掘

Python社會媒體挖掘

Python社會媒體挖掘

定 價:¥69.00

作 者: [意] 馬爾科·邦扎尼尼(Marco Bonzanini) 著,陳小莉,陶俊杰 譯
出版社: 人民郵電出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787115494016 出版時間: 2018-10-01 包裝: 平裝
開本: 16開 頁數(shù): 229 字數(shù):  

內(nèi)容簡介

  本書共分為9章,從社會媒體API、數(shù)據(jù)挖掘技巧和Python的數(shù)據(jù)科學(xué)工具這3個主題進行闡釋。主要內(nèi)容包括:如何用Python通過公共API與社會媒體平臺交互,如何以方便的格式為數(shù)據(jù)分析存儲社會媒體數(shù)據(jù),如何使用Python數(shù)據(jù)科學(xué)工具分割社會媒體數(shù)據(jù),如何用文本分析方法理解社會媒體數(shù)據(jù),如何用先進的統(tǒng)計和分析手段從海量數(shù)據(jù)中挖掘出有用信息,以及如何用Web技術(shù)來可視化數(shù)據(jù)。

作者簡介

  馬爾科·邦扎尼尼(Marco Bonzanini) 數(shù)據(jù)科學(xué)咨詢師,擁有倫敦瑪麗王后大學(xué)信息檢索專業(yè)博士學(xué)位,是PyData倫敦meetup及系列會議的合作組織者,在很多國際會議上做過演講,并且在PacktPub上教授“Python數(shù)據(jù)分析”和“實用Python數(shù)據(jù)科學(xué)技術(shù)”兩門課程。他在個人博上分享了很多技術(shù)主題,主要關(guān)于Python、文本分析和數(shù)據(jù)科學(xué)。

圖書目錄

第 1章 社會媒體、社交數(shù)據(jù)和Python  1
1.1 入門 1
1.2 社會媒體——機遇和挑戰(zhàn) 2
1.2.1 機遇 3
1.2.2 挑戰(zhàn) 4
1.2.3 社會媒體挖掘技術(shù) 7
1.3 Python的數(shù)據(jù)科學(xué)工具 10
1.3.1 Python開發(fā)環(huán)境的安裝 11
1.3.2 高效的數(shù)據(jù)分析 14
1.3.3 機器學(xué)習(xí) 17
1.3.4 自然語言處理 21
1.3.5 社會網(wǎng)絡(luò)分析 25
1.3.6 數(shù)據(jù)可視化 26
1.4 Python中的數(shù)據(jù)處理 28
1.5 創(chuàng)建復(fù)雜的數(shù)據(jù)管道 29
1.6 小結(jié) 30
第 2章 Twitter數(shù)據(jù)挖掘——標簽、話題和時間序列 31
2.1 入門 31
2.2 Twitter API 32
2.2.1 接口訪問頻率限制 32
2.2.2 搜索與流 33
2.3 從Twitter收集數(shù)據(jù) 34
2.3.1 從時間線獲取推文 35
2.3.2 推文的結(jié)構(gòu) 38
2.3.3 使用流API 42
2.4 分析推文——實體分析 44
2.5 分析推文——文本分析 48
2.6 分析推文——時間序列分析 54
2.7 小結(jié) 57
第3章 Twitter用戶、粉絲和社區(qū) 58
3.1 用戶、好友和粉絲 58
3.1.1 回到Twitter API 58
3.1.2 用戶資料的結(jié)構(gòu) 59
3.1.3 下載好友和粉絲的資料 62
3.1.4 分析你的社會網(wǎng)絡(luò) 64
3.1.5 度量影響力和參與度 68
3.2 挖掘粉絲 72
3.3 挖掘?qū)υ挕?7
3.4 在地圖上繪制推文 80
3.4.1 將推文轉(zhuǎn)換為GeoJSON 80
3.4.2 用Folium輕松繪制地圖 83
3.5 小結(jié) 89
第4章 Facebook帖子、頁面和用戶互動 90
4.1 Facebook Graph API 90
4.1.1 注冊你的應(yīng)用 90
4.1.2 鑒權(quán)和安全 92
4.1.3 用Python連接Facebook Graph API 93
4.2 挖掘你的帖子 96
4.2.1 帖子的結(jié)構(gòu) 99
4.2.2 時間頻率分析 99
4.3 挖掘Facebook頁面 101
4.3.1 從頁面獲取帖子 103
4.3.2 度量參與度 107
4.3.3 用詞云可視化帖子 112
4.4 小結(jié) 114
第5章 Google+話題分析 115
5.1 Google+ API入門 115
5.2 在Web GUI中嵌入搜索結(jié)果 120
5.2.1 Python的裝飾器 121
5.2.2 Flask路由和模板 122
5.3 Google+頁面的筆記和活動 125
5.4 筆記的文本分析和TF-IDF計算 127
5.5 小結(jié) 134
第6章 Stack Exchange提問和回答 135
6.1 提問和回答 135
6.2 Stack Exchange API入門 137
6.2.1 搜索帶標簽的問題 139
6.2.2 搜索用戶 142
6.3 處理Stack Exchange的存檔數(shù)據(jù) 144
6.4 問題標簽的文本分類 149
6.4.1 監(jiān)督學(xué)習(xí)和文本分類 149
6.4.2 分類算法 153
6.4.3 評估 155
6.4.4 Stack Exchange數(shù)據(jù)的文本分類 157
6.4.5 在實時應(yīng)用中嵌入分類器 161
6.5 小結(jié) 165
第7章 博客、RSS、維基百科和自然語言處理 166
7.1 博客和自然語言處理 166
7.2 從博客和網(wǎng)站獲取數(shù)據(jù) 166
7.2.1 使用WordPress.com API 167
7.2.2 使用Blogger API 170
7.2.3 解析RSS和Atom訂閱 173
7.2.4 從維基百科獲取數(shù)據(jù) 174
7.2.5 關(guān)于網(wǎng)絡(luò)爬取的一點建議 176
7.3 自然語言處理基礎(chǔ) 177
7.3.1 文本處理 177
7.3.2 信息抽取 185
7.4 小結(jié) 190
第8章 挖掘所有數(shù)據(jù) 191
8.1 很多社交API 191
8.2 挖掘YouTube上的視頻 191
8.3 挖掘GitHub上的開源軟件 196
8.4 挖掘Yelp上的本地商家 203
8.5 創(chuàng)建自定義的Python客戶端 208
8.6 小結(jié) 210
第9章 關(guān)聯(lián)數(shù)據(jù)和語義網(wǎng) 211
9.1 數(shù)據(jù)網(wǎng) 211
9.1.1 語義網(wǎng)詞匯 212
9.1.2 微格式 215
9.1.3 關(guān)聯(lián)數(shù)據(jù)和開放數(shù)據(jù) 216
9.1.4 RDF 217
9.1.5 JSON-LD格式 218
9.1.6 Schema.org 219
9.2 從DBpedia挖掘關(guān)系 220
9.3 挖掘地理坐標 222
9.3.1 從維基百科抽取地理數(shù)據(jù) 222
9.3.2 在Google Maps上繪制地理數(shù)據(jù) 225
9.4 小結(jié) 229

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號