注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python網(wǎng)絡(luò)爬蟲開發(fā)從入門到精通

Python網(wǎng)絡(luò)爬蟲開發(fā)從入門到精通

Python網(wǎng)絡(luò)爬蟲開發(fā)從入門到精通

定 價(jià):¥79.00

作 者: 劉延林
出版社: 北京大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787301309094 出版時(shí)間: 2019-12-01 包裝:
開本: 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書共分 3 篇,針對(duì) Python 爬蟲初學(xué)者,從零開始,系統(tǒng)地講解了如何利用 Python 進(jìn)行常見的網(wǎng)絡(luò)爬蟲的程序開發(fā)。第 1 篇快速入門篇(第 1 章 ~ 第 9 章):本篇主要介紹了 Python 環(huán)境的搭建和一些 Python 的基礎(chǔ)語法知識(shí)等、Python爬蟲入門知識(shí)及基本的使用方法、Ajax 數(shù)據(jù)的分析和抓取、動(dòng)態(tài)渲染頁面數(shù)據(jù)的爬取、網(wǎng)站代理的設(shè)置與使用、驗(yàn)證碼的識(shí)別與破解,以及 App 數(shù)據(jù)抓取、數(shù)據(jù)的存儲(chǔ)方法等內(nèi)容。第 2 篇技能進(jìn)階篇(第 10 章 ~ 第 12 章):本篇主要介紹了 PySpider 和 Scrapy 兩個(gè)常用爬蟲框架的基本使用方法、分布式爬蟲的實(shí)現(xiàn)思路,以及數(shù)據(jù)分析、數(shù)據(jù)清洗常用庫的使用方法。第 3 篇項(xiàng)目實(shí)戰(zhàn)篇(第 13 章):本篇通過 6 個(gè)綜合實(shí)戰(zhàn)項(xiàng)目,詳細(xì)地講解了 Python 數(shù)據(jù)爬蟲開始與實(shí)戰(zhàn)應(yīng)用。本篇對(duì)全書內(nèi)容進(jìn)行了總結(jié)回顧,強(qiáng)化讀者的實(shí)操水平。本書案例豐富,注重實(shí)戰(zhàn),既適合 Python 程序員和爬蟲愛好者閱讀學(xué)習(xí),也適合作為廣大職業(yè)院校相關(guān)專業(yè)的教學(xué)用書。

作者簡(jiǎn)介

  劉延林,知名論壇Python爬蟲專題管理員,擅長(zhǎng)Python爬蟲技術(shù),并對(duì)Python數(shù)據(jù)分析與挖掘有深入研究。在CSDN等多個(gè)知名博客網(wǎng)站發(fā)表多篇技術(shù)文章,深受讀者的喜愛。

圖書目錄

第1篇?快速入門篇
第1章?Python基礎(chǔ) 2
1.1?Python環(huán)境搭建 3
1.2?Python編程入門 16
1.3?新手實(shí)訓(xùn) 33
1.4?新手問答 35
本章小結(jié) 35
第2章?Python爬蟲入門 36
2.1?爬蟲的分類 37
2.2?爬蟲的基本結(jié)構(gòu)和工作流程 38
2.3?爬蟲策略 39
2.4?HTTP的基本原理 40
2.5?網(wǎng)頁基礎(chǔ) 45
2.6?Session和Cookie 49
2.7?新手實(shí)訓(xùn) 51
2.8?新手問答 54
本章小結(jié) 55
第3章?基本庫的使用 56
3.1?urllib 57
3.2?requests 64
3.3?re正則使用 69
3.4?XPath 75
3.5?新手實(shí)訓(xùn) 78
3.6?新手問答 81
本章小結(jié) 82
第4章?Ajax數(shù)據(jù)抓取 83
4.1?Ajax簡(jiǎn)介 84
4.2?使用Python模擬Ajax請(qǐng)求數(shù)據(jù) 91
4.3?新手實(shí)訓(xùn) 93
4.4?新手問答 96
本章小結(jié) 96
第5章?動(dòng)態(tài)渲染頁面爬取 97
5.1?Selenium的使用 98
5.2?Splash的基本使用 115
5.3?新手實(shí)訓(xùn) 127
5.4?新手問答 131
本章小結(jié) 132
第6章?代理的設(shè)置與使用 133
6.1?代理設(shè)置 134
6.2?代理池構(gòu)建 136
6.3?付費(fèi)代理的使用 140
6.4?ADSL撥號(hào)代理的搭建 145
6.5?新手問答 155
本章小結(jié) 156
第7章?驗(yàn)證碼的識(shí)別與破解 157
7.1?普通圖形驗(yàn)證碼的識(shí)別 158
7.2?極驗(yàn)滑動(dòng)驗(yàn)證碼的破解 164
7.3?極驗(yàn)滑動(dòng)拼圖驗(yàn)證碼破解 168
7.4?新手問答 174
本章小結(jié) 175
第8章?App數(shù)據(jù)抓取 176
8.1?Fiddler的基本使用 177
8.2?Charles的基本使用 182
8.3?Appium的基本使用 196
8.4?新手問答 217
本章小結(jié) 217
第9章?數(shù)據(jù)存儲(chǔ) 218
9.1?文件存儲(chǔ) 219
9.2?數(shù)據(jù)庫存儲(chǔ) 224
9.3?新手實(shí)訓(xùn) 236
9.4?新手問答 239
本章小結(jié) 240

第2篇?技能進(jìn)階篇
第10章?常用爬蟲框架 242
10.1?PySpider框架 243
10.2?Scrapy框架 252
10.3?Scrapy-Splash的使用 262
10.4?新手實(shí)訓(xùn) 266
10.5?新手問答 269
本章小結(jié) 269
第11章?部署爬蟲 270
11.1?Linux系統(tǒng)下安裝Python 3 271
11.2?Docker的使用 273
11.3?Docker安裝Python 274
11.4?Docker安裝MySQL 277
本章小結(jié) 278

第12章?數(shù)據(jù)分析 279
12.1?NumPy的使用 280
12.2?Pandas的使用 296
12.3?pyecharts的使用 311
12.4?新手實(shí)訓(xùn) 315
12.5?新手問答 316
本章小結(jié) 316

第3篇?項(xiàng)目實(shí)戰(zhàn)篇
第13章?爬蟲項(xiàng)目實(shí)戰(zhàn) 318
13.1?實(shí)戰(zhàn)一:Selenium+XPath爬取簡(jiǎn)書 319
13.2?實(shí)戰(zhàn)二:使用requests爬取騰訊人口遷徙數(shù)據(jù) 326
13.3?實(shí)戰(zhàn)三:Scrapy爬取豆瓣電影 330
13.4?實(shí)戰(zhàn)四:使用Selenium多線程異步爬取同城旅游網(wǎng)機(jī)票價(jià)格信息 334
13.5?實(shí)戰(zhàn)五:數(shù)據(jù)分析Dessert Apples下12種蘋果全年最高、最低和平均銷量 343
13.6?實(shí)戰(zhàn)六:中國南方航空機(jī)票信息爬取 346
本章小結(jié) 352

附錄?Python常見面試題精選 353

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)