注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計程序設(shè)計綜合Python爬蟲從菜鳥到高手

Python爬蟲從菜鳥到高手

Python爬蟲從菜鳥到高手

定 價:¥119.00

作 者: 李寧
出版社: 清華大學(xué)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302640516 出版時間: 2023-09-01 包裝: 平裝
開本: 頁數(shù): 字數(shù):  

內(nèi)容簡介

  本書從實戰(zhàn)角度系統(tǒng)論述了Python 爬蟲技術(shù)的核心知識,并通過大量的真實項目幫助讀者深入掌握Python 爬蟲技術(shù)及其實現(xiàn)。本書提供了大量實戰(zhàn)案例,演繹采用各種技術(shù)編寫Python 爬蟲的方式。讀者可以任意組合使用這些技術(shù),完成非常復(fù)雜的爬蟲應(yīng)用。本書共20 章,分為五篇。第一篇:基礎(chǔ)知識(第1~2 章),主要包括Python 編程環(huán)境的搭建、IDE 的安裝和使用、HTTP 的基礎(chǔ)知識、網(wǎng)頁基礎(chǔ)(HTML、CSS、JavaScript)、爬蟲的基本原理、Session、Cookie。第二篇:網(wǎng)絡(luò)庫(第3~5 章),主要包括網(wǎng)絡(luò)庫urllib、urllib3 和requests 的核心使用方法,例如,發(fā)送HTTP 請求、處理超時、設(shè)置HTTP 請求頭、處理中文字符、搭建和使用代理、解析鏈接、Robots 協(xié)議等。第三篇:解析庫(第6~9 章),主要包括3 個常用解析庫(lxml、Beautiful Soup 和pyquery)的使用方法,同時介紹了多種用于分析HTML 代碼的技術(shù),例如,正則表達式、XPath、CSS 選擇器、方法選擇器等。第四篇:數(shù)據(jù)存儲(第10~11 章),主要包括Python 中數(shù)據(jù)存儲的解決方案,如文件存儲和SQLite 數(shù)據(jù)庫。第五篇:爬蟲高級應(yīng)用(第12~20 章),主要包括Python 爬蟲的一些高級技術(shù),如抓取異步數(shù)據(jù)、Selenium、Splash、抓取移動App 數(shù)據(jù)、Appium、多線程爬蟲、爬蟲框架Scrapy、通過OpenCV 技術(shù)識別驗證碼;最后給出一個綜合的實戰(zhàn)案例,該案例綜合了Python 爬蟲、數(shù)據(jù)存儲、PyQt、多線程、數(shù)據(jù)可視化、Web 等多種技術(shù)實現(xiàn)一個可視化爬蟲。

作者簡介

暫缺《Python爬蟲從菜鳥到高手》作者簡介

圖書目錄

暫缺《Python爬蟲從菜鳥到高手》目錄

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號