注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)采集與預(yù)處理

數(shù)據(jù)采集與預(yù)處理

數(shù)據(jù)采集與預(yù)處理

定 價(jià):¥42.00

作 者: 周勇,楊倩,廖寧,余秋蓮 編
出版社: 西安電子科技大學(xué)出版社
叢編項(xiàng): 新工科應(yīng)用型人才培養(yǎng)計(jì)算機(jī)類系列教材
標(biāo) 簽: 暫缺

ISBN: 9787560663562 出版時(shí)間: 2022-02-01 包裝: 平裝
開本: 16開 頁數(shù): 288 字?jǐn)?shù):  

內(nèi)容簡介

  隨著國家大數(shù)據(jù)相關(guān)政策、規(guī)劃的密集出臺(tái),大數(shù)據(jù)、人工智能商業(yè)落地速度加快,其在各個(gè)領(lǐng)域的應(yīng)用也越來越廣泛,其中面向企業(yè)服務(wù)、金融、醫(yī)療健康、電子政務(wù)、電子商務(wù)等細(xì)分領(lǐng)域的大數(shù)據(jù)應(yīng)用展現(xiàn)出巨大的潛力。大數(shù)據(jù)是需要新處理模式才能適應(yīng)的海量、高增長率和多樣化的信息資產(chǎn),被譽(yù)為“未來的新石油”,以至于數(shù)據(jù)的獲取、存儲(chǔ)、搜索、共享、分析以及可視化呈現(xiàn)都成為當(dāng)前重要的研究課題。本書重點(diǎn)講述數(shù)據(jù)采集與預(yù)處理的相關(guān)內(nèi)容,并以真實(shí)案例介紹不同數(shù)據(jù)源的采集方式及基本的數(shù)據(jù)預(yù)處理方法。全書共lO章。其中,第1章為概述,第2~5章介紹靜態(tài)網(wǎng)頁數(shù)據(jù)爬取,第6章介紹動(dòng)態(tài)網(wǎng)頁數(shù)據(jù)爬取,第7、8章介紹爬蟲(Scrapy)框架應(yīng)用,第9章介紹數(shù)據(jù)預(yù)處理,第10章給出了一個(gè)綜合項(xiàng)目實(shí)訓(xùn)。本書可作為高校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)相關(guān)課程的教材或教學(xué)參考書,也可作為人工智能、大數(shù)據(jù)領(lǐng)域從業(yè)者的自學(xué)參考書。

作者簡介

暫缺《數(shù)據(jù)采集與預(yù)處理》作者簡介

圖書目錄

第1章 概述
1.1 大數(shù)據(jù)采集
1.1.1 大數(shù)據(jù)來源
1.1.2 大數(shù)據(jù)采集方式
1.1.3 數(shù)據(jù)預(yù)處理
1.2 網(wǎng)絡(luò)爬蟲原理和分類
1.2.1 爬蟲原理
1.2.2 爬蟲分類
1.2.3 常用爬蟲工具
1.3 網(wǎng)絡(luò)爬蟲法律規(guī)范
1.3.1 數(shù)據(jù)隱私保護(hù)
1.3.2 Robots協(xié)議
1.3.3 法律法規(guī)
本章小結(jié)
本章習(xí)題
第2章 Python基礎(chǔ)
2,1 Python環(huán)境搭建
2.1.1 Python解釋器
2.1.2 PyCharm的安裝
2.2 Python基礎(chǔ)
2.2.1 Python語法基礎(chǔ)
2.2.2 數(shù)據(jù)類型
2.2.3 程序結(jié)構(gòu)
2.2.4 函數(shù)
2.2.5 面向?qū)ο?br /> 本章小結(jié)
本章習(xí)題
第3章 靜態(tài)網(wǎng)頁爬取
3.1 HTTP協(xié)議概述
3.1.1 請(qǐng)求響應(yīng)模型
3.1.2 請(qǐng)求報(bào)文
3.1.3 響應(yīng)報(bào)文
3.2 使用Requests庫提取網(wǎng)頁數(shù)據(jù)
3.2.1 Requests庫的安裝
3.2.2 Requests庫的請(qǐng)求方法
3.2.3 使用Requests庫發(fā)送GET請(qǐng)求
3.2.4 使用Requests庫發(fā)送POST請(qǐng)求
3.2.5 Requests庫的響應(yīng)對(duì)象
3.2.6 HTTP狀態(tài)碼
3.2.7 定制請(qǐng)求頭
3.2.8 Requests庫發(fā)送GET請(qǐng)求的通用代碼
3.3 使用urllib庫提取網(wǎng)頁數(shù)據(jù)
3.3.1 使用urllib庫發(fā)送GET請(qǐng)求
3.3.2 使用urllib庫發(fā)送POST請(qǐng)求
3.3.3 urllib庫的用戶代理
3.4 案例1 QQ表情包圖片爬取
3.4.1 任務(wù)描述
3.4.2 任務(wù)分析
3.4.3 任務(wù)實(shí)現(xiàn)
3.5 案例 2手機(jī)號(hào)碼歸屬地查詢
3.5.1 任務(wù)描述
3.5.2 任務(wù)分析
3.5.3 任務(wù)實(shí)現(xiàn)
本章小結(jié)
本章習(xí)題
第4章 網(wǎng)頁解析
4.1 使用BeautifulSoup解析網(wǎng)頁
4.1.1 BeautifulSoup庫的安裝
4.1.2 BeautifulSoup解析器
……
第5章 數(shù)據(jù)存儲(chǔ)
第6章 動(dòng)態(tài)網(wǎng)頁爬取
第7章 Scrpay框架初探
第8章 Scrpay框架深入
第9章 數(shù)據(jù)預(yù)處理
第10章 招聘網(wǎng)站數(shù)據(jù)分析
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)