注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python大數(shù)據(jù)處理庫PySpark實(shí)戰(zhàn)

Python大數(shù)據(jù)處理庫PySpark實(shí)戰(zhàn)

Python大數(shù)據(jù)處理庫PySpark實(shí)戰(zhàn)

定 價(jià):¥79.00

作 者: 汪明 著
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購買這本書可以去


ISBN: 9787302575085 出版時(shí)間: 2021-02-01 包裝: 平裝
開本: 16開 頁數(shù): 310 字?jǐn)?shù):  

內(nèi)容簡介

  我國提出新基建概念,要加快大數(shù)據(jù)中心、人工智能等新型基礎(chǔ)設(shè)施的建設(shè)進(jìn)度,這無疑需要更多的大數(shù)據(jù)人才。PySpark可以對大數(shù)據(jù)進(jìn)行分布式處理,降低大數(shù)據(jù)學(xué)習(xí)門檻,本書正是一本PySpark入門教材,適合有一定Python基礎(chǔ)的讀者學(xué)習(xí)使用。 本書分為7章,第1章介紹大數(shù)據(jù)的基本概念、常用的大數(shù)據(jù)分析工具;第2章介紹Spark作為大數(shù)據(jù)處理的特點(diǎn)和算法;第3章介紹Spark實(shí)戰(zhàn)環(huán)境的搭建,涉及Windows和Linux操作系統(tǒng);第4章介紹如何靈活應(yīng)用PySpark對數(shù)據(jù)進(jìn)行操作;第5章介紹PySpark ETL處理,涉及PySpark讀取數(shù)據(jù)、對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析等數(shù)據(jù)處理相關(guān)內(nèi)容;第6章介紹PySpark如何利用MLlib庫進(jìn)行分布式機(jī)器學(xué)習(xí)(Titanic幸存者預(yù)測);第7章介紹一個PySpark和Kafka結(jié)合的實(shí)時(shí)項(xiàng)目。 本書內(nèi)容全面、示例豐富,可作為廣大PySpark入門讀者必備的參考書,同時(shí)能作為大中專院校師生的教學(xué)參考書,也可作為高等院校計(jì)算機(jī)及相關(guān)專業(yè)的大數(shù)據(jù)技術(shù)教材使用。

作者簡介

  汪明,碩士,畢業(yè)于中國礦業(yè)大學(xué),徐州軟件協(xié)會副理事長,某創(chuàng)業(yè)公司合伙人。從事軟件行業(yè)十余年,發(fā)表論文數(shù)十篇。著有圖書《TypeScript實(shí)戰(zhàn)》《Go并發(fā)編程實(shí)戰(zhàn)》。

圖書目錄

暫缺《Python大數(shù)據(jù)處理庫PySpark實(shí)戰(zhàn)》目錄

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號