注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計Python數(shù)據(jù)分析實(shí)戰(zhàn):從Excel輕松入門Pandas

Python數(shù)據(jù)分析實(shí)戰(zhàn):從Excel輕松入門Pandas

Python數(shù)據(jù)分析實(shí)戰(zhàn):從Excel輕松入門Pandas

定 價:¥79.00

作 者: 曾賢志
出版社: 清華大學(xué)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787302602811 出版時間: 2022-05-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書從零開始系統(tǒng)講解了使用Pandas導(dǎo)入Excel數(shù)據(jù),然后使用Pandas技術(shù)對數(shù)據(jù)做整理和分析,后導(dǎo)出為不同形式的Excel文件。完整實(shí)現(xiàn)了數(shù)據(jù)的導(dǎo)入、處理、輸出的處理流程。 全書共10章。第1章為Pandas數(shù)據(jù)處理環(huán)境的搭建,第2章為使用Pandas對Excel數(shù)據(jù)讀取與保存,第3章介紹與Pandas底層數(shù)據(jù)相關(guān)的NumPy庫,第4章介紹了Pandas中DataFrame表格的增、刪、改、查等常用操作,第5章介紹了對Series與DataFrame兩種數(shù)據(jù)的運(yùn)算、分支、遍歷等處理,第6章介紹了字符串的各種清洗技術(shù),第7章介紹時間戳與時間差數(shù)據(jù)的處理,第8章介紹Pandas中分層索引及與索引相關(guān)的操作,第9章介紹了對數(shù)據(jù)的分組處理及做數(shù)據(jù)透視表處理,第10章介紹了表格的數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換,以及多表讀取與保存。書中包含相應(yīng)示例,不僅可以學(xué)會理論知識還可以靈活應(yīng)用。 本書可作為Excel愛好者和數(shù)據(jù)分析初學(xué)者的入門書籍,以及想提高數(shù)據(jù)分析效率,拓展數(shù)據(jù)分析手段相關(guān)人員的參考書籍。

作者簡介

  曾賢志,Office技術(shù)培訓(xùn)專家,我要自學(xué)網(wǎng)專家講師,特邀技術(shù)圖書作者,擅長使用VBA、SQL、Power BI、Python等技術(shù)做數(shù)據(jù)分析。著有《Power Query For Excel讓工作化繁為簡》《加薪不加班:174個Excel函數(shù)案例闖職場》《從Excel到Python:用Python輕松處理Excel數(shù)據(jù)》等與數(shù)據(jù)分析相關(guān)的技術(shù)圖書。

圖書目錄

第1章Pandas數(shù)據(jù)處理環(huán)境搭建
1.1Pandas環(huán)境配置
1.1.1安裝Python發(fā)行版本Anaconda
1.1.2程序編寫工具Jupyter Notebook
1.2Python基礎(chǔ)操作
1.2.1變量
1.2.2注釋
1.2.3代碼縮進(jìn)
1.2.4數(shù)據(jù)結(jié)構(gòu)
1.2.5控制語句
1.2.6函數(shù)
第2章Pandas中數(shù)據(jù)的存取
2.1讀取Excel文件數(shù)據(jù)
2.2讀取CSV文件數(shù)據(jù)
2.3保存為Excel文件格式
2.4保存為CSV文件格式
2.5Pandas中表格的結(jié)構(gòu)
2.5.1DataFrame數(shù)據(jù)結(jié)構(gòu)
2.5.2Series數(shù)據(jù)結(jié)構(gòu)
第3章NumPy數(shù)據(jù)處理基石
3.1NumPy的定義
3.2NumPy數(shù)組的創(chuàng)建與轉(zhuǎn)換
3.2.1普通數(shù)組
3.2.2序列數(shù)組
3.2.3隨機(jī)數(shù)組
3.2.4轉(zhuǎn)換數(shù)組
3.3NumPy數(shù)組的預(yù)處理
3.3.1類型轉(zhuǎn)換
3.3.2缺失值處理
3.3.3重復(fù)值處理
3.4NumPy數(shù)組維度轉(zhuǎn)換
3.4.1數(shù)組維度轉(zhuǎn)換
3.4.2數(shù)組合并
3.5Series數(shù)據(jù)的創(chuàng)建
3.6DataFrame表格的創(chuàng)建
3.6.1使用NumPy數(shù)組創(chuàng)建DataFrame表格
3.6.2使用Python列表創(chuàng)建DataFrame表格
3.6.3使用Python字典創(chuàng)建DataFrame表格
第4章表格管理技術(shù)
4.1表格屬性獲取與修改
4.1.1表格屬性的獲取
4.1.2表格屬性修改
4.2表格的切片選擇
4.2.1切片法
4.2.2篩選法
4.2.3loc切片法
4.2.4iloc切片法
4.3添加表格的行和列
4.3.1添加行
4.3.2添加列
4.4刪除表格的行和列
4.4.1刪除行
4.4.2刪除列
4.4.3刪除有缺失值的行和列
4.5表格數(shù)據(jù)的修改
4.6鞏固案例
第5章數(shù)據(jù)處理基礎(chǔ)
5.1數(shù)據(jù)運(yùn)算處理
5.1.1運(yùn)算符與運(yùn)算函數(shù)
5.1.2Series與單值的運(yùn)算
5.1.3DataFrame與單值運(yùn)算
5.1.4Series與Series運(yùn)算
5.1.5DataFrame與DataFrame運(yùn)算
5.1.6DataFrame與Series運(yùn)算
5.1.7數(shù)據(jù)運(yùn)算時的對齊特性
5.2數(shù)據(jù)分支判斷
5.2.1條件判斷處理1(mask()與where())
5.2.2條件判斷處理2(np.where())
5.3數(shù)據(jù)遍歷處理
5.3.1遍歷Series元素(map())
5.3.2遍歷DataFrame行和列(apply())
5.3.3遍歷DataFrame元素(applymap())
5.4數(shù)據(jù)統(tǒng)計處理
5.4.1聚合統(tǒng)計
5.4.2邏輯統(tǒng)計
5.4.3極值統(tǒng)計
5.4.4排名統(tǒng)計
5.5鞏固案例
5.5.1根據(jù)不同蔬菜的采購數(shù)量統(tǒng)計每天采購金額
5.5.2篩選出成績表中各科目均大于或等于100的記錄
5.5.3篩選出成績表中各科目的和大于或等于300的記錄
5.5.4統(tǒng)計每個人各科目總分之和的排名
5.5.5統(tǒng)計每個人所有考試科目的科目
第6章字符串清洗技術(shù)
6.1正則
6.1.1正則表達(dá)式的導(dǎo)入與創(chuàng)建
6.1.2正則表達(dá)式處理函數(shù)
6.1.3正則表達(dá)式編寫規(guī)則
6.2拆分
6.2.1普通拆分
6.2.2正則拆分
6.2.3拆分次數(shù)
6.2.4拆為表格
6.2.5實(shí)例應(yīng)用
6.3提取
6.3.1將數(shù)據(jù)提取到列方向
6.3.2將數(shù)據(jù)提取到行方向
6.3.3實(shí)例應(yīng)用
6.4查找
6.4.1查找位置
6.4.2查找判斷
6.4.3查找數(shù)據(jù)
6.4.4實(shí)例應(yīng)用
6.5替換
6.5.1Series數(shù)據(jù)替換
6.5.2DataFrame表格替換
6.5.3實(shí)例應(yīng)用
6.6長度
6.7重復(fù)
6.8修剪
6.9填充
6.9.1元素填充
6.9.2字符填充
6.10去重
6.10.1重復(fù)項判斷
6.10.2重復(fù)項刪除
6.11排序
6.11.1單列排序
6.11.2多列排序
6.11.3自定義排序
6.12合并
6.12.1Series數(shù)據(jù)自身元素合并
6.12.2Series數(shù)據(jù)與其他數(shù)據(jù)合并
6.13擴(kuò)展
6.14鞏固案例
6.14.1篩選出分?jǐn)?shù)中至少有3個大于或等于90分的記錄
6.14.2兩表查詢合并應(yīng)用
6.14.3給關(guān)鍵信息加掩碼
6.14.4提取文本型單價后與數(shù)量做求和統(tǒng)計
6.14.5提取不重復(fù)名單
6.14.6對文本中的多科目成績排序
第7章日期和時間處理技術(shù)
7.1時間戳
7.1.1單個時間戳
7.1.2時間戳序列
7.1.3時間戳轉(zhuǎn)換
7.1.4時間戳信息獲取
7.2時間差
7.2.1單個時間差
7.2.2時間差序列
7.2.3時間差信息獲取
7.2.4時間差偏移
7.3鞏固案例
7.3.1根據(jù)出生日期計算年齡
7.3.2將不規(guī)范日期整理為標(biāo)準(zhǔn)日期
7.3.3根據(jù)開始時間到結(jié)束時間的時長計算金額
7.3.4根據(jù)借書起始時間及租借天數(shù)計算歸還日期
第8章高級索引技術(shù)
8.1Pandas索引
8.1.1Series索引
8.1.2DataFrame索引
8.2分層索引的設(shè)置
8.2.1Series的分層索引設(shè)置
8.2.2DataFrame的分層索引設(shè)置
8.3分層索引設(shè)置的4種方法
8.4文件導(dǎo)入導(dǎo)出時分層索引設(shè)置
8.5行索引與列數(shù)據(jù)的相互轉(zhuǎn)換
8.5.1列數(shù)據(jù)設(shè)置為行索引
8.5.2行索引設(shè)置為列數(shù)據(jù)
8.6分層索引切片
8.6.1選擇單行
8.6.2選擇單列
8.6.3選擇單值
8.6.4選擇多行多列
8.6.5選擇指定級別數(shù)據(jù)
8.6.6篩選索引
8.7索引的修改
8.7.1索引重命名
8.7.2索引重置
8.7.3索引排序
8.7.4索引層級交換
8.7.5索引刪除
8.8鞏固案例
8.8.1篩選出下半年總銷量大于上半年的記錄
8.8.2對文本型數(shù)字月份排序
8.8.3根據(jù)分?jǐn)?shù)返回等級設(shè)置索引
第9章數(shù)據(jù)匯總技術(shù)
9.1分組處理
9.1.1分組
9.1.2聚合
9.1.3轉(zhuǎn)換
9.1.4過濾
9.1.5高級分組
9.2數(shù)據(jù)透視表
9.2.1指定索引方向分組聚合
9.2.2多列執(zhí)行單種聚合
9.2.3單列執(zhí)行多種聚合
9.2.4多列執(zhí)行多種聚合
9.2.5指定列做指定聚合
9.2.6行索引和列索引分組聚合
9.2.7跟列數(shù)據(jù)長度相同的數(shù)組做分組
9.2.8數(shù)據(jù)透視表缺失值處理
9.2.9數(shù)據(jù)透視表的行和列總計設(shè)置
9.3鞏固案例
9.3.1提取各分組的前兩名記錄
9.3.2按條件篩選各分組的記錄
9.3.3提取各分組下的值
9.3.4分組批量拆分表格到Excel文件
9.3.5將數(shù)據(jù)透視表拆分為Excel文件
第10章表格轉(zhuǎn)換技術(shù)
10.1表格方向轉(zhuǎn)換
10.1.1列索引數(shù)據(jù)轉(zhuǎn)換成行索引數(shù)據(jù)
10.1.2將行索引數(shù)據(jù)轉(zhuǎn)換成列索引數(shù)據(jù)
10.2表格縱橫拼接
10.2.1表格縱向拼接(初級)
10.2.2表格縱向拼接(進(jìn)階)
10.2.3表格橫向拼接(初級)
10.2.4表格橫向拼接(進(jìn)階)
10.3表格數(shù)據(jù)存取
10.3.1批量讀取
10.3.2批量保存
10.4鞏固案例
10.4.1多個工作表數(shù)據(jù)合并
10.4.2工資條制作
10.4.3特殊的縱向表格拼接
10.4.4多工作表合并與聚合處理
10.4.5跨表查詢后再聚合匯總
10.4.6將匯總結(jié)果分發(fā)到不同工作表
 

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號