注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)科學(xué)導(dǎo)論:探索數(shù)據(jù)的奧秘

數(shù)據(jù)科學(xué)導(dǎo)論:探索數(shù)據(jù)的奧秘

數(shù)據(jù)科學(xué)導(dǎo)論:探索數(shù)據(jù)的奧秘

定 價:¥45.00

作 者: 黃曉林,劉斌,劉欽,陳穎,葛云 著
出版社: 清華大學(xué)出版社
叢編項(xiàng): 面向新工科的電工電子信息基礎(chǔ)課程系列教材
標(biāo) 簽: 暫缺

ISBN: 9787302561699 出版時間: 2020-09-01 包裝: 平裝
開本: 16開 頁數(shù): 180 字?jǐn)?shù):  

內(nèi)容簡介

  本書通過完整、規(guī)范的數(shù)據(jù)科學(xué)項(xiàng)目的流程來組織全書體系結(jié)構(gòu),涵蓋數(shù)據(jù)科學(xué)項(xiàng)目的全過程,包括問題提出與目標(biāo)制定、凝練前提假設(shè)和設(shè)計數(shù)據(jù)方案、探索性數(shù)據(jù)分析、建模與分析、性能評價、結(jié)果詮釋與展示。佐以豐富的案例分析和模擬項(xiàng)目訓(xùn)練,啟發(fā)學(xué)生主動思考,培養(yǎng)學(xué)生在實(shí)踐中樹立嚴(yán)謹(jǐn)?shù)目茖W(xué)思維方式及數(shù)據(jù)科學(xué)流程。 本書除了可作為本科生數(shù)據(jù)科學(xué)基礎(chǔ)課、理工通識課教材外,還面向所有對數(shù)據(jù)科學(xué)有濃厚興趣的人群,以及各行各業(yè)中有大體量數(shù)據(jù)分析需求的人群。

作者簡介

  黃曉林,南京大學(xué)電子科學(xué)與工程學(xué)院副教授,長期從事信號處理與數(shù)據(jù)分析工作,發(fā)表SCI學(xué)術(shù)論文30多篇,主持縱向科研項(xiàng)目4項(xiàng),獲國家授權(quán)方面專利5項(xiàng),軟件著作權(quán)1項(xiàng)。目前主講南京大學(xué)電子科學(xué)與工程學(xué)院本科生課程《計算方法》、《數(shù)據(jù)科學(xué)導(dǎo)論》,曾經(jīng)講授《數(shù)據(jù)庫應(yīng)用》《生物醫(yī)學(xué)電子學(xué)》等課程。

圖書目錄

第1章緒論
1.1為什么要研究數(shù)據(jù)科學(xué)
1.2基本概念
1.2.1數(shù)據(jù)
1.2.2大數(shù)據(jù)
1.2.3數(shù)據(jù)科學(xué)
1.3數(shù)據(jù)科學(xué)項(xiàng)目涉及的人員及其任務(wù)
1.4數(shù)據(jù)科學(xué)項(xiàng)目流程
1.4.1確定問題
1.4.2制定目標(biāo)
1.4.3搜集數(shù)據(jù)
1.4.4探索性數(shù)據(jù)分析
1.4.5建立模型
1.4.6性能評價
1.4.7結(jié)果展示
1.4.8部署模型
1.5數(shù)據(jù)科學(xué)項(xiàng)目中的數(shù)據(jù)流
1.6本書內(nèi)容、采用工具和目標(biāo)人群
思考題
第2章問題與目標(biāo)
2.1用戶層面的問題與目標(biāo)
2.2數(shù)據(jù)科學(xué)層面的問題與目標(biāo)
思考題
第3章數(shù)據(jù)獲取
3.1前提假設(shè)與數(shù)據(jù)方案設(shè)計
3.1.1前提假設(shè)
3.1.2數(shù)據(jù)方案設(shè)計
3.1.3數(shù)據(jù)獲取的可行性分析
3.1.4確定數(shù)據(jù)構(gòu)成
3.2總體和抽樣
3.2.1總體和個體
3.2.2樣本
3.2.3無偏抽樣
3.2.4抽樣偏差
3.3混雜因素和A/B Testing
3.3.1混雜因素和辛普森悖論
3.3.2雙盲實(shí)驗(yàn)和A/B Testing
思考題
第4章Python基礎(chǔ)
4.1Python的下載與安裝
4.2常用工具包的下載與安裝
4.3Jupyter Notebook
4.4Python的常用數(shù)據(jù)結(jié)構(gòu)
4.4.1列表
4.4.2元組
4.4.3字典
4.4.4集合
4.4.5numpy.ndarray
4.4.6Pandas.DataFrame
4.5Python基本語法
4.5.1基本命令
4.5.2控制流和相關(guān)語法
4.6Python數(shù)據(jù)導(dǎo)入
4.6.1本地數(shù)據(jù)導(dǎo)入
4.6.2在線數(shù)據(jù)導(dǎo)入
4.6.3數(shù)據(jù)的連續(xù)流加載
第5章探索性數(shù)據(jù)分析
5.1數(shù)據(jù)檢查
5.1.1數(shù)據(jù)的意義及規(guī)模
5.1.2特征的數(shù)據(jù)類型及意義
5.1.3初步排除數(shù)據(jù)泄露
5.2數(shù)據(jù)預(yù)處理
5.2.1缺失處理
5.2.2異常處理
5.2.3冗余處理
5.3描述性統(tǒng)計
5.3.1位置性測度
5.3.2離散性測度
5.3.3圖形化描述統(tǒng)計
思考題
第6章建模與性能評價
6.1統(tǒng)計建模
6.1.1常見的概率密度函數(shù)
6.1.2參數(shù)估計
6.1.3假設(shè)檢驗(yàn)
6.1.4phacking
6.2回歸模型
6.2.1線性回歸模型
6.2.2線性回歸模型性能評價
6.2.3線性回歸與線性相關(guān)
6.2.4邏輯回歸
6.2.5訓(xùn)練集測試集劃分
6.2.6應(yīng)用非數(shù)值特征作為輸入時的onehot編碼
6.3樸素貝葉斯模型
6.3.1貝葉斯定理
6.3.2高斯模型
6.3.3多項(xiàng)式模型
6.3.4伯努利模型
6.4分類模型的性能評價
6.4.1混淆矩陣
6.4.2指標(biāo)權(quán)衡
6.4.3應(yīng)用舉例
6.4.4參數(shù)區(qū)分性能評價
6.5決策樹
6.5.1決策樹工作原理
6.5.2分類任務(wù)決策樹的建模過程
6.5.3分類決策樹應(yīng)用舉例
6.6有監(jiān)督學(xué)習(xí)模型與無監(jiān)督學(xué)習(xí)模型
6.7Kmeans模型
6.7.1兩個基本概念
6.7.2Kmeans迭代算法
6.8偏差方差權(quán)衡
6.8.1偏差方差困境
6.8.2過擬合與欠擬合
6.8.3K折交叉驗(yàn)證
6.9參數(shù)的網(wǎng)格搜索
6.10集成學(xué)習(xí)
6.10.1孔多塞陪審團(tuán)定理
6.10.2決策樹集成
思考題
第7章結(jié)果展示
7.1區(qū)分面向?qū)ο蟮慕Y(jié)果展示
7.1.1面向出資方的結(jié)果展示
7.1.2面向用戶的結(jié)果展示
7.1.3面向數(shù)據(jù)科學(xué)家的結(jié)果展示
7.2展示過程中的可視化
7.2.1展示可視化的兩個層面
7.2.2展示可視化的三點(diǎn)基本原則
結(jié)語
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號