注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)分析:統(tǒng)計(jì)、描述、預(yù)測(cè)與應(yīng)用

數(shù)據(jù)分析:統(tǒng)計(jì)、描述、預(yù)測(cè)與應(yīng)用

數(shù)據(jù)分析:統(tǒng)計(jì)、描述、預(yù)測(cè)與應(yīng)用

定 價(jià):¥79.00

作 者: [葡] 喬·門德斯·莫雷拉,[巴西] 安德烈·卡 著
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書(shū)可以去


ISBN: 9787302568476 出版時(shí)間: 2021-06-01 包裝:
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 252 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)介紹數(shù)據(jù)分析的統(tǒng)計(jì)基礎(chǔ)、種類劃分,并列舉大量實(shí)例以說(shuō)明數(shù)據(jù)分析方法和算法。內(nèi)容主要分為4部分,第1部分為第1章,介紹一些概念,簡(jiǎn)單描述數(shù)據(jù)分析方法和一些實(shí)例; 第2部分包括第2~7 章,介紹描述性分析和數(shù)據(jù)預(yù)處理的主要方法,包括描述統(tǒng)計(jì)、多元描述分析、聚類以及頻繁模式挖掘等;第3部分包括第8~12章,介紹預(yù)測(cè)性分析的主要方法,其中包括多種回歸算法、二元回歸、分類的性能測(cè)量以及基于概率和距離測(cè)量的方法,以及決策樹(shù)、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等較為先進(jìn)的方法; 第4部分為第13章,利用描述和預(yù)測(cè)這兩種方法,簡(jiǎn)單討論文本、網(wǎng)頁(yè)以及社交媒體的應(yīng)用。

作者簡(jiǎn)介

  [葡]喬·門德斯·莫雷拉(João Mendes Moreira) 博士,葡萄牙波爾圖大學(xué)(University of Porto)工程系教授,葡萄牙波爾圖人工智能與決策支持實(shí)驗(yàn)室(LIAAD-INESC TEC, Porto)研究員。 [巴]安德烈·卡瓦略(André de Carvalho) 博士,巴西圣保羅大學(xué)(São Paulo)數(shù)學(xué)和計(jì)算機(jī)科學(xué)研究所教授。 [匈]托馬斯·霍瓦斯(Tomá?? Horváth) 博士,匈牙利布達(dá)佩斯羅蘭大學(xué)(Eötvös Loránd University )助理教授,與斯洛伐克科希策帕沃爾·約瑟夫·沙法利克大學(xué)(Pavol Jozef ??afárik University)長(zhǎng)期進(jìn)行科研合作。

圖書(shū)目錄

第1部分背 景 介 紹
第1章我們可以用數(shù)據(jù)做什么
1.1大數(shù)據(jù)和數(shù)據(jù)科學(xué)
1.2大數(shù)據(jù)架構(gòu)
1.3小數(shù)據(jù)
1.4什么是數(shù)據(jù)
1.5數(shù)據(jù)分析簡(jiǎn)單分類
1.6數(shù)據(jù)使用實(shí)例
1.6.1美國(guó)威斯康星州的乳腺癌數(shù)據(jù)
1.6.2波蘭企業(yè)破產(chǎn)數(shù)據(jù)
1.7一個(gè)數(shù)據(jù)分析項(xiàng)目
1.7.1數(shù)據(jù)分析方法論簡(jiǎn)史
1.7.2KDD過(guò)程
1.7.3CRISPDM方法
1.8本書(shū)的組織結(jié)構(gòu)
1.9本書(shū)面向的對(duì)象
第2部分理 解 數(shù) 據(jù)
第2章描述統(tǒng)計(jì)學(xué)
2.1尺度類型
2.2描述單元分析
2.2.1單元頻數(shù)
2.2.2單元數(shù)據(jù)可視化
2.2.3單元統(tǒng)計(jì)
2.2.4常見(jiàn)的單元概率分布
2.3描述性雙元分析
2.3.1兩個(gè)定量屬性
2.3.2兩個(gè)定性屬性,其中至少有一個(gè)是名義屬性
2.3.3兩個(gè)序數(shù)屬性
2.4本章小結(jié)
2.5練習(xí)
第3章描述性多元分析
3.1多元頻數(shù)
3.2多元數(shù)據(jù)可視化
3.3多元統(tǒng)計(jì)
3.3.1位置多元統(tǒng)計(jì)
3.3.2離散多元統(tǒng)計(jì)
3.4信息圖和詞云
3.4.1信息圖
3.4.2詞云
3.5本章小結(jié)
3.6練習(xí)
第4章數(shù)據(jù)質(zhì)量和預(yù)處理
4.1數(shù)據(jù)質(zhì)量
4.1.1缺失值
4.1.2冗余數(shù)據(jù)
4.1.3不一致數(shù)據(jù)
4.1.4噪聲數(shù)據(jù)
4.1.5離群值
4.2轉(zhuǎn)換為不同的尺度類型
4.2.1名義尺度轉(zhuǎn)換為相對(duì)尺度
4.2.2序數(shù)尺度轉(zhuǎn)換為相對(duì)或絕對(duì)尺度
4.2.3相對(duì)或絕對(duì)尺度轉(zhuǎn)換為序數(shù)或名義尺度
4.3轉(zhuǎn)換為不同尺度
4.4數(shù)據(jù)轉(zhuǎn)換
4.5維度降低
4.5.1屬性聚合
4.5.2屬性選擇
4.6本章小結(jié)
4.7練習(xí)
第5章聚類
5.1距離度量
5.1.1常見(jiàn)屬性類型值之間的差異
5.1.2定量屬性對(duì)象的距離度量
5.1.3非常規(guī)屬性的距離度量
5.2聚類驗(yàn)證
5.3聚類技術(shù)
5.3.1K均值
5.3.2DBSCAN
5.3.3聚合層次聚類技術(shù)
5.4本章小結(jié)
5.5練習(xí)
第6章頻繁模式挖掘
6.1頻繁項(xiàng)集
6.1.1設(shè)置最小支持度閾值
6.1.2Apriori——基于連接的方法
6.1.3Eclat算法
6.1.4FPGrowth
6.1.5最大頻繁項(xiàng)集和閉合頻繁項(xiàng)集
6.2關(guān)聯(lián)規(guī)則
6.3支持度與置信度的意義
6.3.1交叉支持度模式
6.3.2提升度
6.3.3辛普森悖論
6.4其他模式
6.4.1序列模式
6.4.2頻繁序列挖掘
6.4.3閉合和最大序列
6.5本章小結(jié)
6.6練習(xí)
第7章描述性分析的備忘單和項(xiàng)目
7.1描述性分析備忘單
7.1.1數(shù)據(jù)總結(jié)
7.1.2聚類方法
7.1.3頻繁模式挖掘
7.2描述性分析項(xiàng)目
7.2.1理解業(yè)務(wù)
7.2.2理解數(shù)據(jù)
7.2.3準(zhǔn)備數(shù)據(jù)
7.2.4建模
7.2.5評(píng)價(jià)
7.2.6部署
第3部分預(yù) 測(cè) 未 知
第8章回歸
8.1預(yù)測(cè)性能評(píng)估
8.1.1泛化
8.1.2模型驗(yàn)證
8.1.3回歸的預(yù)測(cè)性能度量
8.2尋找模型參數(shù)
8.2.1線性回歸
8.2.2偏差方差權(quán)衡
8.2.3收縮方法
8.2.4使用屬性的線性組合方法
8.3技術(shù)選型
8.4本章小結(jié)
8.5練習(xí)
第9章分類
9.1二元分類
9.2分類的預(yù)測(cè)性能度量
9.3基于距離的學(xué)習(xí)算法
9.3.1k近鄰算法
9.3.2基于案例的推理
9.4概率分類算法
9.4.1邏輯回歸算法
9.4.2樸素貝葉斯(NB)算法
9.5本章小結(jié)
9.6練習(xí)
第10章其他預(yù)測(cè)方法
10.1基于搜索的算法
10.1.1決策樹(shù)歸納算法
10.1.2回歸決策樹(shù)
10.2基于優(yōu)化的算法
10.2.1人工神經(jīng)網(wǎng)絡(luò)
10.2.2支持向量機(jī)
10.3本章小結(jié)
10.4練習(xí)
第11章高級(jí)預(yù)測(cè)話題
11.1集成學(xué)習(xí)
11.1.1Bagging
11.1.2隨機(jī)森林
11.1.3AdaBoost
11.2算法的偏差
11.3非二元分類任務(wù)
11.3.1單類分類
11.3.2多類分類
11.3.3排序分類
11.3.4多標(biāo)簽分類
11.3.5層次分類
11.4高級(jí)預(yù)測(cè)數(shù)據(jù)準(zhǔn)備技術(shù)
11.4.1數(shù)據(jù)分類不均衡
11.4.2不完全目標(biāo)標(biāo)記
11.5具有監(jiān)督可解釋技術(shù)的描述和預(yù)測(cè)
11.6練習(xí)
第12章預(yù)測(cè)性分析的備忘單和項(xiàng)目
12.1預(yù)測(cè)性分析備忘單
12.2預(yù)測(cè)性分析項(xiàng)目
12.2.1業(yè)務(wù)理解
12.2.2數(shù)據(jù)理解
12.2.3數(shù)據(jù)準(zhǔn)備
12.2.4建模
12.2.5評(píng)估
12.2.6部署
第4部分常見(jiàn)的數(shù)據(jù)分析應(yīng)用
第13章文本、網(wǎng)絡(luò)和社交媒體應(yīng)用
13.1文本挖掘
13.1.1數(shù)據(jù)采集
13.1.2特征提取
13.1.3剩下的階段
13.1.4趨勢(shì)
13.2推薦系統(tǒng)
13.2.1反饋
13.2.2推薦任務(wù)
13.2.3推薦技術(shù)
13.2.4小結(jié)
13.3社交網(wǎng)絡(luò)分析
13.3.1社交網(wǎng)絡(luò)的表示
13.3.2節(jié)點(diǎn)的基本屬性
13.3.3網(wǎng)絡(luò)的基本和結(jié)構(gòu)屬性
13.3.4趨勢(shì)和小結(jié)
13.4練習(xí)
附錄A對(duì)CRISPDM方法的全面描述
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)