機器學習與R語言

定　價：￥69.00

作　者：	（美）蘭茲著，李洪成，許金煒，李艦譯
出版社：	機械工業(yè)出版社
叢編項：
標　簽：	計算機/網(wǎng)絡人工智能

購買這本書可以去

ISBN：	9787111491576	出版時間：	2015-03-01	包裝：
開本：		頁數(shù)：		字數(shù)：

內容簡介

　　R本身是一款十分優(yōu)秀的數(shù)據(jù)分析和數(shù)據(jù)可視化軟件?！稒C器學習與R語言》通過將實踐案例與核心的理論知識相結合，提供了你開始將機器學習應用到你自己項目中所需要的知識?！稒C器學習與R語言》主要內容：機器學習的基本概念和理論，用于機器學習的R軟件環(huán)境；如何應用R來管理數(shù)據(jù)，進行數(shù)據(jù)的探索分析和數(shù)據(jù)可視化；典型的機器學習算法和案例，并給出了詳細的分析步驟；模型性能評價的原理和方法；提高模型性能的幾種常用方法；其他機器學習主題?！稒C器學習與R語言》適用于任何希望使用數(shù)據(jù)來采取行動的人。讀者只需要具有R的一些基本知識，不需要具備機器學習的深厚基礎。不管是R初學者，還是熟練的R用戶都能從書中找到對自己有用的內容。

作者簡介

暫缺《機器學習與R語言》作者簡介

圖書目錄

推薦序
譯者序
前言
致謝
關于技術評審人
第1章機器學習簡介
1.1機器學習的起源
1.2機器學習的使用與濫用
1.3機器如何學習
1.3.1抽象化和知識表達
1.3.2一般化
1.3.3評估學習的成功性
1.4將機器學習應用于數(shù)據(jù)中的步驟
1.5選擇機器學習算法
1.5.1考慮輸入的數(shù)據(jù)
1.5.2考慮機器學習算法的類型
1.5.3為數(shù)據(jù)匹配合適的算法
1.6使用R進行機器學習
1.7總結
第2章數(shù)據(jù)的管理和理解
2.1R數(shù)據(jù)結構
2.2向量
2.3因子
2.3.1列表
2.3.2數(shù)據(jù)框
2.3.3矩陣和數(shù)組
2.4用R管理數(shù)據(jù)
2.4.1保存和加載R數(shù)據(jù)結構
2.4.2用CSV文件導入和保存數(shù)據(jù)
2.4.3從SQL數(shù)據(jù)庫導入數(shù)據(jù)
2.5探索和理解數(shù)據(jù)
2.5.1探索數(shù)據(jù)的結構
2.5.2探索數(shù)值型變量
2.5.3探索分類變量
2.5.4探索變量之間的關系
2.6總結
第3章懶惰學習——使用近鄰分類
3.1理解使用近鄰進行分類
3.1.1kNN算法
3.1.2為什么kNN算法是懶惰的
3.2用kNN算法診斷乳腺癌
3.2.1第1步——收集數(shù)據(jù)
3.2.2第2步——探索和準備數(shù)據(jù)
3.2.3第3步——基于數(shù)據(jù)訓練模型
3.2.4第4步——評估模型的性能
3.2.5第5步——提高模型的性能
3.3總結
第4章概率學習——樸素貝葉斯分類
4.1理解樸素貝葉斯
4.1.1貝葉斯方法的基本概念
4.1.2樸素貝葉斯算法
4.2例子——基于貝葉斯算法的手機垃圾短信過濾
4.2.1第1步——收集數(shù)據(jù)
4.2.2第2步——探索和準備數(shù)據(jù)
4.2.3數(shù)據(jù)準備——處理和分析文本數(shù)據(jù)
4.2.4第3步——基于數(shù)據(jù)訓練模型
4.2.5第4步——評估模型的性能
4.2.6第5步——提升模型的性能
4.3總結
第5章分而治之——應用決策樹和規(guī)則進行分類
5.1理解決策樹
5.1.1分而治之
5.1.2C5.0決策樹算法
5.2例子——使用C5.0決策樹識別高風險銀行貸款
5.2.1第1步——收集數(shù)據(jù)
5.2.2第2步——探索和準備數(shù)據(jù)
5.2.3第3步——基于數(shù)據(jù)訓練模型
5.2.4第4步——評估模型的性能
5.2.5第5步——提高模型的性能
5.3理解分類規(guī)則
5.3.1獨立而治之
5.3.2單規(guī)則（1R）算法
5.3.3RIPPER算法
5.3.4來自決策樹的規(guī)則
5.4例子——應用規(guī)則學習識別有毒的蘑菇
5.4.1第1步——收集數(shù)據(jù)
5.4.2第2步——探索和準備數(shù)據(jù)
5.4.3第3步——基于數(shù)據(jù)訓練模型
5.4.4第4步——評估模型的性能
5.4.5第5步——提高模型的性能
5.5總結
第6章預測數(shù)值型數(shù)據(jù)——回歸方法
6.1理解回歸
6.1.1簡單線性回歸
6.1.2普通最小二乘估計
6.1.3相關系數(shù)
6.1.4多元線性回歸
6.2例子——應用線性回歸預測醫(yī)療費用
6.2.1第1步——收集數(shù)據(jù)
6.2.2第2步——探索和準備數(shù)據(jù)
6.2.3第3步——基于數(shù)據(jù)訓練模型
6.2.4第4步——評估模型的性能
6.2.5第5步——提高模型的性能
6.3理解回歸樹和模型樹
6.4例子——用回歸樹和模型樹估計葡萄酒的質量
6.4.1第1步——收集數(shù)據(jù)
6.4.2第2步——探索和準備數(shù)據(jù)
6.4.3第3步——基于數(shù)據(jù)訓練模型
6.4.4第4步——評估模型的性能
6.4.5第5步——提高模型的性能
6.5總結
第7章黑箱方法——神經(jīng)網(wǎng)絡和支持向量機
7.1理解神經(jīng)網(wǎng)絡
7.1.1從生物神經(jīng)元到人工神經(jīng)元
7.1.2激活函數(shù)
7.1.3網(wǎng)絡拓撲
7.1.4用后向傳播訓練神經(jīng)網(wǎng)絡
7.2用人工神經(jīng)網(wǎng)絡對混凝土的強度進行建模
7.2.1第1步——收集數(shù)據(jù)
7.2.2第2步——探索和準備數(shù)據(jù)
7.2.3第3步——基于數(shù)據(jù)訓練模型
7.2.4第4步——評估模型的性能
7.2.5第5步——提高模型的性能
7.3理解支持向量機
7.3.1用超平面分類
7.3.2尋找最大間隔
7.3.3對非線性空間使用核函數(shù)
7.4用支持向量機進行光學字符識別
7.4.1第1步——收集數(shù)據(jù)
7.4.2第2步——探索和準備數(shù)據(jù)
7.4.3第3步——基于數(shù)據(jù)訓練模型
7.4.4第4步——評估模型的性能
7.4.5第5步——提高模型的性能
7.5總結
第8章探尋模式——基于關聯(lián)規(guī)則的購物籃分析
8.1理解關聯(lián)規(guī)則
8.2例子——用關聯(lián)規(guī)則確定經(jīng)常一起購買的食品雜貨
8.2.1第1步——收集數(shù)據(jù)
8.2.2第2步——探索和準備數(shù)據(jù)
8.2.3第3步——基于數(shù)據(jù)訓練模型
8.2.4第4步——評估模型的性能
8.2.5第5步——提高模型的性能
8.3總結
第9章尋找數(shù)據(jù)的分組——k均值聚類
9.1理解聚類
9.1.1聚類——一種機器學習任務
9.1.2k均值聚類算法
9.1.3用k均值聚類探尋青少年市場細分
9.1.4第1步——收集數(shù)據(jù)
9.1.5第2步——探索和準備數(shù)據(jù)
9.1.6第3步——基于數(shù)據(jù)訓練模型
9.1.7第4步——評估模型的性能
9.1.8第5步——提高模型的性能
9.2總結
第10章模型性能的評價
10.1度量分類方法的性能
10.1.1在R中處理分類預測數(shù)據(jù)
10.1.2深入探討混淆矩陣
10.1.3使用混淆矩陣度量性能
10.1.4準確度之外的其他性能評價指標
10.1.5性能權衡的可視化
10.2評估未來的性能
10.2.1保持法
10.2.2交叉驗證
10.2.3自助法抽樣
10.3總結
第11章提高模型的性能
11.1調整多個模型來提高性能
11.2使用元學習來提高模型的性能
11.2.1理解集成學習
11.2.2bagging
11.2.3boosting
11.2.4隨機森林
11.3總結
第12章其他機器學習主題
12.1分析專用數(shù)據(jù)
12.1.1用RCurl添加包從網(wǎng)上獲取數(shù)據(jù)
12.1.2用XML添加包讀/寫XML格式數(shù)據(jù)
12.1.3用rjson添加包讀/寫JSON
12.1.4用xlsx添加包讀/寫MicrosoftExcel電子表格
12.1.5生物信息學數(shù)據(jù)
12.1.6社交網(wǎng)絡數(shù)據(jù)和圖數(shù)據(jù)
12.2提高R語言的性能
12.2.1處理非常大的數(shù)據(jù)集
12.2.2使用并行處理來加快學習過程
12.2.3GPU計算
12.2.4部署最優(yōu)的學習算法
12.3總結