注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)行業(yè)軟件及應(yīng)用R語(yǔ)言實(shí)戰(zhàn):編程基礎(chǔ)、統(tǒng)計(jì)分析與數(shù)據(jù)挖掘?qū)毜?/a>

R語(yǔ)言實(shí)戰(zhàn):編程基礎(chǔ)、統(tǒng)計(jì)分析與數(shù)據(jù)挖掘?qū)毜?/h1>

定 價(jià):¥75.00

作 者: 李倩星
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 程序設(shè)計(jì) 計(jì)算機(jī)/網(wǎng)絡(luò)

ISBN: 9787121281150 出版時(shí)間: 2016-03-01 包裝: 平塑勒
開本: 頁(yè)數(shù): 424 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書是一本優(yōu)秀的R語(yǔ)言入門讀物,旨在幫助讀者迅速構(gòu)建起與數(shù)據(jù)分析相關(guān)的知識(shí)體系,并學(xué)習(xí)如何使用R軟件實(shí)現(xiàn)數(shù)據(jù)分析方法。無(wú)論有無(wú)編程基礎(chǔ)或數(shù)學(xué)基礎(chǔ),本書都能幫助讀者成長(zhǎng)為一名合格的數(shù)據(jù)分析師。本書全面介紹了來(lái)自統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)、人工智能等領(lǐng)域的多種數(shù)據(jù)分析算法,在講解與之相關(guān)的R代碼時(shí),還討論了這些算法的原理、優(yōu)缺點(diǎn)與適用背景。本書按照由易到難的原則組織章節(jié)主題,讀者將獲得*好的閱讀體驗(yàn)。通過(guò)閱讀本書,讀者將對(duì)R語(yǔ)言在數(shù)據(jù)分析領(lǐng)域的應(yīng)用有一個(gè)全面的認(rèn)識(shí)。這種認(rèn)識(shí)不被特定行業(yè)所局限,任何行業(yè)的讀者都能利用本書介紹的數(shù)據(jù)分析方法解決本行業(yè)的數(shù)據(jù)分析問(wèn)題。

作者簡(jiǎn)介

  李倩星:畢業(yè)于西南大學(xué)統(tǒng)計(jì)學(xué)專業(yè),對(duì)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)以及人工智能領(lǐng)域有深刻的研究。主持翻譯了《傳播學(xué)中的大數(shù)據(jù):發(fā)展與不足》、《大數(shù)據(jù)、一個(gè)新興領(lǐng)域的誤區(qū)和方法與概念》、《數(shù)據(jù)挖掘揭示了差評(píng)導(dǎo)致的負(fù)反饋怪圈》等數(shù)十篇前沿科技文章,并發(fā)表于PPV課社區(qū)。

圖書目錄

目.錄第 1章R的基本介紹 …………………………………………………………1 1.1 強(qiáng)大的 R ………………………………………………………………………… 1 1.2 R的安裝與啟動(dòng) ………………………………………………………………… 2 1.2.1 安裝并啟動(dòng) R …………………………………………………………… 3 1.2.2 安裝并啟動(dòng)一個(gè) IDE …………………………………………………… 5 1.3 R的向量、矩陣和數(shù)組 ………………………………………………………… 6 1.3.1 向量的操作方法和固有屬性 …………………………………………… 6 1.3.2 矩陣的操作和運(yùn)算 ……………………………………………………… 9 1.3.3 數(shù)組中的維度函數(shù) ……………………………………………………… 12 1.4 R的列表和數(shù)據(jù)框 ……………………………………………………………… 14 1.4.1 列表的特性和編輯方法 ………………………………………………… 14 1.4.2 數(shù)據(jù)框的創(chuàng)建和基本操作 ……………………………………………… 18 1.5 R數(shù)據(jù)文件的載入和載出 ……………………………………………………… 20 1.5.1 結(jié)構(gòu)化純文本文件的讀取和輸出 ……………………………………… 21 1.5.2 其他文件的讀取和輸出 ………………………………………………… 23 1.6 向 R中安裝包 …………………………………………………………………… 25第 2章原始數(shù)據(jù)的探索與預(yù)處理 ………………………………………… 29 2.1 度量數(shù)據(jù)集的集中程度 ………………………………………………………… 29 2.2 度量數(shù)據(jù)集的分散程度 ………………………………………………………… 31 2.2.1 極值、方差和標(biāo)準(zhǔn)差 …………………………………………………… 31 2.2.2 標(biāo)準(zhǔn)誤和偏度系數(shù)、峰度系數(shù) ………………………………………… 33 2.3 創(chuàng)建一個(gè)數(shù)值摘要表 …………………………………………………………… 35 2.4 異常值的觀測(cè)與說(shuō)明 …………………………………………………………… 37 2.4.1 利用箱線圖觀測(cè)異常值并處理 ………………………………………… 38 2.4.2 異常值檢測(cè)的其他情況和說(shuō)明 ………………………………………… 40 2.5 缺失值的填補(bǔ)與處理 …………………………………………………………… 42 2.5.1 刪除缺失值或?qū)ζ溥M(jìn)行簡(jiǎn)單填補(bǔ) ……………………………………… 42 2.5.2 按照相關(guān)性對(duì)空缺值進(jìn)行填補(bǔ) ………………………………………… 45第 3章R的數(shù)據(jù)可視化 …………………………………………………… 47 3.1 plot()函數(shù)和常用的圖形參數(shù) ………………………………………………… 47 3.1.1 設(shè)置 plot()函數(shù)中的參數(shù) ……………………………………………… 47 3.1.2 修改散點(diǎn)圖的坐標(biāo)并加入標(biāo)注 ………………………………………… 51 3.2 經(jīng)典的基礎(chǔ)圖形及用途 ………………………………………………………… 54 3.2.1 線圖 ……………………………………………………………………… 54 3.2.2 直方圖 …………………………………………………………………… 59 3.2.3 箱線圖和莖葉圖 ………………………………………………………… 63 3.3 將圖形組合起來(lái) ………………………………………………………………… 66 3.4 更多的高水平作圖函數(shù) ………………………………………………………… 69 3.5 更多的常用作圖命令 …………………………………………………………… 72 第 4章R中參數(shù)的估計(jì)和檢驗(yàn) …………………………………………… 75 4.1 使用 R進(jìn)行點(diǎn)估計(jì)和區(qū)間估計(jì) ………………………………………………… 75 4.1.1 簡(jiǎn)單的點(diǎn)估計(jì)和區(qū)間估計(jì) ……………………………………………… 75 4.1.2 估計(jì)單側(cè)置信區(qū)間 ……………………………………………………… 79 4.2 與正態(tài)總體有關(guān)的參數(shù)檢驗(yàn) …………………………………………………… 83 4.3 列聯(lián)表與獨(dú)立性檢驗(yàn) …………………………………………………………… 87 4.4 幾種檢驗(yàn)數(shù)據(jù)分布的函數(shù) ……………………………………………………… 89 4.5 對(duì)非正態(tài)總體的區(qū)間估計(jì)和檢驗(yàn) ……………………………………………… 92 4.5.1 非正態(tài)總體的區(qū)間估計(jì) ………………………………………………… 92 4.5.2 非參數(shù)檢驗(yàn)中的符號(hào)檢驗(yàn) ……………………………………………… 94 4.5.3 非參數(shù)檢驗(yàn)中的秩檢驗(yàn) ………………………………………………… 96第 5章R中的方差分析 …………………………………………………… 99 5.1 方差分析模型的建立 …………………………………………………………… 99 5.2 單因素方差分析 ……………………………………………………………… 100 5.2.1 單因素方差分析的數(shù)學(xué)思想與模型 ………………………………… 101 5.2.2 檢驗(yàn)樣本是否滿足方差分析的假設(shè)條件 …………………………… 102 5.2.3 構(gòu)建單因素方差分析模型 …………………………………………… 105 5.3 多因素方差分析 ……………………………………………………………… 108 5.3.1 多因素方差分析的數(shù)學(xué)思想與模型 ………………………………… 108 5.3.2 不考慮交互作用的雙因素方差分析 ………………………………… 110 5.3.3 考慮交互作用的雙因素方差分析 …………………………………… 112 5.4 秩檢驗(yàn)和協(xié)方差分析 ………………………………………………………… 114 5.4.1 對(duì)控制變量應(yīng)用秩檢驗(yàn)方法 ………………………………………… 114 5.4.2 協(xié)方差分析的假設(shè)與應(yīng)用 …………………………………………… 116第 6章R中的相關(guān)分析和回歸分析 ………………………………………118 6.1 多種相關(guān)系數(shù)的度量和分析 ………………………………………………… 118 6.1.1 簡(jiǎn)單相關(guān)系數(shù)的計(jì)算和檢驗(yàn) ………………………………………… 118 6.1.2 散布矩陣圖和偏相關(guān)系數(shù) …………………………………………… 121 6.1.3 典型相關(guān)分析 ………………………………………………………… 123 6.2 線性回歸分析及其常規(guī)參數(shù) ………………………………………………… 125 6.2.1 對(duì)數(shù)據(jù)進(jìn)行預(yù)處理 …………………………………………………… 126 6.2.2 構(gòu)建第一個(gè)回歸模型 ………………………………………………… 127 6.2.3 修正方程并檢驗(yàn)殘差 ………………………………………………… 129 6.3 使用逐步回歸篩選自變量 …………………………………………………… 132 6.3.1 逐步回歸的思想與分類 ……………………………………………… 132 6.3.2 構(gòu)建逐步回歸模型 …………………………………………………… 133 6.4 啞變量和邏輯回歸 …………………………………………………………… 135 6.4.1 啞變量和邏輯回歸的思想 …………………………………………… 135 6.4.2 向線性回歸模型中納入啞變量 ……………………………………… 137第 7章更高級(jí)的數(shù)據(jù)可視化 ………………………………………………140 7.1 基礎(chǔ)圖形的拓展與延伸 ……………………………………………………… 140 7.1.1 繪制分類散點(diǎn)圖并添加圖標(biāo) ………………………………………… 140 7.1.2 繪制含多種類別的密度分布圖 ……………………………………… 143 7.1.3 復(fù)合條形圖和堆棧條形圖 …………………………………………… 146 7.2 有關(guān)多元分布函數(shù)的特殊圖形 ……………………………………………… 149 7.2.1 星圖和臉譜圖 ………………………………………………………… 150 7.2.2 輪廓圖 ………………………………………………………………… 153 7.2.3 調(diào)和曲線圖 …………………………………………………………… 155 7.3 建立最簡(jiǎn)單的 3D圖形 ……………………………………………………… 157 7.4 如何讓圖形更美觀 …………………………………………………………… 160 7.5 更多的繪圖包和系統(tǒng) ………………………………………………………… 162第 8章R中的聚類分析和判別分析 ………………………………………164 8.1 幾種聚類分析的異同 ………………………………………………………… 164 8.2 使用 R實(shí)現(xiàn) KNN聚類 ……………………………………………………… 165 8.2.1 KNN算法的思想和模型 …………………………………………… 165 8.2.2 使用 R實(shí)現(xiàn) KNN聚類 ……………………………………………… 167 8.3 使用 R實(shí)現(xiàn)系統(tǒng)聚類 ………………………………………………………… 170 8.3.1 系統(tǒng)聚類的思想和模型 ……………………………………………… 170 8.3.2 使用 R實(shí)現(xiàn)系統(tǒng)聚類 ……………………………………………… 171 8.4 使用 R實(shí)現(xiàn)快速聚類 ………………………………………………………… 174 8.4.1 快速聚類的思想和模型 ……………………………………………… 174 8.4.2 使用 R實(shí)現(xiàn)快速聚類 ……………………………………………… 176 8.5 幾種判別分析模型綜述 ……………………………………………………… 178 8.5.1 距離判別模型 ………………………………………………………… 179 8.5.2 Fisher判別模型 ……………………………………………………… 182第 9章R中的主成分分析和因子分析 ……………………………………186 9.1 主成分分析的實(shí)現(xiàn)與應(yīng)用 …………………………………………………… 186 9.1.1 主成分分析的模型假設(shè)和數(shù)據(jù)處理 ………………………………… 186 9.1.2 構(gòu)造一個(gè)主成分分析模型 …………………………………………… 189 9.1.3 計(jì)算主成分的綜合得分 ……………………………………………… 191

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)