注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)庫設(shè)計(jì)/管理R數(shù)據(jù)分析秘笈

R數(shù)據(jù)分析秘笈

R數(shù)據(jù)分析秘笈

定 價(jià):¥59.00

作 者: 維西瓦·維斯瓦納坦
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)/網(wǎng)絡(luò) 數(shù)據(jù)倉(cāng)庫與數(shù)據(jù)挖掘 數(shù)據(jù)庫

ISBN: 9787111531739 出版時(shí)間: 2016-04-01 包裝: 平裝
開本: 16開 頁數(shù): 257 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書旨在為已有一定基礎(chǔ)的R用戶提供現(xiàn)成的方法來實(shí)現(xiàn)重要的數(shù)據(jù)分析任務(wù)。全書共分為11章。第1章涵蓋了進(jìn)行真正的數(shù)據(jù)分析任務(wù)之前的準(zhǔn)備工作。第2章討論了數(shù)據(jù)分析師在實(shí)施特定的分析手段之前常用的理解數(shù)據(jù)的做法。第3章涵蓋了運(yùn)用分類技術(shù)肚餓方法。第4章是關(guān)于回歸技術(shù)的方法。第5章介紹數(shù)據(jù)簡(jiǎn)化。第6章介紹時(shí)間序列分析。第7章討論了社交網(wǎng)絡(luò)分析。第8章介紹制作文檔和呈現(xiàn)分析的方法。第9章解決了面對(duì)大型數(shù)據(jù)如何書寫高效且簡(jiǎn)潔的R代碼的問題。第10章討論了R在處理空間數(shù)據(jù)上的強(qiáng)大功能。第11章介紹了R與其他系統(tǒng)的連接。

作者簡(jiǎn)介

  Abut the Authors 作 者 簡(jiǎn) 介Viswa Viswanathan是西頓霍爾大學(xué)斯蒂爾曼商學(xué)院計(jì)算和決策科學(xué)系的一名副教授。在獲得人工智能領(lǐng)域的博士學(xué)位之后,Viswa先從事了十多年學(xué)術(shù)工作,接下來的十幾年在軟件行業(yè)高就。在這段時(shí)間中,他曾就職于Infosys、Igate和Starbase公司。他于2011年重新回歸學(xué)術(shù)界。Viswa在非常廣泛的領(lǐng)域中開展教學(xué),包括運(yùn)籌學(xué)、計(jì)算機(jī)科學(xué)、軟件工程、管理信息系統(tǒng),以及企業(yè)系統(tǒng)。除了在大學(xué)中教學(xué)之外,Viswa還負(fù)責(zé)專業(yè)人士的培訓(xùn)項(xiàng)目。他有多篇同行評(píng)議的研究論文發(fā)表在《Operations Research》《IEEE Software》《Computers and Industrial Engineering》以及《International Journal of Artificial Intelligence in Education》等期刊上。他也編寫了《Data Analytics with R: A hands-on approach》一書。Viswa非常享受親自動(dòng)手開發(fā)軟件的過程,并且獨(dú)立構(gòu)思、搭建、開發(fā)、部署了幾個(gè)基于網(wǎng)絡(luò)的應(yīng)用程序。除了對(duì)數(shù)據(jù)分析、人工智能、計(jì)算機(jī)科學(xué)、軟件工程等技術(shù)領(lǐng)域有深厚的興趣之外,Viswa也對(duì)教育有濃厚的興趣,特別關(guān)注學(xué)習(xí)的根源和培養(yǎng)更深入學(xué)習(xí)的方法。他已經(jīng)在這個(gè)領(lǐng)域做了不少研究并希望在未來繼續(xù)研究這一學(xué)科。Viswa想對(duì)Amitava Bagchi 和 Anup Sen教授表示由衷的感激,他們?cè)赩iswa的早期研究生涯中鼓舞了他。同時(shí),他也很感激幾個(gè)非常聰明的同事,比如Rajesh Venkatesh、Dan Richner和Sriram Bala,他們極大地影響了他的思想。他的嬸嬸Analdavalli,他的姐妹Sankari,以及他的妻子Shanthi,在辛勤工作上教會(huì)了他很多,即便他只吸收了一點(diǎn)皮毛也覺得受益匪淺。他的兒子Nitin 和 Siddarth也在很多主題上給出了不計(jì)其數(shù)的深刻評(píng)論。Shanthi Viswanathan是一位經(jīng)驗(yàn)豐富的技術(shù)專家,她為許多企業(yè)客戶提供技術(shù)管理和企業(yè)結(jié)構(gòu)咨詢。她曾工作于Infosys、Oracle和Accenture公司。作為一名顧問,Shanthi為一些大型機(jī)構(gòu),比如Canon、Cisco、Celgene、Amway、Time Warner Cable 和 GE等,在數(shù)據(jù)架構(gòu)和分析,高級(jí)數(shù)據(jù)管理,面向服務(wù)的架構(gòu),商業(yè)流程管理,以及建模等方面提供幫助。當(dāng)她空閑時(shí),Shanthi會(huì)在紐約州和新澤西州的郊外徒步旅行,擺弄園藝,以及教授瑜伽。Shanthi想要感謝她的丈夫Viswa,在他們一起徒步旅行時(shí)關(guān)于各種主題展開的深入討論;以及將她帶入R和Java的世界。她也要感謝她的兒子Nitin 和 Siddarth使她進(jìn)入了數(shù)據(jù)分析領(lǐng)域。

圖書目錄

目  錄 Contents譯者序作者簡(jiǎn)介審校者簡(jiǎn)介前言第1章 獲取并準(zhǔn)備好材料—數(shù)據(jù) 11.1 引言 11.2 從csv文件中讀取數(shù)據(jù) 11.3 讀取XML數(shù)據(jù) 41.4 讀取JSON數(shù)據(jù) 61.5 從定寬格式文件中讀取數(shù)據(jù) 71.6 從R數(shù)據(jù)文件和R庫中讀取數(shù)據(jù) 81.7 刪除帶有缺失值的樣本 101.8 用均值填充缺失值 111.9 刪除重復(fù)樣本 131.10 將變量縮放至[0,1]區(qū)間 141.11 對(duì)數(shù)據(jù)框中的數(shù)據(jù)做正則化或標(biāo)準(zhǔn)化 151.12 為數(shù)值數(shù)據(jù)分箱 171.13 為分類變量創(chuàng)建啞變量 18第2章 那里面有什么——探索性數(shù)據(jù)分析 212.1 引言 212.2 創(chuàng)建標(biāo)準(zhǔn)化數(shù)據(jù)概覽 212.3 抽取數(shù)據(jù)集的子集 232.4 分割數(shù)據(jù)集 252.5 創(chuàng)建隨機(jī)數(shù)據(jù)分塊 262.6 創(chuàng)建直方圖、箱線圖、散點(diǎn)圖等標(biāo)準(zhǔn)化圖像 292.7 在網(wǎng)格窗口上創(chuàng)建多個(gè)圖像 372.8 選擇圖形設(shè)備 382.9 用lattice包繪圖 392.10 用ggplot2包繪圖 422.11 創(chuàng)建便于比較的圖表 472.12 創(chuàng)建有助于發(fā)現(xiàn)因果關(guān)系的圖表 512.13 創(chuàng)建多元圖像 53第3章 它屬于哪兒——分類技術(shù) 553.1 引言 553.2 創(chuàng)建誤差/分類–混淆矩陣 553.3 創(chuàng)建ROC圖 583.4 構(gòu)建、繪制和評(píng)估—分類樹 613.5 用隨機(jī)森林模型分類 663.6 用支持向量機(jī)分類 693.7 用樸素貝葉斯分類 723.8 用K最近鄰分類 743.9 用神經(jīng)網(wǎng)絡(luò)分類 773.10 用線性判別函數(shù)分類 793.11 用邏輯回歸分類 803.12 用AdaBoost來整合分類樹模型 83第4章 給我一個(gè)數(shù)——回歸分析 864.1 引言 864.2 計(jì)算均方根誤差 864.3 建立用于回歸的KNN模型 884.4 運(yùn)用線性回歸 944.5 在線性回歸中運(yùn)用變量選擇 994.6 建立回歸樹 1024.7 建立用于回歸的隨機(jī)森林模型 1084.8 用神經(jīng)網(wǎng)絡(luò)做回歸 1124.9 運(yùn)用K-折交叉驗(yàn)證 1144.10 運(yùn)用留一交叉驗(yàn)證來限制過度擬合 116第5章 你能化簡(jiǎn)它嗎——數(shù)據(jù)簡(jiǎn)化技術(shù) 1185.1 引言 1185.2 用K-均值聚類法實(shí)現(xiàn)聚類分析 1185.3 用系統(tǒng)聚類法實(shí)現(xiàn)聚類分析 1245.4 用主成分分析降低維度 127第6章 從歷史中學(xué)習(xí)——時(shí)間序列分析 1346.1 引言 1346.2 創(chuàng)建并檢查日期對(duì)象 1346.3 對(duì)日期對(duì)象進(jìn)行操作 1386.4 對(duì)時(shí)間序列數(shù)據(jù)做初步分析 1406.5 使用時(shí)間序列對(duì)象 1436.6 分解時(shí)間序列 1496.7 對(duì)時(shí)間序列數(shù)據(jù)做濾波 1516.8 用HoltWinters 方法實(shí)現(xiàn)平滑和預(yù)測(cè) 1526.9 創(chuàng)建自動(dòng)的ARIMA模型 155第7章 這都是你的關(guān)系——社交網(wǎng)絡(luò)分析 1577.1 引言 1577.2 通過公共API下載社交網(wǎng)絡(luò)數(shù)據(jù) 1577.3 創(chuàng)建鄰接矩陣和連邊列表 1617.4 繪制社交網(wǎng)絡(luò)數(shù)據(jù) 1647.5 計(jì)算重要的網(wǎng)絡(luò)度量指標(biāo) 176第8章 展現(xiàn)你最好的一面——制作文檔和呈現(xiàn)分析報(bào)告 1828.1 引言 1828.2 用R Markdown 和 knitR創(chuàng)建數(shù)據(jù)分析報(bào)告 1828.3 用shiny創(chuàng)建交互式Web應(yīng)用 1918.4 用R Presentation為分析報(bào)告創(chuàng)建PDF幻燈片 196第9章 事半功倍——高效且簡(jiǎn)潔的R代碼 2019.1 引言 2019.2 利用向量化操作 2019.3 用apply函數(shù)操作整行或整列 2039.4 用lapply和sapply將函數(shù)應(yīng)用于整組元素 2069.5 在向量的一個(gè)子集上應(yīng)用函數(shù) 2089.6 用plyr完成分割–應(yīng)用–組合策略 2109.7 用數(shù)據(jù)表對(duì)數(shù)據(jù)進(jìn)行切片、切塊和組合 213第10章 在哪兒——地理空間信息數(shù)據(jù)分析 21910.1 引言 21910.2 下載并繪制一個(gè)地區(qū)的谷歌地圖 21910.3 在已下載的谷歌地圖上疊加數(shù)據(jù) 22210.4 將ESRI形狀文件導(dǎo)入到R中 22410.5 使用sp包繪制地理數(shù)據(jù) 22610.6 從maps包中獲取地圖 22810.7 從包含空間及其他數(shù)據(jù)的普通數(shù)據(jù)框中創(chuàng)建空間數(shù)據(jù)框 22910.8 通過合并普通數(shù)據(jù)框和空間對(duì)象生成空間數(shù)據(jù)框 23010.9 為已有的空間數(shù)據(jù)框添加變量 234第11章 友好協(xié)作——連接到其他系統(tǒng) 23711.1 引言 23711.2 在R中使用Java對(duì)象 23711.3 從Java中用JRI調(diào)用R函數(shù) 24311.4 從Java中用Rserve調(diào)用R函數(shù) 24511.5 從Java中執(zhí)行R腳本 24811.6 使用xlsx包連接到Excel 24911.7 從關(guān)系型數(shù)據(jù)庫—MySQL中讀取數(shù)據(jù) 25211.8 從非關(guān)系型數(shù)據(jù)庫—MongoDB中讀取數(shù)據(jù) 256

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)