注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)工業(yè)技術(shù)自動化技術(shù)、計(jì)算技術(shù)基于R語言的數(shù)據(jù)清洗技術(shù)

基于R語言的數(shù)據(jù)清洗技術(shù)

基于R語言的數(shù)據(jù)清洗技術(shù)

定 價(jià):¥59.00

作 者: 白世貞,魏勝,薛寧 著
出版社: 經(jīng)濟(jì)管理出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787509683149 出版時間: 2022-03-01 包裝:
開本: 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  數(shù)據(jù)分析指的是將數(shù)據(jù)轉(zhuǎn)化為價(jià)值的一個完整過程,而分析數(shù)據(jù)只是其中的一個環(huán)節(jié)而已,第一步工作應(yīng)該是梳理業(yè)務(wù)目標(biāo)。人們在進(jìn)行數(shù)據(jù)分析的時候,業(yè)務(wù)目標(biāo)與分析數(shù)據(jù)之間還有一個環(huán)節(jié)的工作——數(shù)據(jù)清洗。當(dāng)你辛辛苦苦梳理完業(yè)務(wù)目標(biāo),結(jié)果還沒有對數(shù)據(jù)進(jìn)行必要的清洗工作就去分析,那么分析的結(jié)果很有可能是完全錯誤的。而《基于R語言的數(shù)據(jù)清洗技術(shù)》的目標(biāo)就是帶領(lǐng)讀者去識別數(shù)據(jù)中可能存在的問題,并借助R語言這個工具將問題數(shù)據(jù)清洗干凈,這樣才會使得后續(xù)的分析結(jié)果更加真實(shí)可信。

作者簡介

  白世貞,1962年生,山東菏澤人,系統(tǒng)工程博士,常年從事工商管理、物流與供應(yīng)鏈管理的研究與教學(xué)。主持國家自然科學(xué)基金、國家科技支撐計(jì)劃重點(diǎn)專項(xiàng)子課題等***項(xiàng)目5項(xiàng);在SSGI期刊收錄、《中國管理科學(xué)》等國內(nèi)A刊發(fā)表論文30余篇;出版《供應(yīng)鏈復(fù)雜系統(tǒng)建模與仿真》等專著5部;主編出版***規(guī)劃教材4部。魏勝,吉林大學(xué)企業(yè)管理專業(yè)博士,哈爾濱商業(yè)大學(xué)管理學(xué)院副教授,在《數(shù)理統(tǒng)計(jì)與管理》《經(jīng)濟(jì)管理》等期刊發(fā)表論文7篇。薛寧,河南南陽人,哈爾濱商業(yè)大學(xué)管理學(xué)院2018級博士生。研究方向:物流與供應(yīng)鏈管理。參與多項(xiàng)國家社科基金項(xiàng)目。

圖書目錄

1 認(rèn)識本書的數(shù)據(jù)集
1.1 引言
1.2 涉及數(shù)據(jù)清洗的基本函數(shù)
1.2.1 進(jìn)行缺失值判斷-is.na函數(shù)
1.2.2 進(jìn)行頻次統(tǒng)計(jì)-table函數(shù)
1.2.3 進(jìn)行數(shù)據(jù)定位-which函數(shù)
1.2.4 進(jìn)行數(shù)據(jù)概覽-summar函數(shù)
1.2.5 輸出選定部分-head函數(shù)
1.3 讀入數(shù)據(jù)
1.4 數(shù)據(jù)的結(jié)構(gòu)與基本信息
1.4.1 該數(shù)據(jù)集的結(jié)構(gòu)
1.4.2 該數(shù)據(jù)集的基本信息
1.5 業(yè)務(wù)目標(biāo)與數(shù)據(jù)清洗工作
2 識別與清洗數(shù)值型數(shù)據(jù)中的異常值
2.1 引言
2.2 梳理業(yè)務(wù)目標(biāo)
2.3 快速清洗異常數(shù)據(jù)
2.3.1 快速識別與刪除缺失值
2.3.2 快速識別離群值
2.4 清洗離群值
2.4.1 利用經(jīng)驗(yàn)清洗離群值
2.4.2 利用均值與標(biāo)準(zhǔn)差檢測離群值
2.4.3 截去部分離群值
2.4.4 利用四分位差檢測離群值
2.5 其他數(shù)值數(shù)據(jù)清洗技術(shù)
2.5.1 最大值與最小值
2.5.2 排序
2.5.3 數(shù)值變量的分位數(shù)
2.5.4 自定義函數(shù):數(shù)據(jù)截?cái)?br />2.6 小結(jié)
……
3 利用正則表達(dá)式檢測字符型數(shù)據(jù)
4 處理時間與日期類型的數(shù)據(jù)
5 重復(fù)數(shù)據(jù)及其異常值
6 多數(shù)據(jù)集處理
7 用戶分析與數(shù)據(jù)清洗工作
8 清洗字符型數(shù)據(jù)
參考文獻(xiàn)
后記

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號