從統(tǒng)計學科與計算機科學的性質認知,大數(shù)據(jù)是指那些超過傳統(tǒng)數(shù)據(jù)系統(tǒng)處理能力、超出經典統(tǒng)計思想研究范圍、不借用網絡無法用主流軟件工具及技術進行單機分析的復雜數(shù)據(jù)的集合,對于這一數(shù)據(jù)集合,在一定的條件下和合理的時間內,我們可以通過現(xiàn)代計算機技術和創(chuàng)新的統(tǒng)計方法,有目的地進行設計、獲取、管理、分析,揭示隱藏在其中的有價值的模式和知識?! 洞髷?shù)據(jù):統(tǒng)計理論、方法與應用》共分五章,其內容包括大數(shù)據(jù)下的統(tǒng)計理論體系、大數(shù)據(jù)下的數(shù)據(jù)集整合分析、大數(shù)據(jù)下的高維變量選擇方法、大數(shù)據(jù)下的統(tǒng)計方法并行計算和大數(shù)據(jù)下的統(tǒng)計方法應用——網絡輿情分析?!”緯鴥热菪路f,取材國內外資料,同時認真總結了作者近年來的科研成果,重點反映統(tǒng)計學對大數(shù)據(jù)發(fā)展的影響,突出五大特點: (1)充分體現(xiàn)學科融合; (2)拓展統(tǒng)計研究對象; (3)豐富統(tǒng)計計算規(guī)范; (4)改進統(tǒng)計研究方式;?。?)擴展統(tǒng)計應用范圍。 本書對從事大數(shù)據(jù)挖掘、機器學習、人工智能和數(shù)據(jù)分析的科技人員具有重要的參考價值,可以用作統(tǒng)計學、計算機技術、人工智能和大數(shù)據(jù)管理等專業(yè)或研究方向博士生、碩士生的教材。