從統(tǒng)計學科與計算機科學的性質認知,大數據是指那些超過傳統(tǒng)數據系統(tǒng)處理能力、超出經典統(tǒng)計思想研究范圍、不借用網絡無法用主流軟件工具及技術進行單機分析的復雜數據的集合,對于這一數據集合,在一定的條件下和合理的時間內,我們可以通過現(xiàn)代計算機技術和創(chuàng)新的統(tǒng)計方法,有目的地進行設計、獲取、管理、分析,揭示隱藏在其中的有價值的模式和知識。 《大數據:統(tǒng)計理論、方法與應用》共分五章,其內容包括大數據下的統(tǒng)計理論體系、大數據下的數據集整合分析、大數據下的高維變量選擇方法、大數據下的統(tǒng)計方法并行計算和大數據下的統(tǒng)計方法應用——網絡輿情分析?!”緯鴥热菪路f,取材國內外資料,同時認真總結了作者近年來的科研成果,重點反映統(tǒng)計學對大數據發(fā)展的影響,突出五大特點: (1)充分體現(xiàn)學科融合; (2)拓展統(tǒng)計研究對象;?。?)豐富統(tǒng)計計算規(guī)范; (4)改進統(tǒng)計研究方式;?。?)擴展統(tǒng)計應用范圍。 本書對從事大數據挖掘、機器學習、人工智能和數據分析的科技人員具有重要的參考價值,可以用作統(tǒng)計學、計算機技術、人工智能和大數據管理等專業(yè)或研究方向博士生、碩士生的教材。