正文

《大數(shù)據(jù)時代》大數(shù)據(jù),開啟重大的時代轉(zhuǎn)型(1)

大數(shù)據(jù)時代 作者:(英)維克托·邁爾-舍恩伯格


大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型。與其他新技術(shù)一樣,大數(shù)據(jù)也必然要經(jīng)歷硅谷臭名昭著的技術(shù)成熟度曲線:經(jīng)過新聞媒體和學(xué)術(shù)會議的大肆宣傳之后,新技術(shù)趨勢一下子跌到谷底,許多數(shù)據(jù)創(chuàng)業(yè)公司變得岌岌可危。當然,不管是過熱期還是幻想破滅期,都非常不利于我們正確理解正在發(fā)生的變革的重要性。

就像望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,這種能夠收集和分析海量數(shù)據(jù)的新技術(shù)將幫助我們更好地理解世界——這種理解世界的新方法我們現(xiàn)在才意識到。本書旨在如實表達出大數(shù)據(jù)的內(nèi)涵,而不會過分熱捧它。當然,真正的革命并不在于分析數(shù)據(jù)的機器,而在于數(shù)據(jù)本身和我們?nèi)绾芜\用數(shù)據(jù)。

大數(shù)據(jù)先鋒

天文學(xué),信息爆炸的起源

只有考慮到社會各個方面的變化趨勢,我們才能真正意識到信息爆炸已經(jīng)到來。我們的數(shù)字世界一直在擴張。以天文學(xué)為例,2000年斯隆數(shù)字巡天(Sloan Digital Sky Survey)項目啟動的時候,位于新墨西哥州的望遠鏡在短短幾周內(nèi)收集到的數(shù)據(jù),已經(jīng)比天文學(xué)歷史上總共收集的數(shù)據(jù)還要多。到了2010年,信息檔案已經(jīng)高達1.4×242字節(jié)。不過,預(yù)計2016年在智利投入使用的大型視場全景巡天望遠鏡(Large Synoptic Survey Telescope)能在五天之內(nèi)就獲得同樣多的信息。天文學(xué)領(lǐng)域的變化在各個領(lǐng)域都在發(fā)生。2003年,人類第一次破譯人體基因密碼的時候,辛苦工作了十年才完成了三十億對堿基對的排序。大約十年之后,世界范圍內(nèi)的基因儀每15分鐘就可以完成同樣的工作。在金融領(lǐng)域,美國股市每天的成交量高達70億股。而其中三分之二的交易都是由建立在算法公式上的計算機程序完成的。這些程序運用海量數(shù)據(jù)來預(yù)測利益和降低風(fēng)險。

互聯(lián)網(wǎng)公司更是要被數(shù)據(jù)淹沒了。谷歌公司每天要處理超過24拍字節(jié)的數(shù)據(jù),這意味著其每天的數(shù)據(jù)處理量是美國國家圖書館所有紙質(zhì)出版物所含數(shù)據(jù)量的上千倍。facebook這個創(chuàng)立時間不足十年的公司,每天更新的照片量超過1 000萬張,每天人們在網(wǎng)站上點擊 “喜歡”(Like)按鈕或者寫評論次數(shù)大約有三十億次,這就為facebook公司挖掘用戶喜好提供了大量的數(shù)據(jù)線索。與此同時,谷歌子公司YouTube每月接待多達8億的訪客,平均每一秒鐘就會有一段長度在一小時以上的視頻上傳。twitter上的信息量幾乎每年翻一倍,截至2012年,每天都會發(fā)布超過4億條微博。


上一章目錄下一章

Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號