人們不再認(rèn)為數(shù)據(jù)是靜止和陳舊的。但在以前,一旦完成了收集數(shù)據(jù)的目的之后,數(shù)據(jù)就會(huì)被認(rèn)為已經(jīng)沒有用處了。比方說(shuō),在飛機(jī)降落之后,票價(jià)數(shù)據(jù)就沒有用了(對(duì)谷歌而言,則是一個(gè)檢索命令完成之后)。
大數(shù)據(jù)洞察
如今,數(shù)據(jù)已經(jīng)成為了一種商業(yè)資本,一項(xiàng)重要的經(jīng)濟(jì)投入,可以創(chuàng)造新的經(jīng)濟(jì)利益。事實(shí)上,一旦思維轉(zhuǎn)變過(guò)來(lái),數(shù)據(jù)就能被巧妙地用來(lái)激發(fā)新產(chǎn)品和新型服務(wù)。數(shù)據(jù)的奧妙只為謙遜、愿意聆聽且掌握了聆聽手段的人所知。信息社會(huì)所帶來(lái)的好處是顯而易見的:每個(gè)人口袋里都揣有一部手機(jī),每臺(tái)辦公桌上都放有一臺(tái)電腦,每間辦公室內(nèi)都擁有一個(gè)大型局域網(wǎng)。但是,信息本身的用處卻并沒有如此引人注目。半個(gè)世紀(jì)以來(lái),隨著計(jì)算機(jī)技術(shù)全面融入社會(huì)生活,信息爆炸已經(jīng)積累到了一個(gè)開始引發(fā)變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長(zhǎng)速度也在加快。信息總量的變化還導(dǎo)致了信息形態(tài)的變化——量變引發(fā)了質(zhì)變。最先經(jīng)歷信息爆炸的學(xué)科,如天文學(xué)和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個(gè)概念。如今,這個(gè)概念幾乎應(yīng)用到了所有人類致力于發(fā)展的領(lǐng)域中。
大數(shù)據(jù)并非一個(gè)確切的概念。最初,這個(gè)概念是指需要處理的信息量過(guò)大,已經(jīng)超出了一般電腦在處理數(shù)據(jù)時(shí)所能使用的內(nèi)存量,因此工程師們必須改進(jìn)處理數(shù)據(jù)的工具。這導(dǎo)致了新的處理技術(shù)的誕生,例如谷歌的MapReduce和開源Hadoop平臺(tái)(最初源于雅虎)。這些技術(shù)使得人們可以處理的數(shù)據(jù)量大大增加。更重要的是,這些數(shù)據(jù)不再需要用傳統(tǒng)的數(shù)據(jù)庫(kù)表格來(lái)整齊地排列——一些可以消除僵化的層次結(jié)構(gòu)和一致性的技術(shù)也出現(xiàn)了。
同時(shí),因?yàn)榛ヂ?lián)網(wǎng)公司可以收集大量有價(jià)值的數(shù)據(jù),而且有利用這些數(shù)據(jù)的強(qiáng)烈的利益驅(qū)動(dòng)力,所以互聯(lián)網(wǎng)公司就順理成章地成為最新處理技術(shù)的領(lǐng)頭實(shí)踐者。它們甚至超過(guò)了很多有幾十年經(jīng)驗(yàn)的線下公司,成為新技術(shù)的領(lǐng)銜使用者。
今天,一種可能的方式是,亦是本書采取的方式,認(rèn)為大數(shù)據(jù)是人們?cè)诖笠?guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,而這些事情在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無(wú)法完成的。大數(shù)據(jù)是人們獲得新的認(rèn)知,創(chuàng)造新的價(jià)值的源泉;大數(shù)據(jù)還是改變市場(chǎng)、組織機(jī)構(gòu),以及政府與公民關(guān)系的方法。
這僅僅只是一個(gè)開始,大數(shù)據(jù)時(shí)代對(duì)我們的生活,以及與世界交流的方式都提出了挑戰(zhàn)。最驚人的是,社會(huì)需要放棄它對(duì)因果關(guān)系的渴求,而僅需關(guān)注相關(guān)關(guān)系。也就是說(shuō)只需要知道是什么,而不需要知道為什么。這就推翻了自古以來(lái)的慣例,而我們做決定和理解現(xiàn)實(shí)的最基本方式也將受到挑戰(zhàn)。