這樣大的數(shù)據(jù)量意味著什么?如果把這些數(shù)據(jù)全部記在書(shū)中,這些書(shū)可以覆蓋整個(gè)美國(guó)52次。如果將之存儲(chǔ)在只讀光盤(pán)上,這些光盤(pán)可以堆成五堆,每一堆都可以伸到月球。公元前3世紀(jì),埃及的托勒密二世竭力收集了當(dāng)時(shí)所有的書(shū)寫(xiě)作品,所以偉大的亞歷山大圖書(shū)館可以代表世界上所有的知識(shí)量。但當(dāng)數(shù)字?jǐn)?shù)據(jù)洪流席卷世界之后,每個(gè)地球人都可以獲得大量數(shù)據(jù)信息,相當(dāng)于當(dāng)時(shí)亞歷山大圖書(shū)館存儲(chǔ)的數(shù)據(jù)總量的320倍之多。
事情真的在快速發(fā)展。人類存儲(chǔ)信息量的增長(zhǎng)速度比世界經(jīng)濟(jì)的增長(zhǎng)速度快4倍,而計(jì)算機(jī)數(shù)據(jù)處理能力的增長(zhǎng)速度則比世界經(jīng)濟(jì)的增長(zhǎng)速度快9倍。難怪人們會(huì)抱怨信息過(guò)量,因?yàn)槊總€(gè)人都受到了這種極速發(fā)展的沖擊。把眼光放遠(yuǎn)一點(diǎn),我們可以把時(shí)下的信息洪流與1439年前后古登堡發(fā)明印刷機(jī)時(shí)造成的信息爆炸相對(duì)比。歷史學(xué)家伊麗莎白·愛(ài)森斯坦(Elizabeth Eisenstein)發(fā)現(xiàn),1453—1503年,這50年之間大約有800萬(wàn)本書(shū)籍被印刷,比1 200年之前君士坦丁堡建立以來(lái)整個(gè)歐洲所有的手抄書(shū)還要多。換言之,歐洲的信息存儲(chǔ)量花了50年才增長(zhǎng)了一倍(當(dāng)時(shí)的歐洲還占據(jù)了世界上大部分的信息存儲(chǔ)份額),而如今大約每三年就能增長(zhǎng)一倍。
這種增長(zhǎng)意味著什么呢?彼特·諾維格(Peter Norvig)是谷歌的人工智能專家,也曾任職于美國(guó)宇航局噴氣推進(jìn)實(shí)驗(yàn)室,他喜歡把這種增長(zhǎng)與圖畫(huà)進(jìn)行類比。首先,他要我們想想來(lái)自法國(guó)拉斯科洞穴壁畫(huà)上的標(biāo)志性的馬。這些畫(huà)可以追溯到一萬(wàn)七千年之前的舊石器時(shí)代。然后,再想想一張馬的照片,想想畢加索的畫(huà)也可以,看起來(lái)和那些洞穴壁畫(huà)沒(méi)有多大的差別。事實(shí)上,畢加索看到那些洞穴壁畫(huà)的時(shí)候就曾開(kāi)玩笑說(shuō):“自那以后,我們就再也沒(méi)有創(chuàng)造出什么東西了?!?/p>
他的話既正確又不完全正確。你回想一下壁畫(huà)上的那匹馬。當(dāng)時(shí)要畫(huà)一幅馬的畫(huà)需要花費(fèi)很久的時(shí)間,而現(xiàn)在不需要那么久了。這就是一種改變,雖然改變的可能不是最核心的部分——畢竟這仍然是一幅馬的圖像。但是諾維格說(shuō),想象一下,現(xiàn)在我們能每秒鐘播放 24幅不同形態(tài)的馬的圖片,這就是一種由量變導(dǎo)致的質(zhì)變:一部電影與一幅靜態(tài)的畫(huà)有本質(zhì)上的區(qū)別!大數(shù)據(jù)也一樣,量變導(dǎo)致質(zhì)變。物理學(xué)和生物學(xué)都告訴我們,當(dāng)我們改變規(guī)模時(shí),事物的狀態(tài)有時(shí)也會(huì)發(fā)生改變。
我們就以納米技術(shù)來(lái)為例。納米技術(shù)就是讓一切變小而不是變大。其原理就是當(dāng)事物到達(dá)分子的級(jí)別時(shí),它的物理性質(zhì)就會(huì)發(fā)生改變。一旦你知道這些新的性質(zhì),你就可以用同樣的原料來(lái)做以前無(wú)法做的事情。銅本來(lái)是用來(lái)導(dǎo)電的物質(zhì),但它一旦到達(dá)納米級(jí)別就不能在磁場(chǎng)中導(dǎo)電了。銀離子具有抗菌性,但當(dāng)它以分子形式存在的時(shí)候,這種性質(zhì)會(huì)消失。一旦到達(dá)納米級(jí)別,金屬可以變得柔軟,陶土可以具有彈性。同樣,當(dāng)我們?cè)黾铀玫臄?shù)據(jù)量時(shí),我們就可以做很多在小數(shù)據(jù)量的基礎(chǔ)上無(wú)法完成的事情。