在人類利用信息的歷史上,共發(fā)生了5次媒介技術(shù)革命,每一次媒介革命都催生了一次數(shù)據(jù)大爆炸,并推動人類文化實(shí)現(xiàn)跨越式的發(fā)展。
歷史學(xué)家伊麗莎白·愛森斯坦發(fā)現(xiàn),1439年前后,古騰堡發(fā)明印刷機(jī)以后(第三次媒介革命),1453~1503年,這50年大約有800萬本書被印刷出來,比1200年前君士坦丁堡建立以來整個歐洲所有的手抄書還要多。換言之,歐洲的信息存儲量花了50年才增長100%(當(dāng)時(shí)的歐洲占據(jù)了世界上大部分的信息存儲份額),而如今大約每3年就能增長100%。
這次媒介革命產(chǎn)生的數(shù)據(jù)洪流之猛烈,是前幾次媒介革命難以企及的。美國電影《阿凡達(dá)》的制作團(tuán)隊(duì)動用了將近40 000個處理器,電影制作過程中產(chǎn)生的數(shù)據(jù)量達(dá)到了3PB,而同期的美國國會圖書館存檔網(wǎng)絡(luò)數(shù)據(jù)大小不足100TB,也就是說制作一部《阿凡達(dá)》產(chǎn)生的數(shù)據(jù)量相當(dāng)于30個美國國會圖書館的數(shù)據(jù)量。這僅是數(shù)據(jù)大爆炸的一個縮影。我們正在經(jīng)歷一場前所未有的數(shù)據(jù)大爆炸,不僅數(shù)據(jù)的容量在擴(kuò)大、數(shù)據(jù)的種類在增長,數(shù)據(jù)產(chǎn)生的速度也在日益加快。
表3–1 五次媒介革命
媒介革命
時(shí)間
內(nèi)容
第一次媒介革命
人類史前時(shí)期
語言的出現(xiàn):語言促進(jìn)了人類思維能力的增強(qiáng),并為人們相互交流思想、傳遞信息提供了有效的工具
第二次媒介革命
公元前3500年
文字的出現(xiàn):文字作為信息的載體,可以使知識、經(jīng)驗(yàn)長期得到保存,并使信息的交流開始能夠克服時(shí)間、空間的障礙,可以長距離地或隔代地傳遞信息
第三次媒介革命
15世紀(jì)
印刷術(shù)的普及:書籍、報(bào)刊成為重要的信息儲存和傳播的媒體,打破了知識的壟斷,極大促進(jìn)了信息的共享和文化的普及
第四次媒介革命
19世紀(jì)中期
電話、廣播、電視的發(fā)明:利用電磁波傳播信息,突破了時(shí)間和空間的限制,使聲音、畫面的傳播瞬息萬里
第五次媒介革命
20世紀(jì)中后期至今
計(jì)算機(jī)與互聯(lián)網(wǎng)的使用:數(shù)字化、多媒體和網(wǎng)絡(luò)化快速推進(jìn),人類進(jìn)入信息社會,信息對整個社會的影響逐步提高到空前重要的地位,信息量、信息傳播的速度、信息處理的速度以及信息應(yīng)用的程度等都以幾何級數(shù)的方式增長
媒介革命是形成數(shù)據(jù)大爆炸的重要原因。聯(lián)合國報(bào)告認(rèn)為,與經(jīng)濟(jì)社會發(fā)展有關(guān)的大數(shù)據(jù)一般都具有以下特征:(1)數(shù)據(jù)是數(shù)字化產(chǎn)生的,可以進(jìn)行數(shù)字化存儲并通過計(jì)算機(jī)處理;(2)數(shù)據(jù)是被動產(chǎn)生的,來自人們?nèi)粘I詈突顒又械臄?shù)字化服務(wù);(3)數(shù)據(jù)是自動搜集的,在產(chǎn)生的同時(shí)被搜集并存儲;(4)可對數(shù)據(jù)進(jìn)行空間或時(shí)間跟蹤,如移動電話的呼叫位置和時(shí)間;(5)數(shù)據(jù)是被實(shí)時(shí)分析的。這些特征使巨量數(shù)據(jù)的采集成為可能。在傳統(tǒng)的數(shù)據(jù)采集方式下,例如通過登記申報(bào)、人口普查,要獲得這樣規(guī)模龐大、形式多樣的數(shù)據(jù)是根本無法想象的事情。