但是相撲比賽的一個(gè)比較特殊的地方是,選手需要在 15場(chǎng)聯(lián)賽中的大部分場(chǎng)次取得勝利才能保持排名和收入。這樣一來(lái)就會(huì)出現(xiàn)利益不對(duì)稱(chēng)的問(wèn)題。當(dāng)一個(gè)7勝 7負(fù)的摔跤手碰到一個(gè) 8勝 6負(fù)的對(duì)手時(shí),比賽結(jié)果對(duì)第一個(gè)選手來(lái)說(shuō)極其重要,對(duì)他的對(duì)手則沒(méi)有那么重要。列維特和達(dá)根發(fā)現(xiàn),在這樣的情況下,需要贏的那個(gè)選手很可能會(huì)贏。這看起來(lái)像是對(duì)手送的“禮物”,因?yàn)樵诼?lián)系緊密的相撲界,幫別人一把就是給自己留了一條后路。
沒(méi)有可能是要贏的決心幫助這個(gè)選手獲勝呢?答案是,有可能。但是數(shù)據(jù)顯示的情況是,需要贏的選手的求勝心也只是比平常高了 25%。所以,把勝利完全歸功于求勝心是不妥當(dāng)?shù)?。?duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析可能會(huì)發(fā)現(xiàn),與他們?cè)谇叭拇伪荣愔械谋憩F(xiàn)相比,當(dāng)他們?cè)傧嘤鰰r(shí),上次失利的一方要擁有比對(duì)方多 3~4倍的勝率。
這個(gè)情況是顯而易見(jiàn)的。但是如果采用隨機(jī)采樣分析法,就無(wú)法發(fā)現(xiàn)這個(gè)情況。而大數(shù)據(jù)分析通過(guò)使用所有比賽的極大數(shù)據(jù)捕捉到了這個(gè)情況。這就像捕魚(yú)一樣,開(kāi)始時(shí)你不知道是否能捕到魚(yú),也不知道會(huì)捕到什么魚(yú)。
一個(gè)數(shù)據(jù)庫(kù)并不需要有以太字節(jié) ①計(jì)的數(shù)據(jù)。在這個(gè)相撲案例中,整個(gè)數(shù)據(jù)庫(kù)包含的字節(jié)量還不如一張普通的數(shù)碼照片包含得多。但是大數(shù)據(jù)分析法不只關(guān)注一個(gè)隨機(jī)的樣本。這里的“大”取的是相對(duì)意義而不是絕對(duì)意義,也就是說(shuō)這是相對(duì)所有數(shù)據(jù)來(lái)說(shuō)的。
很長(zhǎng)一段時(shí)間內(nèi),隨機(jī)采樣都是一條好的捷徑,它使得數(shù)字時(shí)代之前的大量數(shù)據(jù)分析變得可能。但就像把一張數(shù)碼照片或者一首數(shù)碼歌曲截取成多個(gè)小文件似的,在采樣分析的時(shí)候,很多信息都無(wú)法得到。擁有全部或幾乎全部的數(shù)據(jù),我們就能夠從不同的角度,更細(xì)致地觀察研究數(shù)據(jù)的方方面面。
我們可以用 Lytro相機(jī)來(lái)打一個(gè)恰當(dāng)?shù)谋确健?Lytro相機(jī)具有革新性的,因?yàn)樗汛髷?shù)據(jù)運(yùn)用到了基本的攝影中。與傳統(tǒng)相機(jī)只可以記錄一束光不同, Lytro相機(jī)可以記錄整個(gè)光場(chǎng)里所有的光,達(dá)到 1 100萬(wàn)之多。具體生成什么樣的照片則可以在拍攝之后再根據(jù)需要決定。用戶(hù)沒(méi)必要在一開(kāi)始就聚焦,因?yàn)樵撓鄼C(jī)可以捕捉到所有的數(shù)據(jù),所以之后可以選擇聚焦圖像中的任一點(diǎn)。整個(gè)光場(chǎng)的光束都被記錄了,也就是收集了所有的數(shù)據(jù),“樣本 =總體”。因此,與普通照片相比,這些照片就更具“循環(huán)性”。如果使用普通相機(jī),攝影師就必須在拍照之前決定好聚焦點(diǎn)。