大知識(shí)
大數(shù)據(jù)能為人類帶來大知識(shí),即通過對(duì)海量數(shù)據(jù)進(jìn)行分析,以一種前所未有的方式獲得深刻洞見。例如,2009年甲型H1N1流感爆發(fā)時(shí),與習(xí)慣性滯后的官方數(shù)據(jù)相比,谷歌成為一個(gè)更有效、更及時(shí)的指示標(biāo)。他們通過分析5 000萬條美國(guó)人最頻繁檢索的詞條,例如“哪些是治療咳嗽和發(fā)熱的藥物”,建立了4.5億個(gè)數(shù)學(xué)模型,并與美國(guó)疾控中心在2003~2008年季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行比較,提前兩周預(yù)測(cè)出流感的爆發(fā)時(shí)間和傳播路徑。這種工作方式不需要分發(fā)口腔試紙和聯(lián)系醫(yī)院,它是建立在大數(shù)據(jù)的基礎(chǔ)之上的?;谶@樣的技術(shù)理念和數(shù)據(jù)儲(chǔ)備,下一次流感來襲時(shí),世界將擁有一種更好的預(yù)測(cè)工具預(yù)防流感的傳播。
人們通過大數(shù)據(jù)獲得的知識(shí)更快速、更準(zhǔn)確、更便捷,而這些在傳統(tǒng)的數(shù)據(jù)利用思維和技術(shù)的基礎(chǔ)上是難以完成的。例如,個(gè)人收入對(duì)于銀行放貸、社會(huì)保障等機(jī)構(gòu)而言是一項(xiàng)關(guān)鍵數(shù)據(jù)。然而,收入又是一個(gè)比較敏感的話題,要調(diào)查個(gè)人收入,不僅過程煩瑣、成本較高,而且還存在瞞報(bào)的可能。著名征信機(jī)構(gòu)益百利有一項(xiàng)服務(wù),即通過分析信用卡歷史記錄和美國(guó)國(guó)稅局的匿名稅收數(shù)據(jù),對(duì)個(gè)人的收入狀況進(jìn)行較為精準(zhǔn)的預(yù)測(cè),其預(yù)測(cè)結(jié)果售價(jià)不足1美元,而通過傳統(tǒng)的辦法證明一個(gè)人的收入狀況要花費(fèi)10美元左右。
大數(shù)據(jù)使得組織決策將越來越依賴于數(shù)據(jù)和分析,而非經(jīng)驗(yàn)和直覺。邁克爾·劉易斯于2003年出版的《點(diǎn)球成金》中講述了棒球統(tǒng)計(jì)學(xué)的一個(gè)真實(shí)案例。該書的主角比利·比恩是一家棒球隊(duì)的總經(jīng)理,他在一位統(tǒng)計(jì)學(xué)家的幫助下,盡可能地將球員能力數(shù)據(jù)化,并以此作為衡量球員能力的唯一標(biāo)準(zhǔn),而非基于主觀經(jīng)驗(yàn)的判斷。通過這套計(jì)算機(jī)程序和數(shù)學(xué)模型,比利以有限的預(yù)算尋找那些被價(jià)值低估的球員,實(shí)現(xiàn)了最高的“投入產(chǎn)出比”,創(chuàng)下了美國(guó)職業(yè)棒球大聯(lián)盟百年歷史上的連勝20場(chǎng)的空前紀(jì)錄。與那位統(tǒng)計(jì)學(xué)家相比,專業(yè)棒球星探們?cè)谔暨x球員方面的精準(zhǔn)程度相形見絀。
大價(jià)值
我們的日常生活會(huì)因?yàn)闊o處不在的大數(shù)據(jù)應(yīng)用更加智能便捷。搜索引擎可以為關(guān)聯(lián)網(wǎng)站排序;智能輸入法能為用戶創(chuàng)建個(gè)性化詞典;豆瓣網(wǎng)為我們推薦想要看的電影和圖書;微信自動(dòng)推送好友信息,幫助我們建立朋友圈;電子郵箱自動(dòng)過濾含有某些關(guān)鍵詞的垃圾郵件;相親網(wǎng)站通過計(jì)算用戶的性格、教育背景、職業(yè)等匹配程度,提高男女配對(duì)成功的概率。