回歸分析是一種數(shù)學(xué)工具,人們可以運(yùn)用它推導(dǎo)出線、方程式和公式來恰當(dāng)?shù)亟忉寯?shù)集。這是一種特別強(qiáng)有力的技能,可以迅速在給定的數(shù)集中總結(jié)出規(guī)律。然而,如果人們胡亂使用它,所得結(jié)果就可能毫無意義,就像瘋子嘟囔時(shí)的胡言亂語。上文中提到了兩個(gè)宣稱女運(yùn)動(dòng)員會(huì)超過男運(yùn)動(dòng)員的預(yù)測(cè),它們就是“胡亂回歸分析”的典型案例,因?yàn)榭茖W(xué)家們從數(shù)集中找出來的規(guī)律根本就是荒謬的,這些“規(guī)律”直接可以推導(dǎo)出“運(yùn)動(dòng)員最終的奔跑速度會(huì)超過光速以至于時(shí)光倒流”的可笑結(jié)論,我們憑此就能一眼看穿這些“規(guī)律”的虛假性。不過,“胡亂回歸分析”所導(dǎo)致的問題通常是更加隱晦且難以看穿的。
在20世紀(jì)80年代,經(jīng)濟(jì)學(xué)家們一窩蜂地努力研究著來自耶魯大學(xué)的一個(gè)科研話題。一位名叫雷·費(fèi)爾的年輕經(jīng)濟(jì)學(xué)家根據(jù)1912~1976年的經(jīng)濟(jì)數(shù)據(jù)作了一項(xiàng)回歸分析,然后得出了一個(gè)如果成立就將轟動(dòng)一時(shí)的方程式,該方程式可以提前預(yù)測(cè)誰會(huì)在接下來的總統(tǒng)競(jìng)選中獲勝。你僅僅需要在方程式中輸入幾個(gè)經(jīng)濟(jì)要素——通貨膨脹率、國(guó)內(nèi)生產(chǎn)總值增長(zhǎng)率等。瞧!下一位總統(tǒng)就計(jì)算出來啦。那么,戰(zhàn)爭(zhēng)、國(guó)債、外交政策呢?這些幾乎都是無關(guān)緊要的,經(jīng)濟(jì)形勢(shì)完全決定了每次總統(tǒng)競(jìng)選的勝利者。經(jīng)濟(jì)學(xué)家們肯定會(huì)喜歡上這個(gè)方程式。
1980年,費(fèi)爾的方程式預(yù)測(cè),里根會(huì)在二選一的角逐中以55。4%的得票率戰(zhàn)勝卡特。后來,里根的確拿到了55。3%的選票。全世界經(jīng)濟(jì)學(xué)家都為這個(gè)方程式的精準(zhǔn)程度而激動(dòng)萬分。1984年,費(fèi)爾預(yù)測(cè)里根會(huì)大勝蒙代爾而連任。他說對(duì)了。1988年,這個(gè)方程式顯示老布什會(huì)輕松戰(zhàn)勝杜卡基斯。老布什做到了。經(jīng)濟(jì)學(xué)家們向神機(jī)妙算的費(fèi)爾致敬,費(fèi)爾則得意洋洋地吹噓著他的預(yù)測(cè)的準(zhǔn)確性。他的方程式被視為令人驚嘆的、準(zhǔn)確的經(jīng)濟(jì)預(yù)測(cè)的標(biāo)準(zhǔn)范式,并在經(jīng)濟(jì)學(xué)專業(yè)大一新生的課堂上向?qū)W生傳授。然而,費(fèi)爾在1992年宣稱,老布什會(huì)以57。2%的得票率擊敗新晉候選人克林頓,憑借公眾那勢(shì)不可當(dāng)?shù)闹С只氐桨讓m進(jìn)入他的第二個(gè)總統(tǒng)任期。
嗤嗤……你或許可以想象一下,在最終選舉結(jié)果揭曉后,經(jīng)濟(jì)學(xué)家們那膨脹的自負(fù)是如何被擊得粉碎的。費(fèi)爾被迫低調(diào)地修改了他的方程式,以便“糾正”他之前犯下的錯(cuò)誤。在1996年美國(guó)大選前,他又勇敢地在一份報(bào)紙上公布了下一個(gè)預(yù)測(cè):“按照方程式推導(dǎo)出的基本結(jié)論是,美國(guó)共和黨人會(huì)在1996年大選中略占優(yōu)勢(shì)?!编?,他又錯(cuò)了。美國(guó)民主黨人克林頓完勝美國(guó)共和黨人多爾,他的領(lǐng)先優(yōu)勢(shì)跟1980年里根戰(zhàn)勝卡特時(shí)一樣明顯。
真正的問題是,費(fèi)爾的方程式就是典型的“胡亂回歸分析”的產(chǎn)物。它是一個(gè)精心制作的數(shù)學(xué)模型,并用以表達(dá)費(fèi)爾從數(shù)據(jù)中找到的“規(guī)律”,但這個(gè)“規(guī)律”本身就是毫無意義的。(費(fèi)爾的成功可歸結(jié)為一個(gè)常識(shí)性的結(jié)論,那就是在任總統(tǒng)會(huì)因良好的經(jīng)濟(jì)狀況而受益。)方程式可以完美地解釋過去的競(jìng)選結(jié)果,但用它來預(yù)測(cè)未來的競(jìng)選結(jié)果顯然是不可能的,這便是虛假規(guī)律的典型特征。幾乎所有的競(jìng)選預(yù)測(cè)都有著同樣的問題。經(jīng)濟(jì)學(xué)家和其他領(lǐng)域的專家們年復(fù)一年地修正著他們那不靠譜的數(shù)學(xué)模型,并據(jù)此作出多數(shù)情況下都錯(cuò)得離譜的預(yù)測(cè)。他們甚至在一個(gè)缺乏新聞素材的日子里把預(yù)測(cè)結(jié)果發(fā)表到了一份赫赫有名的報(bào)紙的第二版上,題為“一切都還沒有結(jié)束”。一位經(jīng)濟(jì)學(xué)家在2000年某一期的《華盛頓郵報(bào)》的第一版上發(fā)表文章,預(yù)測(cè)戈?duì)枙?huì)在二選一的角逐中贏得56。2%的選票。當(dāng)然,他又貽笑大方了。我受夠了這些預(yù)測(cè)家的喧囂,在《華盛頓郵報(bào)》上發(fā)表了一篇文章,使用令人費(fèi)解的4組Kn?del數(shù)列來預(yù)測(cè)美國(guó)總統(tǒng)競(jìng)選的結(jié)果,其結(jié)論能夠與1952年以來的歷次競(jìng)選結(jié)果相符合。認(rèn)為某組數(shù)列可以決定在總統(tǒng)競(jìng)選中的獲勝者,這種想法著實(shí)很荒謬可笑,不過并不比經(jīng)濟(jì)學(xué)家們采用“胡亂回歸分析”所得到的預(yù)測(cè)結(jié)論更荒謬可笑和離譜。