那么,美國醫(yī)生的表現(xiàn)又如何呢?85%的受訪醫(yī)生認(rèn)為,該婦女罹患乳癌的概率應(yīng)該約為75%。
其實(shí),這道題的正確答案是9%。
為什么這位婦女實(shí)際患乳癌的概率這么低?蓋格瑞澤指出,只要把題目的說法從概率和百分比“翻譯”成事件發(fā)生的次數(shù),這道題就會(huì)變得非常簡單。具體翻譯如下:在年齡為40~50歲、無家族乳腺癌病史、本人無乳腺癌癥狀的每1 000位婦女中,就會(huì)有8人罹患乳腺癌。這8個(gè)人中有7個(gè)人的乳房X射線檢查結(jié)果呈陽性。在沒有患上乳腺癌的992人中,大約有70人的乳房X射線檢查結(jié)果會(huì)錯(cuò)誤地顯示為陽性?,F(xiàn)在有一個(gè)乳房X射線檢查結(jié)果呈陽性的婦女,請(qǐng)問她實(shí)際患有乳腺癌的概率是多少?
非常簡單。1 000人中檢查結(jié)果呈陽性的一共有7+70=77個(gè)人。這77個(gè)人中,只有7個(gè)人確實(shí)是乳腺癌患者,剩下的70人并沒有患上乳腺癌。所以,在檢查結(jié)果呈陽性的前提下,實(shí)際患有乳腺癌的概率是7除以77,也就是1/11或者約9%。
在上面的計(jì)算中,我們做了兩處簡化。
第一,我們把所有小數(shù)四舍五入為整數(shù)。比如,“這8個(gè)人中有7個(gè)人的乳房X射線檢查結(jié)果呈陽性”。準(zhǔn)確地說,8個(gè)患乳腺癌的人乳房X射線檢查結(jié)果呈陽性的概率為90%,也就是說有8×0.9=7.2個(gè)人乳房X射線的檢查結(jié)果呈陽性。此處,我們把7.2直接四舍五入為7,雖然精確度有所下降,但是整數(shù)會(huì)比小數(shù)更清楚易懂。
第二,我們假設(shè)實(shí)際情況和統(tǒng)計(jì)數(shù)據(jù)是完全相符的。比如,低風(fēng)險(xiǎn)人群的乳腺癌發(fā)病率是0.8%,那么假設(shè)1 000人樣本中正好有8個(gè)人患病。現(xiàn)實(shí)中,情況往往不是這樣,你拋1 000次硬幣,不一定正好有500次的結(jié)果是正面朝上的。但是,我們需要假設(shè)樣本完全服從統(tǒng)計(jì)數(shù)據(jù)的分布規(guī)律,否則我們就沒辦法計(jì)算了。
不得不承認(rèn),這個(gè)方法在邏輯上并不是很嚴(yán)密,所以,任何一本概率學(xué)教科書都不會(huì)采用這種方法。但是,與復(fù)雜的貝葉斯定理相比,我們的這種方法既簡單又清楚,光這兩個(gè)優(yōu)點(diǎn)其實(shí)已經(jīng)足夠了。作為上述實(shí)驗(yàn)的對(duì)照,蓋格瑞澤又找了另外24位醫(yī)生,向他們提出同樣的問題,只不過這次的數(shù)據(jù)不是以概率和百分比的形式給出,而是以事件發(fā)生的自然頻率的形式給出(即直接給出翻譯過后的題目)。結(jié)果是,幾乎所有受訪醫(yī)生都給出了正確的答案(或者答案與正確答案很接近)。
把概率從百分比簡化成事件發(fā)生次數(shù),確實(shí)使問題解決起來容易許多,但是條件概率仍然是一個(gè)比較復(fù)雜的內(nèi)容。有時(shí)候,我們甚至連問題都問錯(cuò)了;還有的時(shí)候,我們算出了正確的結(jié)果,卻又被結(jié)果所誤導(dǎo),給出了錯(cuò)誤的解釋。