很多人都在高中或大學(xué)里學(xué)過概率和統(tǒng)計(jì)學(xué)課程。毫無疑問,你可能看過像圖4–1這樣的分布圖。
圖4–1?女性身高的概率分布
圖4–1就是一個(gè)所謂的正態(tài)分布圖。這個(gè)圖反映了女性身高的分布狀況。橫軸是以英寸為單位的身高值,左右兩個(gè)縱軸分別代表以下兩種概率:
1. 概率密度:陰影區(qū)域與左側(cè)的刻度相對(duì),它表示特定身高值所對(duì)應(yīng)的概率。根據(jù)這張圖,女性的平均身高是64英寸(約合1.63米)。一個(gè)女性的身高接近這個(gè)平均值的概率較大,離這個(gè)平均值越遠(yuǎn),概率越小。圖中央的最高點(diǎn)就是最大的概率,兩側(cè)較低的區(qū)域代表較小的概率。比如,70英寸(約合1.78米)處的曲線高度比68英寸(約合1.73米)處低很多,這說明一個(gè)女性身高達(dá)到70英寸的概率比達(dá)到68英寸的概率小得多。
2. 累積概率:圖中的實(shí)線與右側(cè)的刻度相對(duì),從零一直延伸到100%。它表示一個(gè)女性的身高不高于某個(gè)水平的概率。比如,這條實(shí)線在70英寸左右的身高水平上升到了幾乎100%的程度。確切數(shù)值是99.18%,這意味著只有不到1%的女性能達(dá)到70英寸以上的高度。
這張圖和其他類似的分布圖都是用復(fù)雜的數(shù)學(xué)公式得出的,但它們都代表著一個(gè)簡單的概念:距離代表平均水平的中心點(diǎn)越遠(yuǎn),概率就越低。
但我們何必把概率問題搞得這么復(fù)雜呢。就算你不去理會(huì)那些數(shù)學(xué)知識(shí)和公式,你也一樣可以用簡單的方法做出像圖4–1這樣的圖:首先,找一個(gè)女性比較多的地方,比如說大學(xué)校園;接下來,隨機(jī)選擇100位女性,測量一下她們的身高;最后,把這些身高數(shù)據(jù)按1英寸的間隔分成若干檔,然后算一下每一檔中有多少人。如果這么做,你很可能發(fā)現(xiàn)身高為64英寸有人數(shù)是16,63英寸和65英寸大約各有15人,62英寸和66英寸差不多各有12人,61英寸和67英寸各有8人,60英寸和68英寸各有8人,59英寸和69英寸各有2人,58英寸和70英寸各有1人。
如果你根據(jù)每一個(gè)特定身高值所對(duì)應(yīng)的人數(shù)做出一個(gè)條形圖,這個(gè)圖會(huì)是圖4–2這樣的:
圖4–2?女性身高的柱狀分布圖