這個現象只有兩種解釋:要么是該婚戀網站的會員身高非常高,高于美國男女身高的平均水平;要么是這些會員在填寫自我介紹資料的時候,虛報了自己的身高。
有一種理想化的銅鐘形曲線,數學家們給它起名叫“正態(tài)分布”,它是統計學中最重要的概念之一。正態(tài)分布的美來自它理論上的性質。數學可以證明,只要大量相互獨立、大小類似的輕度隨機(即方差不能為無窮大)事件相疊加,其結果必然呈正態(tài)分布。在自然界和人類的生活中,大量獨立隨機事件相疊加的情況比比皆是,所以正態(tài)分布很常見。
需要強調的是,并不是所有事情都符合上面這幾個條件,因此,并不是所有的事情都服從正態(tài)分布。這是我本章想要強調的第二個要點。人們曾經認為大部分事物都應該服從正態(tài)分布,但事實并非如此。近100年來,尤其是最近幾十年以來,科學家和統計學家們發(fā)現,很多現象并不服從正態(tài)分布,而是另一種分布。奇怪的是,幾乎所有的初級統計學教材都對這種分布避而不談,而是把幾乎所有的篇幅都放到了正態(tài)分布上。即使偶爾有幾本統計學書籍談到了這種分布,也會把它列為一種“病理標本”,而不肯承認它是自然界和人類社會中常見的現象。我認為這太不可理喻了。下面,我要為這種分布正名,了解了這種分布后你就會發(fā)現,現代生活中的很多事情都可以被這種分布解釋得很清楚。正態(tài)分布又被稱為常態(tài)分布,但我認為我下面講到的這種分布才應該稱為新的常態(tài)分布。
我們來考慮一下美國各個城市的城市規(guī)模的分布。城市規(guī)模并不是圍繞一個比較中庸的值向兩側均勻展開的,城市規(guī)模的分布也不呈銅鐘形。在美國,絕大部分的城市都非常小,所以它們都擠在下圖的左側區(qū)域。