五、博弈有術(shù)
由于囚徒困境的模型是如此有趣和簡潔,不僅給人們留下了深刻的印象,而且迅速不脛而走,成為一個被人們廣為談?wù)摵脱芯康牟┺哪P?。這一模型在針對借故推延型客戶顯得更有價值,因為它充分揭示了人的本性,即人所做的每一決策都是為了自己的利益最大化。
囚徒困境是博弈論中最基本的博弈模型,是擔(dān)任斯坦福大學(xué)客座教授的數(shù)學(xué)家圖克1950年提出來的。當(dāng)時他給一些心理學(xué)家解釋完全信息靜態(tài)博弈問題,為了更形象地說明博弈過程,他用兩個犯罪嫌疑人的故事構(gòu)造了這一模型。
這一模型的過程這樣的:兩個共同偷竊的犯罪嫌疑人甲和乙被帶進(jìn)警察局,警方對兩名犯罪嫌疑人實(shí)行隔離關(guān)押,隔離審訊,每個犯罪嫌疑人都無法觀察到同伴的選擇。警方懷疑他們作案,但手中并沒有掌握確鑿證據(jù)。于是明確地分別告知兩名犯罪嫌疑人:對他們犯罪事實(shí)的認(rèn)定及相應(yīng)的量刑完全取決于他們自己的供認(rèn)。如果其中一方與警方合作,供認(rèn)偷竊之事,而另一方抵賴,供認(rèn)方將不受懲罰,無罪釋放,另一方則會被判重刑10年;如果雙方都與警方合作共同供認(rèn),各被判刑5年;而如果雙方均不認(rèn)罪,因為警察找不到其他證據(jù)則無罪釋放。
哪一種選擇對犯罪嫌疑人更有利呢?
我們可以知道,每個犯罪嫌疑人都有兩種可供選擇的策略:供認(rèn)或不供認(rèn),而且每個犯罪嫌疑人選擇的最優(yōu)策略不依賴于其同伙的策略選擇。
如果甲選擇抵賴,那么就可能會出現(xiàn)兩種情況:如果乙選擇供認(rèn),那么甲將被加重懲罰,判刑10年,而乙則無罪釋放;如果乙也同樣選擇抵賴,那么他們兩個都將因證據(jù)不足而被釋放。很顯然,這第二種結(jié)果對于兩個人都是最有利的。但是,因為警方?jīng)]有把兩名嫌疑人放在一間囚室里,因而這種合作難以順利進(jìn)行,使得結(jié)果預(yù)測的不確定性加大,或者說增加了抵賴合作的風(fēng)險性。
因此,基于人是理性的這一前提,由于犯罪嫌疑人不知道對方的想法,最理性的博弈策略,就是選擇供認(rèn)。這時的策略,我們可以稱為占優(yōu)策略,自愿坐牢的嫌疑人而如果所有參與人都有占優(yōu)策略存在,那么博弈將在所有參與人的占優(yōu)策略的基礎(chǔ)上達(dá)到均衡,這種均衡稱為占優(yōu)策略均衡。
在囚徒困境中“甲供認(rèn),乙供認(rèn)”的占優(yōu)策略均衡中,不論所有其他參與人選擇什么策略,一個參與人的優(yōu)勢策略都是他的最優(yōu)策略。不管甲乙兩人誰供認(rèn),都將得到減輕懲罰的結(jié)果。如果甲供認(rèn)了,乙抵賴,甲將免于懲罰;如果乙也供認(rèn)了,那么罪名各擔(dān)一半。從甲個人看來,也減輕了懲罰;甲乙互換位置,結(jié)果依然是一樣。顯然,這一策略一定是所有其他參與人選擇某一特定策略時該參與人的占優(yōu)策略。