五、博弈有術(shù)
由于囚徒困境的模型是如此有趣和簡潔,不僅給人們留下了深刻的印象,而且迅速不脛而走,成為一個(gè)被人們廣為談?wù)摵脱芯康牟┺哪P?。這一模型在針對(duì)借故推延型客戶顯得更有價(jià)值,因?yàn)樗浞纸沂玖巳说谋拘?,即人所做的每一決策都是為了自己的利益最大化。
囚徒困境是博弈論中最基本的博弈模型,是擔(dān)任斯坦福大學(xué)客座教授的數(shù)學(xué)家圖克1950年提出來的。當(dāng)時(shí)他給一些心理學(xué)家解釋完全信息靜態(tài)博弈問題,為了更形象地說明博弈過程,他用兩個(gè)犯罪嫌疑人的故事構(gòu)造了這一模型。
這一模型的過程這樣的:兩個(gè)共同偷竊的犯罪嫌疑人甲和乙被帶進(jìn)警察局,警方對(duì)兩名犯罪嫌疑人實(shí)行隔離關(guān)押,隔離審訊,每個(gè)犯罪嫌疑人都無法觀察到同伴的選擇。警方懷疑他們作案,但手中并沒有掌握確鑿證據(jù)。于是明確地分別告知兩名犯罪嫌疑人:對(duì)他們犯罪事實(shí)的認(rèn)定及相應(yīng)的量刑完全取決于他們自己的供認(rèn)。如果其中一方與警方合作,供認(rèn)偷竊之事,而另一方抵賴,供認(rèn)方將不受懲罰,無罪釋放,另一方則會(huì)被判重刑10年;如果雙方都與警方合作共同供認(rèn),各被判刑5年;而如果雙方均不認(rèn)罪,因?yàn)榫煺也坏狡渌C據(jù)則無罪釋放。
哪一種選擇對(duì)犯罪嫌疑人更有利呢?
我們可以知道,每個(gè)犯罪嫌疑人都有兩種可供選擇的策略:供認(rèn)或不供認(rèn),而且每個(gè)犯罪嫌疑人選擇的最優(yōu)策略不依賴于其同伙的策略選擇。
如果甲選擇抵賴,那么就可能會(huì)出現(xiàn)兩種情況:如果乙選擇供認(rèn),那么甲將被加重懲罰,判刑10年,而乙則無罪釋放;如果乙也同樣選擇抵賴,那么他們兩個(gè)都將因證據(jù)不足而被釋放。很顯然,這第二種結(jié)果對(duì)于兩個(gè)人都是最有利的。但是,因?yàn)榫經(jīng)]有把兩名嫌疑人放在一間囚室里,因而這種合作難以順利進(jìn)行,使得結(jié)果預(yù)測的不確定性加大,或者說增加了抵賴合作的風(fēng)險(xiǎn)性。
因此,基于人是理性的這一前提,由于犯罪嫌疑人不知道對(duì)方的想法,最理性的博弈策略,就是選擇供認(rèn)。這時(shí)的策略,我們可以稱為占優(yōu)策略,自愿坐牢的嫌疑人而如果所有參與人都有占優(yōu)策略存在,那么博弈將在所有參與人的占優(yōu)策略的基礎(chǔ)上達(dá)到均衡,這種均衡稱為占優(yōu)策略均衡。
在囚徒困境中“甲供認(rèn),乙供認(rèn)”的占優(yōu)策略均衡中,不論所有其他參與人選擇什么策略,一個(gè)參與人的優(yōu)勢策略都是他的最優(yōu)策略。不管甲乙兩人誰供認(rèn),都將得到減輕懲罰的結(jié)果。如果甲供認(rèn)了,乙抵賴,甲將免于懲罰;如果乙也供認(rèn)了,那么罪名各擔(dān)一半。從甲個(gè)人看來,也減輕了懲罰;甲乙互換位置,結(jié)果依然是一樣。顯然,這一策略一定是所有其他參與人選擇某一特定策略時(shí)該參與人的占優(yōu)策略。