公元219年發(fā)生的襄樊之戰(zhàn),以蜀漢劉備部將關(guān)羽北伐曹魏,水淹七軍、圍困襄、樊兩城開端,以東吳孫權(quán)部將呂蒙“白衣渡江”偷襲南郡,關(guān)羽敗走麥城,身首異處結(jié)束。
這是一次典型的囚徒困境。
赤壁之戰(zhàn)前,劉備與孫權(quán)結(jié)成聯(lián)盟,約定共同對抗北方最強大的曹操,以獲得合作收益。關(guān)羽北伐是針對曹操的軍事行為,可以理解為劉備一方努力履行聯(lián)盟的合作契約,執(zhí)行合作策略。孫權(quán)一方趁劉備一方正努力執(zhí)行合作策略,趁其毫無防范之機,偷襲了關(guān)羽的后方根據(jù)地,導(dǎo)致關(guān)羽兵敗身死。孫權(quán)一方的偷襲不是針對曹操的軍事行為,而是針對劉備的軍事行為,是典型的執(zhí)行了背叛策略。
(“,”左側(cè)數(shù)值為劉備的收益,右側(cè)數(shù)值為孫權(quán)的收益)
在單次的囚徒困境博弈模型中,若博弈雙方同時選擇合作,則各獲得2收益;同時選擇背叛,則各獲得0收益;一方選擇合作另一方選擇背叛,合作方收益-1,背叛方收益3。同時選擇合作能讓集體獲得最高收益,2+2=4。但是當一方選擇合作給定時,另一方選擇合作收益2,選擇背叛收益3,2<3,對集體中的個體來說,當對方會選擇合作時,其最佳策略是選擇背叛。同時選擇合作策略,對集體來說雖然是收益最高的策略,但對個體來說并不是——損害同伴的利益才能最大化自身利益。當一方努力履行合作契約時,另一方有很強的激勵不履行合作契約,而是采取背叛策略。
作為孫權(quán)一方來說,當劉備一方努力履行合作契約時,其執(zhí)行背叛的策略,的的確確能夠獲得最高收益——這從呂蒙能夠輕而易舉拿下南郡就可以證明——成本低、收益高。如果只考慮襄樊之戰(zhàn)這一單次博弈,而不考慮未來,孫權(quán)偷襲南郡能得到最大收益,是最佳策略。
在單次的囚徒困境博弈模型中,實際上,無論對方選什么,選擇背叛永遠是最佳策略。上面我們已經(jīng)分析了一方選擇合作策略給定時,另一方的最佳策略是背叛。若一方選擇背叛給定,則另一方選擇合作收益-1,選擇背叛收益0,-1<0,最佳策略依然是選擇背叛。
作為劉備一方來說,似乎根本不該考慮履行合作契約,任何合作的舉動都是劣選策略,只會降低自己的收益。關(guān)羽的北伐是愚蠢的,把劉備一方推到了一個注定大敗虧輸?shù)木车亍獙O權(quán)若選擇背叛,劉備選擇合作的收益是最低的-1。
我見過很多夸贊孫權(quán)的偷襲多么明智,而諷刺關(guān)羽的北伐是多么愚蠢的言論。這些言論,包括我之前的分析,全部!都錯!錯!錯!
真正出了昏招的孫權(quán)!
為什么?
因為以上我們分析的是單次囚徒困境博弈!所謂單次博弈,就是說博弈參與者在這次博弈之后就老死不相往來了,你遇不到我,我也找不到你,不會有下一次博弈了。但現(xiàn)實情況是,劉備就在西川,孫權(quán)就在江東,你能找到我,我想見你也很容易,今天這次博弈結(jié)束之后,明天還要接著博弈,并且不知道今后還有多少場博弈。
這種情況叫做無限次數(shù)重復(fù)博弈。
單次博弈與無限次數(shù)重復(fù)博弈有什么區(qū)別?后者是要考慮未來的,前者卻不需要考慮。
未來會發(fā)生什么?
未來會發(fā)生收益!
這時一個新策略出現(xiàn)了,叫做“報復(fù)”。所謂報復(fù),就是在上一局博弈中,甲方遭遇乙方背叛,那么在下一輪博弈中,甲方也要對乙方采用背叛策略。報復(fù)雖然針對的是過去的行為,目的卻是為了獲取更多的未來收益。
(“,”左側(cè)數(shù)值為劉備的收益,右側(cè)數(shù)值為孫權(quán)的收益)
在一個共有N輪博弈的重復(fù)博弈中,給定甲遭遇背叛就會在下一輪實施報復(fù),不遭遇背叛就會一直合作。第n輪甲合作,乙背叛了,乙收益3;在第n+1輪,甲報復(fù)乙,選擇背叛,乙無論如何選擇,收益最高為0;兩輪收益相加總和為3+0=3。第n輪甲合作,乙也選擇合作,乙收益2;由于甲沒有遭到背叛,所以第n+1輪甲會選合作,乙也選合作,收益2,;兩輪收益相加總和為2+2=4。乙背叛甲的兩輪收益總和為3,乙一直與甲合作兩輪收益總和為4,3<4,因此比起背叛,乙更愿意跟甲合作。
現(xiàn)在給定甲永遠不會實施報復(fù),即,無論在第n輪乙采用什么策略,甲在第n+1輪依舊會選合作。第n輪,甲合作,乙合作,乙收益2;第二輪甲合作,乙合作,乙收益2;兩輪相加,乙總共收益4。第n輪甲合作,乙背叛,乙收益3;第n+1輪甲合作,乙背叛,乙收益3;乙兩輪收益相加總和為6。4<6,跟兩輪合作相比,兩輪背叛收益更高。實際上,我們還可以組成其他的策略組合,但是,只要甲永遠選擇合作,乙永遠選擇背叛所得的收益一定是最高的。因此,在甲不會報復(fù)的情況下,乙最佳選擇永遠是背叛,甲就永遠無法得到合作收益。=
報復(fù)提高了背叛者的背叛成本,使背叛的收益小于合作,從而激勵了人們履行合作契約。報復(fù)讓自己更安全。當乙認為甲會對背叛行為進行報復(fù)的可能性越高的時候,就越不愿意背叛甲,反之,乙認為甲會對背叛行為進行報復(fù)的可能性越低,就越愿意背叛甲。
乙如何判斷甲對背叛行為的進行報復(fù)的可能性?看他曾經(jīng)報復(fù)的頻率!曾經(jīng)實施報復(fù)的頻率越高,就說明未來會實施報復(fù)的概率也就越高;曾經(jīng)實施報復(fù)的頻率越低,就說明未來會實施報復(fù)的概率也就越低。
甲每一次的報復(fù)或不報復(fù)的決定,都關(guān)系著未來博弈中遭遇背叛的可能性。對這一次背叛行為實施了報復(fù),在未來遭遇背叛的可能性就越低,未來合作收益也就越高;不對這一次背叛行為實施報復(fù),在未來遭遇背叛的可能性就越高,未來合作收益也就越低。
為了降低未來博弈中博弈對手的背叛激勵,獲得盡可能多的未來收益,一定要盡可能對每一次背叛行為進行報復(fù)!
當孫權(quán)派呂蒙趁虛而入,占領(lǐng)南郡,導(dǎo)致關(guān)羽身死時,他就應(yīng)該料想到,劉備絕不會善罷甘休,因為對背叛行為進行報復(fù)關(guān)系到未來。但孫權(quán)似乎并沒有想到,最起碼沒有想到劉備實施報復(fù)的嚴重性。
公元221年,劉備親自率領(lǐng)5萬大軍討伐孫權(quán),發(fā)動了夷陵之戰(zhàn)。這一場戰(zhàn)役,孫權(quán)部將陸遜“火燒連營”,打得劉備幾乎全軍覆沒——孫權(quán)贏了。
有什么嚴重后果?
孫權(quán)與劉備能夠結(jié)成聯(lián)盟,合作對抗曹操,是因為無論是孫權(quán)還是劉備,其能力都不足以完成獨自對抗曹操的目標,合作能讓雙方獲得比單干更高的收益。只要孫權(quán)和劉備無法單獨對抗曹操這一現(xiàn)實不變,雙方合作獲得的收益就會大于單干獲得的收益。這個博弈的期限是“無限”的——不知道在未來的什么時候會結(jié)束。這也就意味著,這個未來可能很長(從實際情況看,這個未來確實很長),未來越長,雙方就可以從未來的合作中獲得越豐厚的回報。
合作雙方的能力越強,大概率來說,合作收益就會越高。如果一方的能力受到削弱,不僅僅影響到這一方的收益,還會讓另一方的合作收益也減少。
呂蒙“白衣渡江”之前,劉備定軍山之戰(zhàn)斬殺夏侯淵,從曹操手中奪取漢中;襄樊之戰(zhàn),關(guān)羽水淹七軍,斬殺龐德,生擒于禁,圍困襄陽、樊城,逼得曹操考慮遷都以避鋒芒。這些軍事行動給曹操帶來了嚴重的、真實的威脅,曹操必然需要增加力量對來應(yīng)對劉備一方的行動。對劉備一方增加力量,就意味著沒有更多力量應(yīng)對孫權(quán)一方,即使孫權(quán)無力發(fā)起對曹操的進攻,自身的防御壓力總歸會減少,這就提高了孫權(quán)一方的收益。
夷陵之戰(zhàn)中劉備損失慘重,導(dǎo)致蜀漢被削弱。蜀漢的衰弱,使曹操可以減少針對蜀漢的力量,將這些力量投入到針對東吳一方。蜀漢的削弱,不僅僅降低了蜀漢獲取收益的能力,同時也降低了東吳獲取收益的能力。
每一輪博弈的合作收益都降低了,那么未來博弈的輪次越多,也就是未來越長,損失的收益也就越多。
看似襄樊之戰(zhàn)和夷陵之戰(zhàn)孫權(quán)都是最后的勝利者,但實際上孫權(quán)一方為了眼前的收益,放棄了許許多多未來收益?!鞍滓露山敝埃瑢O劉聯(lián)盟給曹魏的帶來了巨大壓力,但是在“白衣渡江”之后,這一聯(lián)盟再也沒能對曹魏集團形成實質(zhì)性的威脅,只是勉強維持不被消滅而已。
那什么時候應(yīng)該選擇背叛呢?很明顯,沒有未來的時候!越是沒有未來,就越要背叛,奪取盡量多的眼前收益。比如說曹魏眼看就要被嚴重削弱了,對抗他不需要與劉備結(jié)盟了,這時候在孫權(quán)看來,孫劉聯(lián)盟的未來大概率就要結(jié)束了,沒有那么多未來收益可以獲得了,眼前收益大于未來收益,就應(yīng)該準備采取背叛策略。
我們引入貼現(xiàn)率P。明天得到2收益,不如立刻得到2收益值錢,因為明天會出現(xiàn)很多意外導(dǎo)致你無法得到這2收益,貼現(xiàn)率就是明天依舊會得到2收益的概率,也可以理解成明天的2收益比幾天的2收益貶值的比率。
若第n輪甲方遭遇乙方背叛,在以后的博弈中,甲就再也不會與乙方合作,則乙方的收益為第n輪背叛的收益3,加以后的無窮個0,最終為3。乙一直與甲合作的收益是第n輪的收益2,加上n+1輪的收益2P,加上n+2輪的收益2P²,加上n+3輪的收益2P³……就是無窮多個2相加。若乙該背叛甲,說明背叛收益高于一直合作的收益,則3>2+2P+2P²+2P³……,求得P小于1/3時,滿足不等式。當下一輪博弈依舊會繼續(xù)的概率不小于1/3時,乙背叛甲的收益就小于一直與甲合作的收益,乙就不該背叛;只有預(yù)期博弈繼續(xù)的概率小于1/3時,乙背叛甲的收益才會大于繼續(xù)與甲合作,乙應(yīng)該背叛甲。
背叛或者合作,與貼現(xiàn)率的大小有關(guān)!
這就是為什么說孫權(quán)趁機奪取南郡是一個愚蠢的短視行為,因為在當時的情況看來,曹魏集團會在很長一段時間里保持最強者地位,這就說明孫劉聯(lián)盟合作的貼現(xiàn)率是比較大的,而貼現(xiàn)率大時,選擇合作才是收益最高的策略。
夷陵之戰(zhàn)之后,諸葛亮主持了蜀漢與東吳的重新談判,再一次讓雙方回到了合作的策略上,為什么蜀漢會愿意重新與東吳合作呢?理由是——預(yù)期的貼現(xiàn)率特別大。
第n輪甲遭遇乙背叛,乙收益3,n+1輪甲報復(fù)乙,選擇背叛,乙收益0,n+2輪甲乙重新合作,乙收益2P²,n+3輪收益2P³……乙一直與甲合作,第n輪收益2,n+1輪收益2P,n+2輪收益2P²,n+3輪收益2P³……滿足背叛收益小于合作,則滿足3≤2+2P,求得P≥1/2。
當貼現(xiàn)率足夠大時,在一輪背叛與一輪報復(fù)后,乙與甲合作的未來收益依舊足夠大,乙沒有繼續(xù)背叛的激勵,因此甲在報復(fù)后,與乙繼續(xù)合作可以獲得更多收益。
因為蜀漢和東吳都承認貼現(xiàn)率確實是比較大的,也就是說,雙方合作才能對抗曹魏的現(xiàn)實會延續(xù)很長時間,所以雙方才愿意重新達成合作關(guān)系。
劉備發(fā)動夷陵之戰(zhàn)是對的,因為報復(fù)是必須的;諸葛亮在夷陵之戰(zhàn)后重新與東吳結(jié)成聯(lián)盟也是對的,因為需要與東吳合作才能對抗曹魏;但是孫權(quán)在關(guān)羽北伐曹操的時候偷襲南郡卻是錯的,在貼現(xiàn)率明顯很高的情況下采用了背叛策略,是為了眼前的蠅頭小利放棄了巨大的未來收益,是非常不明智的。
這是可以用數(shù)理證明的。
孫劉聯(lián)盟的頹勢看起來是從夷陵之戰(zhàn)開始的,實際上在呂蒙“白衣渡江”之時,歷史的天平已經(jīng)開始傾斜了。劉備死后,諸葛亮主持了蜀漢與東吳的重新談判,又達成了合作關(guān)系,但是,勢已成,不可逆,結(jié)局已經(jīng)寫就,回天乏力了。
作者:第五大洋,歷史百家爭鳴特約作者