假如你和同一個對手玩了100次的囚徒困境博弈,會出現什么情況?假如你只玩這個博弈一次,你很可能使壞。假如你的對手使壞,你也跟著使壞就會得1分,好心則會得0分。假如你的對手心存善念,你使壞就會得3行,好心則會得2分。因此,不管對手怎么做,假如這個博弈只玩一次,壞心對你一定比較有利。但假如你們要玩100次,情況會變成什么樣子?
假如在整個博弈中,你們兩個一直使壞,每次雙方就只能各得1分的報酬。但要是你們兩個一直善意合作,雙方的報酬就是每回合2分。假如你開始使壞,對手就會跟著使壞,于是雙方就會形成只得1分報酬的僵局。所以你寧可先展現善意,希望他也跟進,假如他不使壞,你的確可以占他便宜而使壞一回合。不過,等這回合結束后,他也就不會再心存善念了。接下來你就會陷入每次只得1分的窘境,因為自此之后,他大概會一直使壞下去。因此,你起碼應該保持善意到他對你使壞為止。
遺憾的是,最后一次的問題會阻止所謂理性的雙方善待對方,就算是第一回合也一樣,想想看,在第100次,也就是最后一次時,你應該采取什么策略?在這個回合中,使壞帶給你的報酬一定比善意來得高。假如你會在某個回合選擇好心,唯一可能的原因就是為了讓對手在下一回合選擇好心(還記得在類似的同步行動博弈中,當你行動的時候,對手并不知道你會怎么做;因此,你在任何一回合的選擇都不會影響對手在該回合的行動)。不過,最后一次顯然不必考慮到其他回合。因此,在第100回合時,你肯定應該選擇壞心,你的對手也應該這么做。
既然如此,你在第99回合應該怎么做?你在第99次選擇使壞一定可以得到比較高的報酬。假如你不想在第99回合選擇壞心,唯一的理由就是為了讓對手在第100回合對你好心。但前面已經說過,不管怎么樣,你的對手在第100回合都應該會對你使壞。因此,雙方在第99回合都應該選擇使壞。當然,這表示你們兩個在第98回合也應該選擇使壞,因為雙方在第99和第100回合一定會選擇使壞。你可以把這個邏輯一直往回推,并借此證明你在第一回合就應該選擇使壞!
因此,就算這個囚徒困境博弈玩100次、1000次或是10億次,理性的參與者在每個回合都應該會選擇使壞,只要這個博弈存在確定的最后一次。