2015年3月29日 星期日

《囚犯的兩難》:冷戰、天才與賽局理論



























對於今日而言,賽局理論中的許多術語已經可以放置在日常生活中,如:零合遊戲(Sum-zero Game)、囚犯困境(Prison’s Dilemma)等,是由於現在我們對賽局的概念已經有基礎的認識,或,應該說人類文明中本來就已有了賽局的概念,只是經濟學家將之發掘並具象化成知識罷了,如今賽局理論已經可以使用來解釋多種情境。


剛開始認識賽局,應該是從John Nash的自傳電影《美麗境界》,他提出了納許均衡,也因為精神病飽受折磨;而第一次聽到馮紐曼,是關於他提出「機器是否可以自我複製」的理論出現在小說中(《時間迴旋》),當時我想這概念實在太迷人,就記住了這個名字。


本書大略分成三個部分,一為數學天才馮紐曼的一生;二是賽局理論的應用與發展;三則是賽局理論發展的背景,冷戰時期的美蘇兩大強權對峙,以及賽局在其中扮演的角色。整體而言還算流暢,而即便是生硬的經濟學與推理過程,作者也試圖以淺白的文字敘述,對於賽局理論是很好的入門書籍。


數學天才馮紐曼,記憶力過人,年幼時即可以使用多種語言,長大之後進入有名的蘭德機構進行研究,同時也參與曼哈頓計畫發展核子武器與氫彈,支持美國對蘇聯發動預防性戰爭,在今日的電腦科技、賽局、數學領域都有過人的成就,是個不可知論者,但是死前卻試圖見神父尋求宗教的用途。這位天才雖然並不是歷史上第一位提出賽局概念,但卻可說是第一個將賽局理論發展成全新領域的功臣。


我們該如何理解賽局?


書裡面提出「囚犯困境(Prison’s Dilemma)」與「膽小鬼賽局(Chicken Game)」解釋。「囚犯困境」先從結論來說,研究這個賽局似乎是悲觀的,因為正如書中所言,沒有任何的解法可以避免雙方走向最終對彼此最不利的局面。


囚犯A、B兩人分處不同牢房,被警方訊問,警方沒有直接證據,因此開出了減刑的條件,只要招供就可以減刑,但如果堅稱沒有犯行,那將沒有證據逮捕兩人,將會無罪開釋。囚犯A想著,如果和警方合作招供,將有兩種可能:

(1).B沒有招供,A獲得無罪釋放,但B被關十五年。
(2).B招供,走向最糟的局面,兩人都被關十年。

但若囚犯A沒有招供,那也有兩種可能。

(3).B招供,B無罪釋放,但A將被關十五年。
(4).B沒有招供,兩人皆無罪釋放。


照這樣看來,四種可能確實是兩人都不招供最好,但是仔細一看,無論如何選擇招供的好處都遠遠大於不招供,所以極有可能最終兩人將走向 (2) 的局面。乍看之下,這似乎是個心理學的問題,信任與不信任成為此局的極大關鍵,但若以經濟學的角度而言這裡只探討效用,情境的模擬只是為了方便瞭解而已。


這些模型具有假設的前提,如,A、B兩方的需求都是獲得最短的刑期;A、B兩人無法溝通合作等等,如果身設其中,賽局將會成為推理的比賽,A會推想B可能會背叛而改變策略,同時,A也有可能因想到B考慮到A將會為B的背叛改變策略而改變策略,上下交相賊,而當最終兩方達到一動態平衡之際,及不管再如何改變策略都不會影響結局,這樣的結局稱之為「納許均衡」。


這樣的「均衡」說明了一個結果,缺乏互信的前提之下,兩者在困局中謀略的拉鋸必然造成雙方的失敗,這也是為什麼書中的數學家們如馮紐曼、羅素等人會支持預防性戰爭,因為理性上的結果看來,美蘇最後一定都會發射核子彈導致雙方毀滅,唯有先背叛的人能在賽局當中勝出。


但沒有想到最後冷戰以蘇聯自我瓦解結束,當然國際關係理論並不能以簡單的推理解釋,但是如果從賽局的角度看,那是因為美蘇之間產生了溝通,就如書中實驗證明,兩人同時執行一百次的丟硬幣賽局,最終以「合作」居多,而非「均衡」的彼此背叛,這是因為兩人從各自的行為中摸索出模式進行對話(即便不是很成功的對話)。


(然而納許駁斥了這樣的實驗,因為大前提即在於是不能溝通的一次性賽局。)


另一個賽局是「膽小鬼賽局」,在國際關係理論中常被用來解釋為古巴飛彈危機,簡單來說,美蘇兩方就像是兩名青少年,開著跑車往前衝刺,只要人在撞毀之前閃開了,剩下往前衝的人就贏了,另一人就是膽小鬼,只是美蘇之間,甘迺迪與赫魯雪夫開著的不是跑車而是核彈,炸死的將不只千萬人。


「膽小鬼賽局」我覺得還蠻符合實際情形的,畢竟很多國際現實中,強權們就是不得不被一些尊嚴榮辱、基本人權之類的價值觀逼出來做決策,像美蘇古巴飛彈危機,有看過《驚爆十三天》的就知道甘迺迪跟赫魯雪夫根本就不想開戰,但是敵人已經欺到後院,在此退縮實在有辱國威,特別是甘迺迪在豬玀灣事件後更加敏感,而且周遭將領更是不斷鼓吹開戰,重點卻在於,隔著一層鐵幕,甘迺迪根本不知道赫魯雪夫的念頭。


這樣看起來,唯一能夠成功引導賽局向最好的方向的方式,就只有溝通與信任了,但很可惜現實中並不存在這麼完美善良的機制,囚犯困境與膽小鬼賽局所以可以應用在大小各處,就是因為其反應出人類現有的困境,「這就是我們為什麼要借助法律、道德,以及其他能促進社會合作的機制。馮紐曼認為人類是否能長久生存,取決於是否能提出更好的辦法,促成比現在既存的合作更多的合作。」大概可以為此做一小結。


結論而言,我覺得賽局比想像中更沒有實際的效用,就像書中在理論發展的後段,許多的批評者說這些假設並不符合實際情況,囚犯選擇不招供的理由可能是因為信任或義氣,青少年不得不往前衝可能是因為剎車壞了,而轉彎可能是因為看到了自己的爸媽,看過《驚爆十三天》就更可以明白,一項大決策很難以視為個人層次做出的理性選擇,週遭太多影響可以左右決策,並非賽局簡單的理性跟偏好假設可以決定。(但這並不影響賽局在純數學領域上的發展)


整體而言還蠻悲觀而且失望的,除了知道賽局的現實中難以推演以外,還知道即使我們設定了相同偏好跟理性,在缺乏溝通的前提之下賽局也只能走向最糟的局面,僅止於觀察與預測,卻無法改變結果。


但即便如此此書仍有有趣之處,如我很覺得馮紐曼的處世風格很有趣,相當多采多姿,穿梭在蘭德機構與政府軍事機關間悠遊自得,很多時刻我想到圖靈,同樣是數學天才,但是人生卻天差異遠,一個在冷戰期間成為知名學者,一個卻在破解密碼、結束二次大戰不久後自殺身亡,讓我想到,果然際遇、智商與生得逢時與否,都如賽局般並無任何改變的可能哪。




0313

沒有留言:

張貼留言