影片《美麗心靈》(A Beautiful Mind)以1994年度諾貝爾經濟學獎得主之一小約翰·納什與他的妻子艾莉西亞(曾離婚,但2001年複婚)的故事為題材,記述了Nash從事業的頂峰滑向神經失常的低谷,再般逐漸恢複的生平。劇中Russel Crowe扮演Nash,電影于2001年上映,并一舉獲得8項奧斯卡提名。

這部影片在豆瓣上的評分一直高居在9分左右,也真的是好看,看過好幾遍。約翰·納什的傳奇人生經曆,他的納什均衡理論,他最後的人生結局,當然也都是看電影之後必然的延伸研究的對象。
1950年,22歲的納什以非合作博弈(Non-cooperative Games)為題的27頁博士論文畢業中提出了一個重要概念,也就是後來被稱為"納什均衡"的博弈理論(Game Theory)。随後,納什留在普林斯頓大學任教,但正在事業如日中天時,30歲的納什患上嚴重的精神分裂症,并連續兩次被送入精神病院,結束了自己的學術生涯。80年代末,納什從嚴重的精神分裂症中奇迹般地走出,并于1994年獲得諾貝爾經濟學獎,他才重新回到熟悉的學術舞台。
2015年5月23日,約翰·納什與妻子在美國新澤西州遭遇車禍逝世,享年86歲。
納什留給這個世界最重要的遺産是他的“納什均衡”(Nash Equilibrium)理論。那麼什麼是納什均衡理論,它在現實生活中又有着怎樣的應用呢?

案例1:“囚徒困境”
這是最經典的例子:兩個嫌疑犯(A和 B)作案後被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴”,如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判 10年;如果都不坦白則因證據不足各判1年。
在這個例子裡,博弈的參加者就是嫌疑犯 A和 B,他們每個人都有兩個策略即坦白和不坦白,可能出現的四種情況:A和 B均坦白或均不坦白、A坦白 B不坦白或者 B坦白A不坦白,是博弈的結果。顯然最好的策略是雙方都抵賴,結果是大家都隻被判 1年。但由于兩人處于隔離情況下無法串供,所以他們選擇坦白交代是最佳策略。因為坦白可以期望得到最好的解決辦法:釋放,但,前提是同夥抵賴,顯然要比自己抵賴坐10年牢好得多;而如果對方坦白了而自己抵賴了,那自己就得坐 10年牢,太不劃算了! 即使兩人同時坦白,至多也隻判 8年,總 比被判 10年好。
結果 ,兩人合理的選擇是坦白,原本對雙方都有利的策略(不坦白)和結局(各被判1年刑)就不會出現。這樣兩人都選擇坦白的策略以及因此被判 8年 的結局被稱為“納什均衡”,也叫非合作均衡,因為,每一方在選擇策略時隻是選擇對自己最有利的策略,而不考慮集體利益或任何其他對手的利益。
按照亞當·斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終全社會達到利他的效果。而“納什均衡”引出了一個悖論:從利己目的出發 ,結果損人不利己,既不利己也不利他,兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提出的悖論實際上動搖了西方經濟學的基石。
從“納什均衡”中我們還可以悟出一個道理:合作是有利的“利 己策略”,但它必須符合以下黃金律:按照你願意别人對你的方式來對别人,但隻有他們也按同樣方式行事才行。
案例2: 價格戰拿我所在的翻譯行業為例,假設參加博弈的兩家翻譯公司分别是A和B,兩家的市場份額一度是平衡的,但B在成本和價格上更有優勢,于是他的市場份額逐步擴大,那麼A應該怎麼做呢,是維持還是降價?
從 A角度看 ,顯然降價要 比維持好,降價至少可以保證比 B好;從 B角度看,效果也一樣,降價同樣比維持好。在這輪博弈中,A、B都将降價作為策略,因此各有損失 ,整體也有損失,整體收益是最差的。這就是此博弈最終所出現的納什均衡,各個局部都尋求利益的最大化,而整體利益卻不是最優,甚至是最差。
案例3:聯盟
現實生活當中,并不是隻有“非合作”,合作是一種随處可見的現象,比如說一些行業的小範圍的聯盟組織。
如果不是單次博弈,而是多次和長期博弈,人們就有了合作的可能性,囚徒困境就有可能破解 ,合作就有可能達成。連續的合作有可能成為重複的囚徒困境的均衡解。博弈論的研究表明,要想使合作成為多次博弈的均衡解,博弈的一方(最好是實力更強的一方,就稱為盟主吧)必須主動通過可信的承諾(Credible commitment),向對手們表示合作的善意,努力把這個善意表達清楚,并在博弈對手中形成聲譽,并用心地維護這個聲譽。
所以,盟主要号令四方,達成集體利益最大化的合作,需要最大的誠意和實實在在的付出。同時,如果是長期合作,其他盟友從長遠利益考慮對他們自己有利他們才會恪守盟約,靠組織規則來約束是靠不住的,隻要有一方暗箱操作,增加産量或降低價格,那必然導緻其他合作方也做出相應行動,導緻聯盟失敗。
案例4:貿易自由與壁壘
任何一個國家在國際貿易中都面臨着貿易自由與貿易保護的兩難選擇。貿易自由與壁壘問題,也是一個“納什均衡”問題,如果貿易雙方采取不合作博弈的策略,A國試圖對 B國進行進口貿易限制,比如提高關稅 ,則 B國必然會進行反擊,也提高關稅,結果誰也沒有撈到好處。用博弈論的語言來說,現在的中美貿易,(打,打)是這個博弈的納什均衡,也是這個博弈最終的走向。然而這種結果顯然并不是最優的選擇,雙方都選擇“不打”,收益會明顯提高,這也構成了中美貿易戰的“囚徒困境”。
中美兩國為自己的利益而相互競争并力求實現博弈均衡,該均衡點非常有可能不是各國的最優利益點,但一定是兩國在這場貿易沖突裡能夠階段性實現的最優點,談判互動的過程中,一國必須在充分考慮他國利益的基礎上,在可能的範圍内才有可能實現利益最大化。
當然,博弈論雖然對于行為解讀至關重要,然而單靠博弈論并不能徹底解釋行為的所有動機,不能幫助解釋複雜國家行為選擇的所有方面。國際貿易是國與國之間政治經濟的綜合博弈。
“特朗普之所以看起來瘋狂是因為獲得一種瘋狂不理性的名聲在重複博弈中是一種特别重要的策略。如果特朗普有這樣的名聲,且他過去已經用這種瘋狂的方式戰勝了很多競争者,那麼通過塑造非理性和好戰的印象向中國傳達貿易沖突的威脅,就可信可行,在這種情況下其一貫的瘋狂行為方式也會提醒潛在的競争者(中國),服從我也許對你更有利。特朗普的非理性博弈不能簡單地用經濟學上的即期盈虧絕對值來衡量,他在搞貿易戰。當市場競争升級到“戰争”之時,意味着經濟問題已經轉化成政治問題,所以要用政治學的思維來思考其行為邏輯,他以“傷敵一千自損八百”的方式求得雙方力量的重新調整,試圖改變中美雙方的利益格局。”
案例5 好的和壞的納什均衡
納什均衡概念是一個分析工具,本身不包含價值判斷。所以既存在好的納什均衡,也存在壞的納什均衡。
以中國的人民公社時期為例,政府的目标是農民辛苦勞動,大家都有糧食吃,但結果是在人民公社中,農民反而沒有生産積極性,最後導緻貧困。博弈的過程中自然形成一個納什均衡——貧困。而改革開放後,政府改變政策,農民可以擁有自己的土地,生産積極性提高,生活水平也相應提高,這又形成一個新的納什均衡:産量與生活水平提高。
因此,前者就形成了一個壞的納什均衡,後者形成了一個好的納什均衡,從壞的納什均衡到好的納什均衡需要一系列的制度調整,前提就是博弈的雙方尊重彼此的自由意志與選擇。
合作是建立在自願基礎上的,而自願的基礎是尊重每個人的内心,尊重每個人的利益訴求,并以此建立一套遊戲規則或者政策。“如果産權界定清楚,法治很完善,大家可以看到長期博弈,所以在西方有一句諺語,誠實是最好的商業政策,”經濟學家張維迎說。
納什已經逝去,但他留給人們的納什均衡理論卻對我們分析現實生活中的很多現象大有幫助。美麗的心靈,美麗的理論,雖然不能就此簡單成就一個美麗的世界,但或許可以帶來一些更美麗的均衡和合作。