課程質量:★★★★★ 喜愛程度:第5名時長:24講/每講70分鐘 學習年份:2017年這門課程的預修知識

按道理來說,博弈論是經濟學下的學科,一般會需要一點點經濟學和數學(尤其微積分)基礎。

但這門課相當入門,基本上完全不需要經濟學基礎;我在當初學習這門課的時候,甚至連課上老師畫的需求曲線(Demand Curve)都不認識,但完全不影響我理解博弈論。

同時這門課對數學的要求非常非常低,所以文科的朋友不用害怕;Ben Polak老師甚至做一次“求導令等零求極值”都要安慰大家不懂沒關系,而且很多地方其實用矩陣解釋很方便,但老師就是不提,為了照顧沒有接觸過線性代數的通信。

我也是聽這門課後真切感受到,國外的大部分學生的數學訓練确實不如國内學生嚴苛,堂堂耶魯居然也都這樣。這些東西國内985的學生不知道,會被當成智障看。

總體來講,數學和經濟學基礎都不是這門課的預修知識;這門課我認為沒有預修知識,大家放心聽。

現在網絡上有不少其他博弈論課程,專為網課學生錄制,課件制作更精良。但我仍然推薦大家跟着這門2007年錄制的耶魯大學公開課學習,哪怕老師隻能用闆書,攝像機隻有一個機位。

因為博弈論這門課程是研究人與人互動的學科,所以我們最好能觀察到人類在不同博弈中的真實反映,能極大加深我們對知識的理解。

後續的大部分網課主要是對着課件錄屏講解(如Coursera、YouTube上的其他博弈論課程),缺少真實互動演示;而這門Ben Polak老師的公開課每節課上半段講解知識,下半段讓全班同學進行他設計好的遊戲,來體驗一下當天所學的知識如何影響人的決策。

這是這門課我非常推薦的理由之一。

幽默感是智慧的外溢

這門課程另一個我非常喜歡的點,就是Ben Polak這位老師的幽默感。

雖然沒看到任何科學上的證據,但是我一向把能用幽默把我逗樂的人歸類為比較聰明的人。

在聽這位Ben Polak老師講課的過程中,我和班上的同學們一樣,時常被他用他那醇厚的英國腔,非常自然、若無其事地一句話逗樂。

部分情景舉例如下:

比如在講中位選民定理(Median Voter Theorem)時,這位老師需要畫一個政治立場圖展示左派和右派的位置。他在标左派人士的位置時,一邊标一邊介紹道: These extreme left-wing positions, these are people who don’t eat anything except for fruit, and they think trees should have the vote. (這些是左派人士,他們除了水果什麼都不吃,而且還認為樹也應該有投票權。)在标右派坐标時,他又介紹道: These are right-wing positions, they think the poor shouldn’t have the vote, and they eat immigrants. (這些是右派人士,他們認為窮人不配有投票權,并且他們還以移民為食。)而且這位老師說得時候還一臉嚴肅,笑死我了。

另外,他在講銀行擠兌時用到美國老電影 It’s A Wonderful Life (中譯《生活多美好》或《風雲人物》)做例子。他随口問了在場學生有多少人看過這部電影,接着對沒看過的學生說:You should know that if you have a green card, you can lose your green card if you haven’t seen It’s A Wonderful Life.(你們應該知道,如果你有美國綠卡,而你還說沒見到“生活多美好”,你的綠卡就可能被收回去;這裡是借電影名一語雙關。)我本來還在嚴肅思考課上講的知識,因為幹貨很多,信息量很大,但聽到這句實在笑得不行。

同時,我也建議大家學習一門課程,或者讀一本書時,先預判一下講授者/作者智商,看看他/她到現在這個位置,能開課或出書,主要靠的是很努力還是很聰明。如果看起來是很努力但不聰明的那種,就要謹慎聽他/她的,因為他/她主要靠堆時間才有現在的知識水平,你沒那麼多時間可堆。這點在國内文科書籍、課程上很常見。

比如你看有些文科老教授給你講曆史這種典型得不能再典型的文科,但他們除了能給你講維基百科都能查到的facts外,少有對于曆史規律的分析總結;他們有的多是感情渲染、煽情(尤其講到什麼“民族大義”之類的時候),或者似是而非、不可證僞的結論。

所以哪怕是曆史學,也應該去跟聰明的人學習看待曆史的視角。

而聰明的老師比較理想的樣子就如這位Ben Polak老師一樣,能在講授幹貨同時輕松把你逗樂,對不同陣營黑得均勻,開的玩笑在幾個派别邊緣跳舞但又不至踩線。

博弈論三元素

先說一下“博弈論”這個詞彙翻譯得實在有點過于NB,人家本來叫Game Theory,每次舉例子老師都會說這個Game如何如何,到我們中文翻譯就說這個“博弈”如何如何…

所以大家先不用聽着“博弈論”這個詞很高大尚就害怕,實際把它換成“遊戲理論”,甚至你叫它“怎麼制定遊戲策略”就親切多了。

此外,因為我系統性地學習博弈論就是從這門耶魯大學的公開課中,而且看得是英文字幕原版,所以很多詞彙我并不知道中文該怎麼翻譯,故而接下來會使用我自己的翻譯或英文原詞。

博弈論中最核心的三個元素是:Player(參與遊戲的一方)、Strategy(參與方的策略)和Payoff Matrix(各個參與方在不同策略組合下的收益矩陣,理論上大家應該共用一個,但實際由于信息不透明,每個參與方心中的都不盡相同)。

如果讓我用一句話概括,博弈論就是一門研究 如何根據他人策略改進自己策略,以期獲得更好的收益 的學科。

關鍵點在于 要根據他人的策略來改變自己的策略。當然,現實情況中每個人的策略不可能如教學中這樣明白無誤地寫出來,所以實際人們使用的是他人策略的期望來指導自己制定策略。

現在所謂的“畫大餅”可以規約到領導用極低的成本(比如空口白話)使下屬錯誤估計領導的策略,進而估計錯自己選擇努力奮鬥策略得到的收益。

在此之上,Strategic Effect(本不存在的、非直接的、由你的策略導緻的效果,我不知道怎麼翻譯,與Direct Effect相對)這個概念尤為重要,對我們制定策略有非常大的指導意義。

比如一個經典的問題是:為什麼增加女性的福利反而會導緻女性的職場利益受損?

我們按剛剛介紹的博弈論三元素來逐個分析。

Player簡化為老闆、女員工、男員工。我們接下來主要以老闆的視角看他應該如何制定策略才能收益最大。

老闆的Strategy也簡化為雇傭女員工和雇傭男員工兩種。

接下來老闆需要按照自己對兩種策略分别帶來的Payoff來制定策略。

我們這裡采用極端假設法,假設本來雇傭男女員工都不用付工資,但現在gov要求增加女性福利,規定企業雇傭女員工必須每月至少支付1個億工資。

到這裡你肯定已經懂了,但我還是會把最基本的博弈論分析流程走完。

這樣的規定就會導緻在老闆畫的Payoff Matrix中,雇傭女性所帶來的收益大概率是負的,而雇傭男性的收益還是正的。而博弈論告訴我們,每個Player都會參考自己的Payoff Matrix來選擇Strategy;那麼答案顯而易見。

所以影響他人決策的是Payoff Matrix,而不是任何人的主觀目的。我們理科生比較容易把主觀與客觀分開,但是對文科生來講有點難,雖然她們不覺得;這種差别很大程度上拜我們的教育模式所賜,文科從中學開始就在練習主觀臆斷,而理科人則一直在體驗“想得再美客觀上不work”。

那麼真正要制定策略時,一定要反複推演、模拟不同策略導緻不同玩家的收益變化,心中畫出Payoff Matrix。

在這裡,換位思考(課程中原話是Put Yourself into Other People’s Shoes)非常常用。你要站在其他Player的視角下,試着複現他們眼中的Payoff Matrix是什麼樣(不同玩家的視角下信息是不一樣的,但本文為了簡化,不再涉及Perfect Information的問題),然後思考他們會據此如何制定策略。在完成這一步後,你的反制策略就孕育而生。

博弈論也可以用來解釋為什麼曆史上總是年輕人是改革先鋒,而中老年人是頑固的保守派。

從收益矩陣的視角看,年輕人的收益矩陣初始化了沒多久,在現有規則下收益不大,所以他們會更有意願改變社會規則。

但中老年人經過幾十年的适應、改變策略,收益矩陣已經與社會制度高度契合,所以他們當然更願意維護現有制度。

有趣的教學法

這門課程中一個值得我們借鑒的點是這位老師的教學方法,我總結為用特赦的方式格外強調最重要的知識點,同時抓大放小。

在這節課開始的時候,Ben Polak老師就給學生明确指出,任何時候當你被叫起來回答問題,而你又答不上來,甚至連問題都不知道是啥時,隻要回答Nash Equilibrium(納什均衡)就可以過關。

Ben Polak老師當然知道有學生沒學習、沒聽講,但是他更善于調動學生的積極性,利用學生的求生欲來使學生自願理解一個博弈論中非常重要的知識點。

所以當真的有學生不知道答案是什麼時,至少能記住“納什均衡”這個詞,而有朝一日也或許會好奇自己每天念的“救命咒語”到底什麼意思,于是好奇心驅使下會去再查一查,這就能啟發一部分頑皮的學生。

我也很喜歡這種方法,即學一門知識如果實在記不住那麼多,就先隻弄懂最核心的那一個知識點,比如博弈論中的納什均衡、經濟學中的供求關系、健身中的核心發力、投資中的财富守恒等等。

其他更多的知識先不要管,就把這一個搞懂,學會分析運用,等到半年或一年後,再以此為根基向其他知識點進發。

課程的後半程主要講解Sequential Move Game(順序博弈?抱歉我不知道怎麼翻譯),這個“救命咒語”就變成了Backward Induction(反向歸納法?我想象中的翻譯),同樣非常巧妙地使學生深刻理解這個概念在Sequential Move Game中的重要性。

博弈論核心概念——納什均衡

如果博弈論中你隻能理解一個概念,我強烈推薦納什均衡(就是諾貝爾經濟學獎得主、電影《美麗心靈》中那位主角,約翰·納什提出的,但電影的劇情切莫當真)。

同樣,如果讓我一句話概括博弈論中的納什均衡是個什麼東東,我會說 納什均衡是一種博弈中每個參與者都不傾向于改變現有策略的局面、狀态。

我們已經知道每個參與者都會根據自己心中收益矩陣來制定策略,那麼有時候會出現雙方目前都會是最優的局面,單方面往任何方向更改策略都會導緻自己的利益受損。

為了理解納什均衡,我這裡舉幾個大家熟悉的例子并進行分析。

中國的房價問題每個人都深有體會。我們時常看到一個小區内業主組團号召誰都不許降價,或者幾個開發商組成價格聯盟,相約一起不降價。

這有可能成功嗎?學過博弈論,你應該一秒都不帶猶豫地判斷他們注定失敗,因為這種狀态沒有實現納什均衡。

不同的業主、開發商自身的資金情況不同,會有不少急需用錢需要降價銷售回款的;另一方面,不遵守聯盟約定的業主、開發商缺少嚴厲的懲罰;而房子一般不具有不可替代性(大部分房子的不可替代性都是想投機賺錢的炒房者自我欺騙時找的借口)。

多方面因素結合,注定了每個參與價格聯盟的業主、開發商的收益矩陣非常不同,也注定了它們的策略會非常不同。(還記得每個參與者的策略要依據他們各自心中的收益矩陣來制定吧?)

僅就過去幾年我所知道的國内類似的房産價格聯盟,應該無一成功。而發起這個聯盟的人,如果稍微補習點博弈論的知識,從一開始就應該放棄幻想,接受市場經濟的客觀規律。

那有沒有成功的價格聯盟呢?當然有,那就是大名鼎鼎的OPEC(石油輸出國組織)。

他們成功的原因用博弈論的理論解釋,當然是每個OPEC成員國都沒有動力去更改策略(比如偷偷增産或減産石油),所以實現了納什均衡。

那麼更進一步的問題就是,為啥這個組織就可以約束住成員國,使大家沒動力擅自行動呢?到這裡你應該意識到,答案肯定還要從每個成員國的收益矩陣入手。除非博弈的參與者沒腦子,否則他的策略一定基于他的收益矩陣。

一方面,OPEC參與者數量足夠少,好溝通協作,組織能把每個參與者的訴求了解清楚并盡量照顧到。

另一方面,鄰居、開發商與同聯盟中的其他人是陌生人間的一次性博弈,鄰居能搬走,開發商能轉行;國家與國家間是Repeated Game(多次重複博弈),别說搬離地球了,就算身邊的鄰國你都很難換掉。因此國家間往往在乎信譽,損失信譽可能丢掉的利益比賺一點石油差價獲得的更大。

再者,這些國家間有經濟等方面的制裁手段,可以嚴重懲罰違背聯盟條約的參與國;房地産價格聯盟卻基本隻能罵街、砸售樓部。

當然,任何聯盟内部都不可能鐵闆一塊,OPEC内也會有異心,畢竟世間不可能有兩個完全一樣的收益矩陣。但相較于國内這些房地産價格聯盟,OPEC已經足夠成功。

那麼當博弈中有無數個個體參與者時,如何才能有效達成納什均衡,使本來競争的個體參與者長期都能獲得更高收益?

答案可以參考歐美的工會,強制每一個勞動者加入工會,工會也統一行動,為勞動者争取權益,同時也對“工賊”窮追猛打。

這樣一番下來,可以使所有該行業的勞動者的收益矩陣趨于一緻,也就不容易被雇主分而治之、各個擊破了。

類似的情況還有黑道打破囚徒困境的辦法。

囚徒困境大家都知道,即警方審訊兩個犯罪分子,對每個犯罪分子的政策是 如果他和對方互相指認,那他們兩個都判3年;如果一方指認另一方,而另一方沒有指認他,則他拘留1周,對面判10年;兩人都不互相指認,則各判1年。

經過仔細推演,人們得出無論對方選擇什麼策略,己方策略都是指認對方;而且己方也知道對方知道這一點;所以最終結果就是雙方一定都互相指認(用博弈論的話說,互相指認是一個dominating strategy)。

看吧,這就是一個納什均衡,雙方誰都不會主動改變策略。

為此,黑道進化出了緘默原則,即無論任何情況任何幫派,隻要混道上的人向警方指認同為道上的人,那所有幫派都視其為死敵,等他一出獄,就不分派别全都追殺他。

所以我們經常看到電影中,全世界的黑幫無論怎麼死鬥,反正有一條大家都絕對不幹,就是跟警方合作。

這樣每個被抓的幫派成員知道,指認對方哪怕自己能早出獄,但出獄後必死無疑;而且每個幫派成員也都知道其他幫派成員知道這一點,所以大家能形成默契,互相信任,在被單獨審訊時候拒絕指認,甯可被關1年。

而且一般關過出來的兄弟,幫派也都會給予額外的補償。

這樣一番操作,就改變了每個幫派成員的收益矩陣,使得大家沒有立場互相指認,也就達成了另一種納什均衡,對黑道更有利的納什均衡。

在雙寡頭模型(Duopoly)中更容易實現納什均衡。

曾經有個故事,一個百事可樂的中層想帶着一份商業機密跳槽到可口可樂(也可能反過來,時間隔太久記不清細節了),但是可口可樂拒絕了并把此事告訴百事可樂。

毫無疑問,可口可樂和百事可樂作為碳酸飲料行業的雙寡頭已經實現了納什均衡,沒有任何一方有動力破壞現有的平衡。

試想如果可口可樂接受了商業間諜的要價,那麼自然就會有自己這邊的機密被竊取到百事那邊,最終可口可樂和百事可樂雙方的市場地位大概不變,但各自都要額外花錢買商業機密來維持地位。

那就會使雙方進入到一個次一檔的納什均衡。所以他們雙方的高層都會極力避免打破均衡。

足球中皇馬和巴薩間也有個互不挖角的君子協定,道理類似。

如果雙方加價挖角對方的球員,那自己再想留住球員就也要高價,最終雙方的球員還是那些球員,但俱樂部出的錢卻多了,便宜了來回跳槽的球員。

現有的君子協定使雙方在轉會策略上實現了納什均衡。

ETF(開放型指數基金)定價機制中也蘊含了納什均衡。

一般一份ETF對應按比例配置的若幹種股票,那麼ETF的價格應該等于這些股票價格的加權之和;但另一方面,我們都知道價格永遠由供求關系決定,這是一級鐵律。那麼問題來了,當有人故意出極高或極低價成交ETF時,ETF價格和對應股票價格出現分歧怎麼辦?這不就成了一份ETF兩個價格了嗎?

實際如果真有人出極高或極低價格成交ETF,成交價遠離标的物的真實價格,那麼這種價格狀态不能實現納什均衡,能與ETF發行商直接進行贖買的Authorized Participants(不理解的朋友就把AP們當成中間商)有傾向利用套利空間,去低價購買股票兌換成高價的ETF再賣出,或者低價購買ETF後贖回成高價的股票再賣出。

最終經過中間商套利,ETF價格還是能回歸其對應的标的物價格,中間商也無套利傾向,各交易方策略回歸納什均衡狀态。

更大的視角來自于借助納什均衡剖析曆史問題。

我們上中學時都學過堯舜的禅讓制和大禹的夏朝家天下。我還記得當時老師說家天下是社會的進步,然後blabla論證一堆。我不知道各位什麼感覺,當時的我其實沒聽懂,也沒接納那些解釋。

因為我中學時代就很喜歡曆史,業餘時候也在想到底是為什麼家天下取代禅讓制是進步?不是應該選賢繼位嗎?你可以說夏朝相較于以前的堯舜時期較為先進,但不能直接推導出夏的繼承制度就比堯舜時期的先進。

這個問題困擾了我很久,雖然中間也聽過一些曆史學文科生的解釋,但說實話我認為都比較牽強,沒有一個能說服我。

直到十幾年後我學了博弈論,這個問題我才自己有了一個答案。

首先,文科生研究曆史的一個的問題就是總忽略社會的客觀性,我前邊提到過,這裡再強調一次。所以他們的叙事中經常以某個人為主導,強調這個人主觀意願或者能力如何,還喜歡主觀給事物加褒貶不一的評價。

回到“為什麼家天下比禅讓制先進”這個問題,以我現在的視角看,“先進”、“進步”這些詞彙本身就有問題,充滿了主觀臆斷。

換句話說,“先進”是你這個曆史學文科老師自己定義的概念;如果你這麼定義了家天下比禅讓制“先進”,那家天下自然比禅讓制“先進”,不需要論證。但她們當時又不得不說點什麼,于是叽裡呱啦說了一堆;而且當時她們掌握考試的評分權,所以她們說什麼學生都得認為對。

但回到二裡頭-夏朝,當時社會的客觀規律中不存在“先進”這個概念,所以要真正理解這種繼承制度的轉變原因,首先要把文科生主觀給曆史貼的标簽丢掉。

繼承制度轉變的原因理解起來可以說quite simple but not easy,那就是 禅讓制不能實現一個納什均衡,而家天下可以。

設想一個國家,下一任領導人由現任領導人選擇。如果現任領導人賢德、不貪權,那麼就會把權力完全移交給下一任賢德但不一定和自己有血緣關系的人;而如此往複數代,總有一代領導人貪戀權力(你不能指望代代出聖人),那麼他就會利用現在手中的權力更改繼承規則,使其對自己有利。

所以禅讓制,以及後世一些國家内部推舉領導人的制度,本身就不能構成一個納什均衡,被選上的領導人有傾向更改規則,使自己或自己的血親連任下去。這樣的制度開始時是能碰到一些還算賢德、遵守規則的人,但局勢改變是早晚的事,總有一任領導人會改策略,使繼承遊戲達到一個納什均衡,通常就是家天下。

羅馬帝國的崩盤一大根本原因就是繼承制并不能實現納什均衡,地方軍閥勢力都有造反的傾向;而羅馬的繼承問題重新得以解決,就是靠基督教的君權神授使朝局恢複納什均衡。

如果你不想出現權力世襲的情況,那麼從一開始就應該設計一種能實現納什均衡的繼承制度。後世西方已經給出了答案。我并不認為西方人道德就是高,或東方人道德就是低,是制度使然。

曆史上著名的Pax Roma(羅馬治下的和平)也可以用納什均衡來解釋。

在羅馬治下的地中海地區,任何地方勢力都有兩種選擇:1)反抗羅馬+獨立自主;2)交點保護費給羅馬+專心掙錢不設防。

當羅馬的實力強大到一定程度時,1)這條路線是傻子才會選的。自然而然,所有地方勢力都選擇臣服于羅馬,交稅并且安心發展經濟、文化、科學事業,不用擔心安全問題,因為有羅馬保護自己。

而且當所有周圍小邦都這樣想時,戰事也消失了,因為任何小邦占周圍鄰居的便宜,都有羅馬爸爸來敲打,讓各位小弟不要内鬥。

這樣每個小邦也根本不用擔心會被附近其他羅馬爸爸的小弟捅一刀。

這個納什均衡在過去半個世紀的名字叫Pax America(美國治下的和平)。

冷戰時期美蘇互相因為有了核威脅,所以促成了世界安全局勢達成納什均衡,沒有任何一方敢輕舉妄動。

翻開史料,古巴導彈危機時肯尼迪總統劃定的蘇軍撤離最後期限已過,美軍又在古巴鄰海發現了一艘蘇軍潛艇,因為這艘潛艇有通訊問題,接收撤離命令晚了。

在前線海軍向白宮請求攻擊命令時,肯尼迪趕緊制止,命令前線美國海軍假裝沒看見,放蘇聯潛艇溜走。

蘇聯這邊,赫魯曉夫收到小道消息,蘇聯還不宣布古巴事件終止,肯尼迪就會在美國時間中午向蘇聯宣戰。

赫魯曉夫來不及核實信息真僞,立刻宣布終止在古巴部署軍事設施的計劃。實際這是一則假消息,肯尼迪根本沒有宣戰計劃。

古巴導彈危機非常有趣,兩大軍事陣營看似劍拔弩張、一觸即發,但實則都小心翼翼,生怕一不小心地球毀滅。

認慫和在核戰中同歸于盡,雙方領導人不約而同選擇了認慫。

冷戰之所以沒有升級成熱戰,可以說是核武器的Strategic Effect。

而我們現在體制内和體制外單位的技術人員局面也沒達到一個納什均衡。

體制内技術人員的水平如果高了,就更有傾向跳出體制掙大錢,體制的保底機制對他不起作用。

另一方面,技術差的人更需要保底,所以會非常熱衷擠進體制。

在現有局面下,體制内的高水平技術人才一定會不斷外流,進而導緻體制内單位的技術越來越差。

我身邊的例子是 部分大學的輔導員甚至還需要手工進行很多機械重複的工作,需要幹一下午、一晚上。

但如果用程序,一般不到10秒完成。

我的程序員朋友凡是談對象找的是大學輔導員的,基本都幫忙幹過這活。

直到體制内的技術人員完全都是菜鳥,出了體制無法掙錢,那麼新的納什均衡才會實現。

Evolutionary Stability (生物進化穩态)本質上也是一種納什均衡,但礙于篇幅,我這裡就不多介紹生物學專業的概念。這門課程中有兩節專門講解生物進化中的博弈論。

此外,當你學完納什均衡有關的幾節課後,再回頭看《三體》中羅輯賭上性命的一搏,對三體人的威懾,就能理解三體人為什麼不敢輕舉妄動了。

信譽的重要性

在多次重複博弈中,信譽是個對收益極其極其重要的影響因素。雖然每個人口中都知道說誠實守信,但我認為很多人還是低估了它的重要性。

大部分時候人們都無法立刻兌付許諾的利益,或者無法在法律文書中窮盡各種情況和約束。

那麼促使雙方達成合作的一個重要因素就是雙方的個人信譽。

而且任何資源和權力授權給某人,不僅僅看的是某人的專業技能和身份,還有其個人信譽。

對我而言,感受信譽對決策影響最大的方面就是購物;我極其認牌子。

作為計算機人,我年輕的時候買電子産品也會扒着參數比對,看網上的各種評測;但是後來事情多了,沒有那個精力細細深究。

所以我轉變策略,從買具體産品到買我認可的公司。

在所有品牌中,我最信任蘋果。任何時候如果我需要換手機,可以直接下單iPhone的旗艦款,根本不需要看裡邊的參數列表和網絡評測。

很多參數不能展現的使用體驗,我默認蘋果都已經做到最好,替我選了最優方案。我所需要做的就是付一個高價完事。

而其他很多安卓品牌,我默認它們在沒展示的地方,都選了最廉價的解決方案,或者打算在沒有告知我的情況下在系統中夾帶私貨。

與蘋果相反的例子就是華為。這個品牌可以說毫無榮譽感可言。

我至今仍然非常費解,華為的高層是在喝了多少的情況下才允許手下搞出“華為鼎橋”這種東西?

華為搞了個“華為鼎橋”手機,在名字中與華為打擦邊球,故意誘騙消費者高價買這種低配手機,同時為了規避法律風險,訓練業務員永遠說“這是華為智選手機”,不回答這是還是不是華為手機。

如果我是華為的決策者,有人提出這樣一個商業計劃,我一定會懷疑這人腦子裡裝的什麼?!

你無法想象蘋果公司會搞出“蘋果智選”這種事。甚至我猜測,如果有人給Steve Jobs提這個方案,繪聲繪色地描述怎麼能大賺一筆還不用擔法律風險,Steve Jobs肯定會當場破口大罵,忍不住要丢水杯過去,并當場fire掉這個人,甚至還要追查這個人是怎麼進入蘋果的。

“鴻蒙不是安卓”這種言論就是對我們計算機人智商的侮辱。

偷換配置材料、陷害自己的員工、抹黑其他品牌等等劣迹,有一條就足夠進入我的黑名單,華為能進十次。

我很佩服華為高層對屬下砸自己牌子的容忍度,但我更佩服廣大愛國的消費者們對毫無信譽的品牌的容忍度。

如果越南科技的未來要靠這樣的公司撐起來,那越南科技就沒有未來。

不管選擇購買一款産品,還是交朋友,還是商業合作談一個項目,我的一個有效的經驗是:默認信任對方,同時留足應對對方一次欺騙的buffer。

如果發現對方算計你算計得很清楚(好聽點說對面很精明),那麼就心中默默把對方拉黑,不再合作。

如果對方在沒有約束的情況下,依然恪守承諾,沒有任何暗地裡占便宜的行為,則可以增加對對方的信任。

一般我隻會留給對方欺騙一次的機會,一次即永久拉黑;而且這一次不一定是針對我的欺騙,我觀察到對于其他人的也一樣。

華為的種種劣迹并沒有任何一次傷到我,但我依然堅決把它拉黑。

另一方面,一個人對弱者的态度是我心中極其重要的指标,比如領導對下屬、導師對學生、官員對平民等。

沒有強制力約束,如果對方還能堅持守約,那值得信任的可能性就增大。

人(公司)是對的,事情就會接二連三做對;人(公司)是錯的,事情就會接二連三出錯。

所以我始終不認可“對事不對人”,一直堅持“對人不對事”。

對的人也可能犯錯,但隻要是對的人就不用太擔心。

人生在很多關鍵事情上首要考慮的是選對的人。信譽就是一個極其重要的參考指标。

還有個關于信譽有趣的例子。

我當年看GoT時已經學過博弈論。所以當我看到蘭尼斯特家那句著名的A Lannister Always Pays His Debts時,發覺這比其他家族的座右銘有信息量多了。

Tyrion在鷹巢城和Jamie落在Lord Bolton手中時,都靠着這句座右銘背後的家族信譽得以幸存。

信譽的價值在此體現得淋漓盡緻,也難怪獅子家越做越大。

用Winter is Comming這種天氣預報當座右銘的狼家腦子是不怎麼好使。

底線思維一定要有

當你的收益矩陣是明牌時,對方就吃準了你的底線,進而可能吃定你。

比如國内所謂“體制内”的工作被稱為“鐵飯碗”,看起來很美好,誰都不能開除你,我以前也一直這樣以為。

但後來我突然意識到,這其中有陷阱,那就是每個體制内的人的收益矩陣幾乎都是明牌。

其他上級很容易吃準你的底線,攤派給你剛剛好保證你不主動辭職的任務量(關系戶另算)。

因為你為了進入這個體制,拿到心中的“鐵飯碗”,一定會自我閹割很多天然的生存技能,比如我們計算機人去了體制内的技術都會逐漸退化,酒量反而漸長。

你的技能逐漸變得離開了體制毫無用處。這時候,你的收益矩陣非常明确,不服從體制會變得生存都成問題。

進而,領導可以半夜給你發消息讓你淩晨加班;周末随意安排你學習報告精神;工資福利說降就降。

因為你被吃準了底線,已經沒有其他策略可選;離開體制餓死,或者留在體制足夠累且有飯吃,你選哪個?

落到這一步怎麼辦?應該是沒什麼辦法,如果有辦法那博弈論這門學科要改寫了。

所以大部分人的策略是拼命再拼命往上爬,不顧一切擺脫如此被動的地位。更好的策略是,不要讓自己落到沒有别的策略可選,被人完全吃準的境地。

延遲退休、社保繳費額、獨生子女政策等一系列法律法規,gov都可以肆意修改規則,這背後根本的邏輯就是吃準了我們不可能revo。

隻要被吃準底線,那你早晚會隻拿到一個最低價。

國内經常傳出研究生被導師壓榨的新聞,這個道理一樣。研究生在3年-5年内退出的代價極高,所以研究生的收益矩陣在幾年内也是明牌:退出并付出極高代價,還是忍一忍畢業,大部分研究生隻能選後者。而一旦畢業了,導師也會突然變得“客氣”很多。

導師吃準了學生的底線,所以就可以讓學生為自己幹各種雜活項目,或者自由分配學生工作的作者排名。

但這種情況有一個例外,就是導師壓榨太過把學生要逼死了。

這時候學生的收益矩陣就變了:忍一忍生不如死,還是死個痛快并拉一個墊背的,有學生就豁出去了。

導師們大部分不會太出格,搞得兩敗俱傷。所以現在國内高校中的納什均衡就是 導師适當用用學生,同時盡量放學生安全畢業。

在這種納什均衡下,導師和學生都沒有傾向改變策略。

我自己還經曆過一個切身的例子就是選擇筆記軟件。

大約十年前我要選擇一款筆記軟件作為自己的主力學習工具,當時國内市面上最著名的是印象筆記和有道雲筆記。

經過一番研究,我發現有道雲筆記不能直接導出通用格式的筆記,所以即使之後不想用了,也不能輕易換軟件,因為你的筆記都導不出來。

我一看好家夥,“挾筆記以令用戶”啊這是,于是一開始我就不選有道,而選擇了印象筆記;否則我越使用下去,有道手中的籌碼就越大,越有可能不斷踩踏我的底線。

在作為付費會員用了國内版印象筆記十年後,我看到越來越多以Notion為代表的新一代筆記軟件誕生,想試用一下。

結果我意外發現國内版印象筆記已經無法導出通用格式到其他筆記軟件了,而我明明記得這個功能一直都有。

又經過一番調查,我發現在不久前的一次版本更新中,國内版印象筆記暗自偷偷地把導出通用格式功能給去掉了,更新報告中沒說;而國際版印象筆記則沒問題,依然可以随便導出。

行了,到這裡我心中已經判了國内版印象筆記死刑,哪怕我還有會員沒過期也直接不要了。

瞞着用戶悄悄幹這種事情,想靠耍小心眼留住用戶?我可以接受你大大方方漲價,但不能接受耍小心眼算計用戶。

我當時甯可所有筆記不要,也不會容忍這種行為得逞。但好在我是程序員,在Github上找到有程序能調用老的印象筆記的接口自動導出筆記,我改了改,直接把自己的印象筆記全部内容搬進了Notion。

類似這樣的小事大家千萬不要容忍,這是不斷在試探用戶的底線。當你原本的底線被踩到了就應該“誓死抵抗”,不然“今日割五城,明日割十城”,将再無翻盤可能。

那麼該怎樣避免被吃準底線,維護自己的利益呢?我從當初學習博弈論後也一直在想這個問題。

智豬博弈中,這頭聰明的豬最開始可以掩飾自己的智商,不要展現得太強;另一方面可以誇大自己扛饑餓的程度,使得其他豬不期待能熬過你。

《三體》中程心就被三體人吃準了底線,而且吃得非常死;她接手執劍人後三體人動手一秒都不帶猶豫。

相反,三體人認為維德是惡魔,威脅指數100%,别說吃準維德的底線了,就稍有不慎讓他不開心,自己可能就有滅頂之災。

但讀過書的我們都知道,維德其實不是瘋子,内心反而非常冷靜、柔軟。他隻是為了保護地球,不得不誇大自己的瘋狂程度,甚至讓三體人都産生了戰略誤判。

确定性的重要性

在這門課程中,還有一個對我啟發很大的知識點——叠代剔除(Itarative Deletion)。

它在課堂上與中位選民定理一起介紹,但由于國人對選舉比較陌生,我這裡打算用投資的例子講解。

股票等投資品中有遠期的利好和利空,總能即時反應到此刻的股價上。

試想有一個大後天發生的利空,那麼可以倒推出後天沒人會高價買該資産;後天沒人高價買,那明天高價買的就也無法出手,所以明天也不會有人高價買;以此類推,最終此時此刻的資産價格就會下跌。

理論雖如此,現實情況中有兩點不同:1)利好、利空的時間隔太長,容易發生不确定性,影響價格傳導;2)投資投機者不全都足夠理性,會受情緒、信息、知識等多方面影響而對顯而易見的結果視而不見,對未來抱有不切實際的幻想。

我寫這篇評論文章時,美聯儲還在努力把國債收益率維持在5個百分點左右,但黃金期貨和比特币等抗通脹投資品已經開始拉升。

這背後的邏輯就可以用叠代剔除解釋:1) 大家知道你FED維持高息已經到了強弩之末,量化寬松就在眼前,确定性非常大,哪怕你短期不降息,但你有本事一年内一直不降?2)這類商品的國際投資者的知識和信息都更充分,控制情緒的經驗也更豐富,對未來的預期更明确。

信息傳遞的重要性

服從性測試大家都已經非常熟悉了,包括但不限領導勸酒、女朋友要520紅包、滿清剃發等。

這些服從性測試本質上是在估計被試者的收益矩陣,判斷自己在對方心中價值幾何。

所以這些測試本身必須借助沒用的事物進行,否則你就無法判斷對方究竟是在乎你才這麼做,還是真的需要才這麼做。

信息交換是服從性測試中最重要的事。

與之類似,一些看似形式主義的細節其實也能傳遞巨大的信息量。

蘋果公司對産品外包裝設計都極其嚴格,喬幫主當年為了産品發布會的演練也非常敬業,這都是在告訴消費者,我們是一家很要臉的公司,是一家非常在乎品質的公司。這個信息傳遞出來,那些錢和精力就沒白花。

簡曆中如果有錯字,那傳遞出來的信息是非常非常差的。Presentation、Demo時,如果選手準備了幾種不同格式的Slides和數據線,以求在現場萬無一失,那即時沒用上,傳遞出來的信息也讓人知道這位候選人非常靠譜。

在合同中加入簡單瑣碎的奇葩要求,可以有效識别合作方有沒有認真閱讀合同,盡職盡責情況如何;比如規定對方當天要為你準備一杯裝買M&M豆的糖果杯,其中紅綠黃三種顔色的糖豆分别有33、29、41顆,這樣你如果當天在一杯中數下來真的有這麼多三色糖豆,那大概率合作方對其他合同細節也履行得很完善。

還有一些曆史中常見的形式主義,也扮演了信息傳遞中的重要角色,隻不過和服從性測試是反向的——阻止信息傳遞。

經常造反的朋友都知道,造反需要預先估計大多數人對gov的态度,以求自己振臂一呼能一呼百應。

沒有人喜歡站在失敗者的一邊,所以大部分人遇到他人造反都會先觀望,判斷誰會獲勝,然後肉身下注。

皇帝最怕的就是底下人搞串聯,幾個人互相瞅着對方都有反意,然後互相暗示、傳遞信息給彼此,把共有知識(Mutual Knowledge)變成了共識(Common Knowledge)。(這倆的區别在于,前者大家都這樣想,但彼此不知道對方怎麼想;後者大家都這麼想,而且都知道所有人也這麼想。)

那麼隻有朝堂上一大片人擁有了“我們都想推翻這個皇帝”的共識時,才容易有人第一個站出來造反,因為這個人必須确保自己站出來後有大家能跟上。

作為皇帝,你深知對你不滿的共有知識是一定存在的,但隻要阻止這種不滿形成共識,你就可以高枕無憂。

現在就到了各種形式主義登場的時間,比如率領文武百官祭拜宗廟,或者強迫所有人為自己歌功頌德,挑幾個關鍵大臣住持學習自己的講話。

這些形式主義不僅僅滿足皇帝個人的虛榮心,更重要的是刷新了群臣間的共識緩存。

比如老張和老李同朝為官,倆人都對皇帝不滿,互相抛媚眼傳遞這種信息。但有一天老李上朝發現老張在拍皇帝的馬屁,而且群臣也都在附和,那老張對老李的信任就必須重新建立;而老李也會知道今天過後,老張不再信任自己。

皇帝為了不停地刷新共識緩存,就要不停地搞個人崇拜、形式主義。

另外,《三體》中的猜疑鍊這種信息傳遞問題現實中不會那麼嚴重。

比如計算機網絡通信中,TCP協議會要求“三次握手,四次揮手”就足夠建立可信的連接了。

還有一種博弈是合作博弈(Cooperation Game),你主動為其他參與者提供更多關于你的真實信息,反而會使你(很多時候也包括對方)更加受益。

還是使用前邊介紹納什均衡時使用的冷戰的例子。

試想,如果冷戰中一方不知道另一方有核武器,那麼就錯誤估計了對方的收益矩陣和潛在的策略,進而估計錯自己的。

比如美國不知道蘇聯有核武器和遠程投射能力,那就真如電影Dr. Strange Love中的場景一樣,美國想核平一部分蘇聯,占盡對方便宜;結果蘇聯挨打後隻剩下單方面GG和同歸于盡兩種選擇,那毫無疑問不能單方面GG。

于是美國本來隻想占便宜,結果自己突然也挂了。

所以越南軍演和三胖搞核試驗,就怕美帝沒看見,故意在展示“我也有核武器,你不要誤以為我會單方面GG”。

從博弈論的視角看,核武器的作用主要體現在沒發射以前,發射後就是同歸于盡不新鮮了。

所以世界頂級軍事集團間都會開設軍事轉線,及時溝通真實意圖,避免戰略誤判導緻同歸于盡。

拍賣模型

最後簡單提一下課程結尾的拍賣模型介紹。我以前還真沒想過拍賣有什麼可研究的。

我們通常熟悉的都是Open Ascending Auction(公開最高價成交)的拍賣模型。理論上,如果當前叫價不高于拍賣品的真實價值,那麼總會有人加價,直到有人加到超出拍賣品的真實價值為止。

所以大部分拍賣品的成交價都有一定高估。

另外,The Second Price Sealed Auction(密封二價拍賣)是個天才的想法,即叫價最高者成交,但隻需支付叫價次高的價格,如果加上密封則是完全不知道他人叫價,避免有人串通控制拍賣。

據說Google AdWords的廣告位競拍就是用這種的加權版本(權重是Google自己計算的競标廣告質量、與關鍵詞的契合度)。

這種拍賣方式的一個優點是能将叫價中的買家的意願、對拍賣品的真實估價,以及買家最終支付的價格區分開;課堂上能推導出,在這種拍賣模型中,參與者叫自己心中真實的估價是最優策略。

而傳統的“公開最高價成交”中,參與競拍者可以先不叫自己心中真實的估計,取而代之從一個極低的價格叫起,試探拍賣者的底線。

更多關于拍賣模型的分析可以在該系列課程的最後一講中看到。

版本選擇

這門課程放出來的公開錄制隻有2007年一學期的,在YouTube的Yale Open Course頻道可以觀看,中文版網易公開課有。

另外,建議每次聽講完對着網絡上公開的課堂講義複習,并做一下期中和期末考試題。