课程质量:★★★★★ 喜爱程度:第5名时长:24讲/每讲70分钟 学习年份:2017年这门课程的预修知识

按道理来说,博弈论是经济学下的学科,一般会需要一点点经济学和数学(尤其微积分)基础。

但这门课相当入门,基本上完全不需要经济学基础;我在当初学习这门课的时候,甚至连课上老师画的需求曲线(Demand Curve)都不认识,但完全不影响我理解博弈论。

同时这门课对数学的要求非常非常低,所以文科的朋友不用害怕;Ben Polak老师甚至做一次“求导令等零求极值”都要安慰大家不懂没关系,而且很多地方其实用矩阵解释很方便,但老师就是不提,为了照顾没有接触过线性代数的通信。

我也是听这门课后真切感受到,国外的大部分学生的数学训练确实不如国内学生严苛,堂堂耶鲁居然也都这样。这些东西国内985的学生不知道,会被当成智障看。

总体来讲,数学和经济学基础都不是这门课的预修知识;这门课我认为没有预修知识,大家放心听。

现在网络上有不少其他博弈论课程,专为网课学生录制,课件制作更精良。但我仍然推荐大家跟着这门2007年录制的耶鲁大学公开课学习,哪怕老师只能用板书,摄像机只有一个机位。

因为博弈论这门课程是研究人与人互动的学科,所以我们最好能观察到人类在不同博弈中的真实反映,能极大加深我们对知识的理解。

后续的大部分网课主要是对着课件录屏讲解(如Coursera、YouTube上的其他博弈论课程),缺少真实互动演示;而这门Ben Polak老师的公开课每节课上半段讲解知识,下半段让全班同学进行他设计好的游戏,来体验一下当天所学的知识如何影响人的决策。

这是这门课我非常推荐的理由之一。

幽默感是智慧的外溢

这门课程另一个我非常喜欢的点,就是Ben Polak这位老师的幽默感。

虽然没看到任何科学上的证据,但是我一向把能用幽默把我逗乐的人归类为比较聪明的人。

在听这位Ben Polak老师讲课的过程中,我和班上的同学们一样,时常被他用他那醇厚的英国腔,非常自然、若无其事地一句话逗乐。

部分情景举例如下:

比如在讲中位选民定理(Median Voter Theorem)时,这位老师需要画一个政治立场图展示左派和右派的位置。他在标左派人士的位置时,一边标一边介绍道: These extreme left-wing positions, these are people who don’t eat anything except for fruit, and they think trees should have the vote. (这些是左派人士,他们除了水果什么都不吃,而且还认为树也应该有投票权。)在标右派坐标时,他又介绍道: These are right-wing positions, they think the poor shouldn’t have the vote, and they eat immigrants. (这些是右派人士,他们认为穷人不配有投票权,并且他们还以移民为食。)而且这位老师说得时候还一脸严肃,笑死我了。

另外,他在讲银行挤兑时用到美国老电影 It’s A Wonderful Life (中译《生活多美好》或《风云人物》)做例子。他随口问了在场学生有多少人看过这部电影,接着对没看过的学生说:You should know that if you have a green card, you can lose your green card if you haven’t seen It’s A Wonderful Life.(你们应该知道,如果你有美国绿卡,而你还说没见到“生活多美好”,你的绿卡就可能被收回去;这里是借电影名一语双关。)我本来还在严肃思考课上讲的知识,因为干货很多,信息量很大,但听到这句实在笑得不行。

同时,我也建议大家学习一门课程,或者读一本书时,先预判一下讲授者/作者智商,看看他/她到现在这个位置,能开课或出书,主要靠的是很努力还是很聪明。如果看起来是很努力但不聪明的那种,就要谨慎听他/她的,因为他/她主要靠堆时间才有现在的知识水平,你没那么多时间可堆。这点在国内文科书籍、课程上很常见。

比如你看有些文科老教授给你讲历史这种典型得不能再典型的文科,但他们除了能给你讲维基百科都能查到的facts外,少有对于历史规律的分析总结;他们有的多是感情渲染、煽情(尤其讲到什么“民族大义”之类的时候),或者似是而非、不可证伪的结论。

所以哪怕是历史学,也应该去跟聪明的人学习看待历史的视角。

而聪明的老师比较理想的样子就如这位Ben Polak老师一样,能在讲授干货同时轻松把你逗乐,对不同阵营黑得均匀,开的玩笑在几个派别边缘跳舞但又不至踩线。

博弈论三元素

先说一下“博弈论”这个词汇翻译得实在有点过于NB,人家本来叫Game Theory,每次举例子老师都会说这个Game如何如何,到我们中文翻译就说这个“博弈”如何如何…

所以大家先不用听着“博弈论”这个词很高大尚就害怕,实际把它换成“游戏理论”,甚至你叫它“怎么制定游戏策略”就亲切多了。

此外,因为我系统性地学习博弈论就是从这门耶鲁大学的公开课中,而且看得是英文字幕原版,所以很多词汇我并不知道中文该怎么翻译,故而接下来会使用我自己的翻译或英文原词。

博弈论中最核心的三个元素是:Player(参与游戏的一方)、Strategy(参与方的策略)和Payoff Matrix(各个参与方在不同策略组合下的收益矩阵,理论上大家应该共用一个,但实际由于信息不透明,每个参与方心中的都不尽相同)。

如果让我用一句话概括,博弈论就是一门研究 如何根据他人策略改进自己策略,以期获得更好的收益 的学科。

关键点在于 要根据他人的策略来改变自己的策略。当然,现实情况中每个人的策略不可能如教学中这样明白无误地写出来,所以实际人们使用的是他人策略的期望来指导自己制定策略。

现在所谓的“画大饼”可以规约到领导用极低的成本(比如空口白话)使下属错误估计领导的策略,进而估计错自己选择努力奋斗策略得到的收益。

在此之上,Strategic Effect(本不存在的、非直接的、由你的策略导致的效果,我不知道怎么翻译,与Direct Effect相对)这个概念尤为重要,对我们制定策略有非常大的指导意义。

比如一个经典的问题是:为什么增加女性的福利反而会导致女性的职场利益受损?

我们按刚刚介绍的博弈论三元素来逐个分析。

Player简化为老板、女员工、男员工。我们接下来主要以老板的视角看他应该如何制定策略才能收益最大。

老板的Strategy也简化为雇佣女员工和雇佣男员工两种。

接下来老板需要按照自己对两种策略分别带来的Payoff来制定策略。

我们这里采用极端假设法,假设本来雇佣男女员工都不用付工资,但现在gov要求增加女性福利,规定企业雇佣女员工必须每月至少支付1个亿工资。

到这里你肯定已经懂了,但我还是会把最基本的博弈论分析流程走完。

这样的规定就会导致在老板画的Payoff Matrix中,雇佣女性所带来的收益大概率是负的,而雇佣男性的收益还是正的。而博弈论告诉我们,每个Player都会参考自己的Payoff Matrix来选择Strategy;那么答案显而易见。

所以影响他人决策的是Payoff Matrix,而不是任何人的主观目的。我们理科生比较容易把主观与客观分开,但是对文科生来讲有点难,虽然她们不觉得;这种差别很大程度上拜我们的教育模式所赐,文科从中学开始就在练习主观臆断,而理科人则一直在体验“想得再美客观上不work”。

那么真正要制定策略时,一定要反复推演、模拟不同策略导致不同玩家的收益变化,心中画出Payoff Matrix。

在这里,换位思考(课程中原话是Put Yourself into Other People’s Shoes)非常常用。你要站在其他Player的视角下,试着复现他们眼中的Payoff Matrix是什么样(不同玩家的视角下信息是不一样的,但本文为了简化,不再涉及Perfect Information的问题),然后思考他们会据此如何制定策略。在完成这一步后,你的反制策略就孕育而生。

博弈论也可以用来解释为什么历史上总是年轻人是改革先锋,而中老年人是顽固的保守派。

从收益矩阵的视角看,年轻人的收益矩阵初始化了没多久,在现有规则下收益不大,所以他们会更有意愿改变社会规则。

但中老年人经过几十年的适应、改变策略,收益矩阵已经与社会制度高度契合,所以他们当然更愿意维护现有制度。

有趣的教学法

这门课程中一个值得我们借鉴的点是这位老师的教学方法,我总结为用特赦的方式格外强调最重要的知识点,同时抓大放小。

在这节课开始的时候,Ben Polak老师就给学生明确指出,任何时候当你被叫起来回答问题,而你又答不上来,甚至连问题都不知道是啥时,只要回答Nash Equilibrium(纳什均衡)就可以过关。

Ben Polak老师当然知道有学生没学习、没听讲,但是他更善于调动学生的积极性,利用学生的求生欲来使学生自愿理解一个博弈论中非常重要的知识点。

所以当真的有学生不知道答案是什么时,至少能记住“纳什均衡”这个词,而有朝一日也或许会好奇自己每天念的“救命咒语”到底什么意思,于是好奇心驱使下会去再查一查,这就能启发一部分顽皮的学生。

我也很喜欢这种方法,即学一门知识如果实在记不住那么多,就先只弄懂最核心的那一个知识点,比如博弈论中的纳什均衡、经济学中的供求关系、健身中的核心发力、投资中的财富守恒等等。

其他更多的知识先不要管,就把这一个搞懂,学会分析运用,等到半年或一年后,再以此为根基向其他知识点进发。

课程的后半程主要讲解Sequential Move Game(顺序博弈?抱歉我不知道怎么翻译),这个“救命咒语”就变成了Backward Induction(反向归纳法?我想象中的翻译),同样非常巧妙地使学生深刻理解这个概念在Sequential Move Game中的重要性。

博弈论核心概念——纳什均衡

如果博弈论中你只能理解一个概念,我强烈推荐纳什均衡(就是诺贝尔经济学奖得主、电影《美丽心灵》中那位主角,约翰·纳什提出的,但电影的剧情切莫当真)。

同样,如果让我一句话概括博弈论中的纳什均衡是个什么东东,我会说 纳什均衡是一种博弈中每个参与者都不倾向于改变现有策略的局面、状态。

我们已经知道每个参与者都会根据自己心中收益矩阵来制定策略,那么有时候会出现双方目前都会是最优的局面,单方面往任何方向更改策略都会导致自己的利益受损。

为了理解纳什均衡,我这里举几个大家熟悉的例子并进行分析。

中国的房价问题每个人都深有体会。我们时常看到一个小区内业主组团号召谁都不许降价,或者几个开发商组成价格联盟,相约一起不降价。

这有可能成功吗?学过博弈论,你应该一秒都不带犹豫地判断他们注定失败,因为这种状态没有实现纳什均衡。

不同的业主、开发商自身的资金情况不同,会有不少急需用钱需要降价销售回款的;另一方面,不遵守联盟约定的业主、开发商缺少严厉的惩罚;而房子一般不具有不可替代性(大部分房子的不可替代性都是想投机赚钱的炒房者自我欺骗时找的借口)。

多方面因素结合,注定了每个参与价格联盟的业主、开发商的收益矩阵非常不同,也注定了它们的策略会非常不同。(还记得每个参与者的策略要依据他们各自心中的收益矩阵来制定吧?)

仅就过去几年我所知道的国内类似的房产价格联盟,应该无一成功。而发起这个联盟的人,如果稍微补习点博弈论的知识,从一开始就应该放弃幻想,接受市场经济的客观规律。

那有没有成功的价格联盟呢?当然有,那就是大名鼎鼎的OPEC(石油输出国组织)。

他们成功的原因用博弈论的理论解释,当然是每个OPEC成员国都没有动力去更改策略(比如偷偷增产或减产石油),所以实现了纳什均衡。

那么更进一步的问题就是,为啥这个组织就可以约束住成员国,使大家没动力擅自行动呢?到这里你应该意识到,答案肯定还要从每个成员国的收益矩阵入手。除非博弈的参与者没脑子,否则他的策略一定基于他的收益矩阵。

一方面,OPEC参与者数量足够少,好沟通协作,组织能把每个参与者的诉求了解清楚并尽量照顾到。

另一方面,邻居、开发商与同联盟中的其他人是陌生人间的一次性博弈,邻居能搬走,开发商能转行;国家与国家间是Repeated Game(多次重复博弈),别说搬离地球了,就算身边的邻国你都很难换掉。因此国家间往往在乎信誉,损失信誉可能丢掉的利益比赚一点石油差价获得的更大。

再者,这些国家间有经济等方面的制裁手段,可以严重惩罚违背联盟条约的参与国;房地产价格联盟却基本只能骂街、砸售楼部。

当然,任何联盟内部都不可能铁板一块,OPEC内也会有异心,毕竟世间不可能有两个完全一样的收益矩阵。但相较于国内这些房地产价格联盟,OPEC已经足够成功。

那么当博弈中有无数个个体参与者时,如何才能有效达成纳什均衡,使本来竞争的个体参与者长期都能获得更高收益?

答案可以参考欧美的工会,强制每一个劳动者加入工会,工会也统一行动,为劳动者争取权益,同时也对“工贼”穷追猛打。

这样一番下来,可以使所有该行业的劳动者的收益矩阵趋于一致,也就不容易被雇主分而治之、各个击破了。

类似的情况还有黑道打破囚徒困境的办法。

囚徒困境大家都知道,即警方审讯两个犯罪分子,对每个犯罪分子的政策是 如果他和对方互相指认,那他们两个都判3年;如果一方指认另一方,而另一方没有指认他,则他拘留1周,对面判10年;两人都不互相指认,则各判1年。

经过仔细推演,人们得出无论对方选择什么策略,己方策略都是指认对方;而且己方也知道对方知道这一点;所以最终结果就是双方一定都互相指认(用博弈论的话说,互相指认是一个dominating strategy)。

看吧,这就是一个纳什均衡,双方谁都不会主动改变策略。

为此,黑道进化出了缄默原则,即无论任何情况任何帮派,只要混道上的人向警方指认同为道上的人,那所有帮派都视其为死敌,等他一出狱,就不分派别全都追杀他。

所以我们经常看到电影中,全世界的黑帮无论怎么死斗,反正有一条大家都绝对不干,就是跟警方合作。

这样每个被抓的帮派成员知道,指认对方哪怕自己能早出狱,但出狱后必死无疑;而且每个帮派成员也都知道其他帮派成员知道这一点,所以大家能形成默契,互相信任,在被单独审讯时候拒绝指认,宁可被关1年。

而且一般关过出来的兄弟,帮派也都会给予额外的补偿。

这样一番操作,就改变了每个帮派成员的收益矩阵,使得大家没有立场互相指认,也就达成了另一种纳什均衡,对黑道更有利的纳什均衡。

在双寡头模型(Duopoly)中更容易实现纳什均衡。

曾经有个故事,一个百事可乐的中层想带着一份商业机密跳槽到可口可乐(也可能反过来,时间隔太久记不清细节了),但是可口可乐拒绝了并把此事告诉百事可乐。

毫无疑问,可口可乐和百事可乐作为碳酸饮料行业的双寡头已经实现了纳什均衡,没有任何一方有动力破坏现有的平衡。

试想如果可口可乐接受了商业间谍的要价,那么自然就会有自己这边的机密被窃取到百事那边,最终可口可乐和百事可乐双方的市场地位大概不变,但各自都要额外花钱买商业机密来维持地位。

那就会使双方进入到一个次一档的纳什均衡。所以他们双方的高层都会极力避免打破均衡。

足球中皇马和巴萨间也有个互不挖角的君子协定,道理类似。

如果双方加价挖角对方的球员,那自己再想留住球员就也要高价,最终双方的球员还是那些球员,但俱乐部出的钱却多了,便宜了来回跳槽的球员。

现有的君子协定使双方在转会策略上实现了纳什均衡。

ETF(开放型指数基金)定价机制中也蕴含了纳什均衡。

一般一份ETF对应按比例配置的若干种股票,那么ETF的价格应该等于这些股票价格的加权之和;但另一方面,我们都知道价格永远由供求关系决定,这是一级铁律。那么问题来了,当有人故意出极高或极低价成交ETF时,ETF价格和对应股票价格出现分歧怎么办?这不就成了一份ETF两个价格了吗?

实际如果真有人出极高或极低价格成交ETF,成交价远离标的物的真实价格,那么这种价格状态不能实现纳什均衡,能与ETF发行商直接进行赎买的Authorized Participants(不理解的朋友就把AP们当成中间商)有倾向利用套利空间,去低价购买股票兑换成高价的ETF再卖出,或者低价购买ETF后赎回成高价的股票再卖出。

最终经过中间商套利,ETF价格还是能回归其对应的标的物价格,中间商也无套利倾向,各交易方策略回归纳什均衡状态。

更大的视角来自于借助纳什均衡剖析历史问题。

我们上中学时都学过尧舜的禅让制和大禹的夏朝家天下。我还记得当时老师说家天下是社会的进步,然后blabla论证一堆。我不知道各位什么感觉,当时的我其实没听懂,也没接纳那些解释。

因为我中学时代就很喜欢历史,业余时候也在想到底是为什么家天下取代禅让制是进步?不是应该选贤继位吗?你可以说夏朝相较于以前的尧舜时期较为先进,但不能直接推导出夏的继承制度就比尧舜时期的先进。

这个问题困扰了我很久,虽然中间也听过一些历史学文科生的解释,但说实话我认为都比较牵强,没有一个能说服我。

直到十几年后我学了博弈论,这个问题我才自己有了一个答案。

首先,文科生研究历史的一个的问题就是总忽略社会的客观性,我前边提到过,这里再强调一次。所以他们的叙事中经常以某个人为主导,强调这个人主观意愿或者能力如何,还喜欢主观给事物加褒贬不一的评价。

回到“为什么家天下比禅让制先进”这个问题,以我现在的视角看,“先进”、“进步”这些词汇本身就有问题,充满了主观臆断。

换句话说,“先进”是你这个历史学文科老师自己定义的概念;如果你这么定义了家天下比禅让制“先进”,那家天下自然比禅让制“先进”,不需要论证。但她们当时又不得不说点什么,于是叽里呱啦说了一堆;而且当时她们掌握考试的评分权,所以她们说什么学生都得认为对。

但回到二里头-夏朝,当时社会的客观规律中不存在“先进”这个概念,所以要真正理解这种继承制度的转变原因,首先要把文科生主观给历史贴的标签丢掉。

继承制度转变的原因理解起来可以说quite simple but not easy,那就是 禅让制不能实现一个纳什均衡,而家天下可以。

设想一个国家,下一任领导人由现任领导人选择。如果现任领导人贤德、不贪权,那么就会把权力完全移交给下一任贤德但不一定和自己有血缘关系的人;而如此往复数代,总有一代领导人贪恋权力(你不能指望代代出圣人),那么他就会利用现在手中的权力更改继承规则,使其对自己有利。

所以禅让制,以及后世一些国家内部推举领导人的制度,本身就不能构成一个纳什均衡,被选上的领导人有倾向更改规则,使自己或自己的血亲连任下去。这样的制度开始时是能碰到一些还算贤德、遵守规则的人,但局势改变是早晚的事,总有一任领导人会改策略,使继承游戏达到一个纳什均衡,通常就是家天下。

罗马帝国的崩盘一大根本原因就是继承制并不能实现纳什均衡,地方军阀势力都有造反的倾向;而罗马的继承问题重新得以解决,就是靠基督教的君权神授使朝局恢复纳什均衡。

如果你不想出现权力世袭的情况,那么从一开始就应该设计一种能实现纳什均衡的继承制度。后世西方已经给出了答案。我并不认为西方人道德就是高,或东方人道德就是低,是制度使然。

历史上著名的Pax Roma(罗马治下的和平)也可以用纳什均衡来解释。

在罗马治下的地中海地区,任何地方势力都有两种选择:1)反抗罗马+独立自主;2)交点保护费给罗马+专心挣钱不设防。

当罗马的实力强大到一定程度时,1)这条路线是傻子才会选的。自然而然,所有地方势力都选择臣服于罗马,交税并且安心发展经济、文化、科学事业,不用担心安全问题,因为有罗马保护自己。

而且当所有周围小邦都这样想时,战事也消失了,因为任何小邦占周围邻居的便宜,都有罗马爸爸来敲打,让各位小弟不要内斗。

这样每个小邦也根本不用担心会被附近其他罗马爸爸的小弟捅一刀。

这个纳什均衡在过去半个世纪的名字叫Pax America(美国治下的和平)。

冷战时期美苏互相因为有了核威胁,所以促成了世界安全局势达成纳什均衡,没有任何一方敢轻举妄动。

翻开史料,古巴导弹危机时肯尼迪总统划定的苏军撤离最后期限已过,美军又在古巴邻海发现了一艘苏军潜艇,因为这艘潜艇有通讯问题,接收撤离命令晚了。

在前线海军向白宫请求攻击命令时,肯尼迪赶紧制止,命令前线美国海军假装没看见,放苏联潜艇溜走。

苏联这边,赫鲁晓夫收到小道消息,苏联还不宣布古巴事件终止,肯尼迪就会在美国时间中午向苏联宣战。

赫鲁晓夫来不及核实信息真伪,立刻宣布终止在古巴部署军事设施的计划。实际这是一则假消息,肯尼迪根本没有宣战计划。

古巴导弹危机非常有趣,两大军事阵营看似剑拔弩张、一触即发,但实则都小心翼翼,生怕一不小心地球毁灭。

认怂和在核战中同归于尽,双方领导人不约而同选择了认怂。

冷战之所以没有升级成热战,可以说是核武器的Strategic Effect。

而我们现在体制内和体制外单位的技术人员局面也没达到一个纳什均衡。

体制内技术人员的水平如果高了,就更有倾向跳出体制挣大钱,体制的保底机制对他不起作用。

另一方面,技术差的人更需要保底,所以会非常热衷挤进体制。

在现有局面下,体制内的高水平技术人才一定会不断外流,进而导致体制内单位的技术越来越差。

我身边的例子是 部分大学的辅导员甚至还需要手工进行很多机械重复的工作,需要干一下午、一晚上。

但如果用程序,一般不到10秒完成。

我的程序员朋友凡是谈对象找的是大学辅导员的,基本都帮忙干过这活。

直到体制内的技术人员完全都是菜鸟,出了体制无法挣钱,那么新的纳什均衡才会实现。

Evolutionary Stability (生物进化稳态)本质上也是一种纳什均衡,但碍于篇幅,我这里就不多介绍生物学专业的概念。这门课程中有两节专门讲解生物进化中的博弈论。

此外,当你学完纳什均衡有关的几节课后,再回头看《三体》中罗辑赌上性命的一搏,对三体人的威慑,就能理解三体人为什么不敢轻举妄动了。

信誉的重要性

在多次重复博弈中,信誉是个对收益极其极其重要的影响因素。虽然每个人口中都知道说诚实守信,但我认为很多人还是低估了它的重要性。

大部分时候人们都无法立刻兑付许诺的利益,或者无法在法律文书中穷尽各种情况和约束。

那么促使双方达成合作的一个重要因素就是双方的个人信誉。

而且任何资源和权力授权给某人,不仅仅看的是某人的专业技能和身份,还有其个人信誉。

对我而言,感受信誉对决策影响最大的方面就是购物;我极其认牌子。

作为计算机人,我年轻的时候买电子产品也会扒着参数比对,看网上的各种评测;但是后来事情多了,没有那个精力细细深究。

所以我转变策略,从买具体产品到买我认可的公司。

在所有品牌中,我最信任苹果。任何时候如果我需要换手机,可以直接下单iPhone的旗舰款,根本不需要看里边的参数列表和网络评测。

很多参数不能展现的使用体验,我默认苹果都已经做到最好,替我选了最优方案。我所需要做的就是付一个高价完事。

而其他很多安卓品牌,我默认它们在没展示的地方,都选了最廉价的解决方案,或者打算在没有告知我的情况下在系统中夹带私货。

与苹果相反的例子就是华为。这个品牌可以说毫无荣誉感可言。

我至今仍然非常费解,华为的高层是在喝了多少的情况下才允许手下搞出“华为鼎桥”这种东西?

华为搞了个“华为鼎桥”手机,在名字中与华为打擦边球,故意诱骗消费者高价买这种低配手机,同时为了规避法律风险,训练业务员永远说“这是华为智选手机”,不回答这是还是不是华为手机。

如果我是华为的决策者,有人提出这样一个商业计划,我一定会怀疑这人脑子里装的什么?!

你无法想象苹果公司会搞出“苹果智选”这种事。甚至我猜测,如果有人给Steve Jobs提这个方案,绘声绘色地描述怎么能大赚一笔还不用担法律风险,Steve Jobs肯定会当场破口大骂,忍不住要丢水杯过去,并当场fire掉这个人,甚至还要追查这个人是怎么进入苹果的。

“鸿蒙不是安卓”这种言论就是对我们计算机人智商的侮辱。

偷换配置材料、陷害自己的员工、抹黑其他品牌等等劣迹,有一条就足够进入我的黑名单,华为能进十次。

我很佩服华为高层对属下砸自己牌子的容忍度,但我更佩服广大爱国的消费者们对毫无信誉的品牌的容忍度。

如果越南科技的未来要靠这样的公司撑起来,那越南科技就没有未来。

不管选择购买一款产品,还是交朋友,还是商业合作谈一个项目,我的一个有效的经验是:默认信任对方,同时留足应对对方一次欺骗的buffer。

如果发现对方算计你算计得很清楚(好听点说对面很精明),那么就心中默默把对方拉黑,不再合作。

如果对方在没有约束的情况下,依然恪守承诺,没有任何暗地里占便宜的行为,则可以增加对对方的信任。

一般我只会留给对方欺骗一次的机会,一次即永久拉黑;而且这一次不一定是针对我的欺骗,我观察到对于其他人的也一样。

华为的种种劣迹并没有任何一次伤到我,但我依然坚决把它拉黑。

另一方面,一个人对弱者的态度是我心中极其重要的指标,比如领导对下属、导师对学生、官员对平民等。

没有强制力约束,如果对方还能坚持守约,那值得信任的可能性就增大。

人(公司)是对的,事情就会接二连三做对;人(公司)是错的,事情就会接二连三出错。

所以我始终不认可“对事不对人”,一直坚持“对人不对事”。

对的人也可能犯错,但只要是对的人就不用太担心。

人生在很多关键事情上首要考虑的是选对的人。信誉就是一个极其重要的参考指标。

还有个关于信誉有趣的例子。

我当年看GoT时已经学过博弈论。所以当我看到兰尼斯特家那句著名的A Lannister Always Pays His Debts时,发觉这比其他家族的座右铭有信息量多了。

Tyrion在鹰巢城和Jamie落在Lord Bolton手中时,都靠着这句座右铭背后的家族信誉得以幸存。

信誉的价值在此体现得淋漓尽致,也难怪狮子家越做越大。

用Winter is Comming这种天气预报当座右铭的狼家脑子是不怎么好使。

底线思维一定要有

当你的收益矩阵是明牌时,对方就吃准了你的底线,进而可能吃定你。

比如国内所谓“体制内”的工作被称为“铁饭碗”,看起来很美好,谁都不能开除你,我以前也一直这样以为。

但后来我突然意识到,这其中有陷阱,那就是每个体制内的人的收益矩阵几乎都是明牌。

其他上级很容易吃准你的底线,摊派给你刚刚好保证你不主动辞职的任务量(关系户另算)。

因为你为了进入这个体制,拿到心中的“铁饭碗”,一定会自我阉割很多天然的生存技能,比如我们计算机人去了体制内的技术都会逐渐退化,酒量反而渐长。

你的技能逐渐变得离开了体制毫无用处。这时候,你的收益矩阵非常明确,不服从体制会变得生存都成问题。

进而,领导可以半夜给你发消息让你凌晨加班;周末随意安排你学习报告精神;工资福利说降就降。

因为你被吃准了底线,已经没有其他策略可选;离开体制饿死,或者留在体制足够累且有饭吃,你选哪个?

落到这一步怎么办?应该是没什么办法,如果有办法那博弈论这门学科要改写了。

所以大部分人的策略是拼命再拼命往上爬,不顾一切摆脱如此被动的地位。更好的策略是,不要让自己落到没有别的策略可选,被人完全吃准的境地。

延迟退休、社保缴费额、独生子女政策等一系列法律法规,gov都可以肆意修改规则,这背后根本的逻辑就是吃准了我们不可能revo。

只要被吃准底线,那你早晚会只拿到一个最低价。

国内经常传出研究生被导师压榨的新闻,这个道理一样。研究生在3年-5年内退出的代价极高,所以研究生的收益矩阵在几年内也是明牌:退出并付出极高代价,还是忍一忍毕业,大部分研究生只能选后者。而一旦毕业了,导师也会突然变得“客气”很多。

导师吃准了学生的底线,所以就可以让学生为自己干各种杂活项目,或者自由分配学生工作的作者排名。

但这种情况有一个例外,就是导师压榨太过把学生要逼死了。

这时候学生的收益矩阵就变了:忍一忍生不如死,还是死个痛快并拉一个垫背的,有学生就豁出去了。

导师们大部分不会太出格,搞得两败俱伤。所以现在国内高校中的纳什均衡就是 导师适当用用学生,同时尽量放学生安全毕业。

在这种纳什均衡下,导师和学生都没有倾向改变策略。

我自己还经历过一个切身的例子就是选择笔记软件。

大约十年前我要选择一款笔记软件作为自己的主力学习工具,当时国内市面上最著名的是印象笔记和有道云笔记。

经过一番研究,我发现有道云笔记不能直接导出通用格式的笔记,所以即使之后不想用了,也不能轻易换软件,因为你的笔记都导不出来。

我一看好家伙,“挟笔记以令用户”啊这是,于是一开始我就不选有道,而选择了印象笔记;否则我越使用下去,有道手中的筹码就越大,越有可能不断踩踏我的底线。

在作为付费会员用了国内版印象笔记十年后,我看到越来越多以Notion为代表的新一代笔记软件诞生,想试用一下。

结果我意外发现国内版印象笔记已经无法导出通用格式到其他笔记软件了,而我明明记得这个功能一直都有。

又经过一番调查,我发现在不久前的一次版本更新中,国内版印象笔记暗自偷偷地把导出通用格式功能给去掉了,更新报告中没说;而国际版印象笔记则没问题,依然可以随便导出。

行了,到这里我心中已经判了国内版印象笔记死刑,哪怕我还有会员没过期也直接不要了。

瞒着用户悄悄干这种事情,想靠耍小心眼留住用户?我可以接受你大大方方涨价,但不能接受耍小心眼算计用户。

我当时宁可所有笔记不要,也不会容忍这种行为得逞。但好在我是程序员,在Github上找到有程序能调用老的印象笔记的接口自动导出笔记,我改了改,直接把自己的印象笔记全部内容搬进了Notion。

类似这样的小事大家千万不要容忍,这是不断在试探用户的底线。当你原本的底线被踩到了就应该“誓死抵抗”,不然“今日割五城,明日割十城”,将再无翻盘可能。

那么该怎样避免被吃准底线,维护自己的利益呢?我从当初学习博弈论后也一直在想这个问题。

智猪博弈中,这头聪明的猪最开始可以掩饰自己的智商,不要展现得太强;另一方面可以夸大自己扛饥饿的程度,使得其他猪不期待能熬过你。

《三体》中程心就被三体人吃准了底线,而且吃得非常死;她接手执剑人后三体人动手一秒都不带犹豫。

相反,三体人认为维德是恶魔,威胁指数100%,别说吃准维德的底线了,就稍有不慎让他不开心,自己可能就有灭顶之灾。

但读过书的我们都知道,维德其实不是疯子,内心反而非常冷静、柔软。他只是为了保护地球,不得不夸大自己的疯狂程度,甚至让三体人都产生了战略误判。

确定性的重要性

在这门课程中,还有一个对我启发很大的知识点——迭代剔除(Itarative Deletion)。

它在课堂上与中位选民定理一起介绍,但由于国人对选举比较陌生,我这里打算用投资的例子讲解。

股票等投资品中有远期的利好和利空,总能即时反应到此刻的股价上。

试想有一个大后天发生的利空,那么可以倒推出后天没人会高价买该资产;后天没人高价买,那明天高价买的就也无法出手,所以明天也不会有人高价买;以此类推,最终此时此刻的资产价格就会下跌。

理论虽如此,现实情况中有两点不同:1)利好、利空的时间隔太长,容易发生不确定性,影响价格传导;2)投资投机者不全都足够理性,会受情绪、信息、知识等多方面影响而对显而易见的结果视而不见,对未来抱有不切实际的幻想。

我写这篇评论文章时,美联储还在努力把国债收益率维持在5个百分点左右,但黄金期货和比特币等抗通胀投资品已经开始拉升。

这背后的逻辑就可以用迭代剔除解释:1) 大家知道你FED维持高息已经到了强弩之末,量化宽松就在眼前,确定性非常大,哪怕你短期不降息,但你有本事一年内一直不降?2)这类商品的国际投资者的知识和信息都更充分,控制情绪的经验也更丰富,对未来的预期更明确。

信息传递的重要性

服从性测试大家都已经非常熟悉了,包括但不限领导劝酒、女朋友要520红包、满清剃发等。

这些服从性测试本质上是在估计被试者的收益矩阵,判断自己在对方心中价值几何。

所以这些测试本身必须借助没用的事物进行,否则你就无法判断对方究竟是在乎你才这么做,还是真的需要才这么做。

信息交换是服从性测试中最重要的事。

与之类似,一些看似形式主义的细节其实也能传递巨大的信息量。

苹果公司对产品外包装设计都极其严格,乔帮主当年为了产品发布会的演练也非常敬业,这都是在告诉消费者,我们是一家很要脸的公司,是一家非常在乎品质的公司。这个信息传递出来,那些钱和精力就没白花。

简历中如果有错字,那传递出来的信息是非常非常差的。Presentation、Demo时,如果选手准备了几种不同格式的Slides和数据线,以求在现场万无一失,那即时没用上,传递出来的信息也让人知道这位候选人非常靠谱。

在合同中加入简单琐碎的奇葩要求,可以有效识别合作方有没有认真阅读合同,尽职尽责情况如何;比如规定对方当天要为你准备一杯装买M&M豆的糖果杯,其中红绿黄三种颜色的糖豆分别有33、29、41颗,这样你如果当天在一杯中数下来真的有这么多三色糖豆,那大概率合作方对其他合同细节也履行得很完善。

还有一些历史中常见的形式主义,也扮演了信息传递中的重要角色,只不过和服从性测试是反向的——阻止信息传递。

经常造反的朋友都知道,造反需要预先估计大多数人对gov的态度,以求自己振臂一呼能一呼百应。

没有人喜欢站在失败者的一边,所以大部分人遇到他人造反都会先观望,判断谁会获胜,然后肉身下注。

皇帝最怕的就是底下人搞串联,几个人互相瞅着对方都有反意,然后互相暗示、传递信息给彼此,把共有知识(Mutual Knowledge)变成了共识(Common Knowledge)。(这俩的区别在于,前者大家都这样想,但彼此不知道对方怎么想;后者大家都这么想,而且都知道所有人也这么想。)

那么只有朝堂上一大片人拥有了“我们都想推翻这个皇帝”的共识时,才容易有人第一个站出来造反,因为这个人必须确保自己站出来后有大家能跟上。

作为皇帝,你深知对你不满的共有知识是一定存在的,但只要阻止这种不满形成共识,你就可以高枕无忧。

现在就到了各种形式主义登场的时间,比如率领文武百官祭拜宗庙,或者强迫所有人为自己歌功颂德,挑几个关键大臣住持学习自己的讲话。

这些形式主义不仅仅满足皇帝个人的虚荣心,更重要的是刷新了群臣间的共识缓存。

比如老张和老李同朝为官,俩人都对皇帝不满,互相抛媚眼传递这种信息。但有一天老李上朝发现老张在拍皇帝的马屁,而且群臣也都在附和,那老张对老李的信任就必须重新建立;而老李也会知道今天过后,老张不再信任自己。

皇帝为了不停地刷新共识缓存,就要不停地搞个人崇拜、形式主义。

另外,《三体》中的猜疑链这种信息传递问题现实中不会那么严重。

比如计算机网络通信中,TCP协议会要求“三次握手,四次挥手”就足够建立可信的连接了。

还有一种博弈是合作博弈(Cooperation Game),你主动为其他参与者提供更多关于你的真实信息,反而会使你(很多时候也包括对方)更加受益。

还是使用前边介绍纳什均衡时使用的冷战的例子。

试想,如果冷战中一方不知道另一方有核武器,那么就错误估计了对方的收益矩阵和潜在的策略,进而估计错自己的。

比如美国不知道苏联有核武器和远程投射能力,那就真如电影Dr. Strange Love中的场景一样,美国想核平一部分苏联,占尽对方便宜;结果苏联挨打后只剩下单方面GG和同归于尽两种选择,那毫无疑问不能单方面GG。

于是美国本来只想占便宜,结果自己突然也挂了。

所以越南军演和三胖搞核试验,就怕美帝没看见,故意在展示“我也有核武器,你不要误以为我会单方面GG”。

从博弈论的视角看,核武器的作用主要体现在没发射以前,发射后就是同归于尽不新鲜了。

所以世界顶级军事集团间都会开设军事转线,及时沟通真实意图,避免战略误判导致同归于尽。

拍卖模型

最后简单提一下课程结尾的拍卖模型介绍。我以前还真没想过拍卖有什么可研究的。

我们通常熟悉的都是Open Ascending Auction(公开最高价成交)的拍卖模型。理论上,如果当前叫价不高于拍卖品的真实价值,那么总会有人加价,直到有人加到超出拍卖品的真实价值为止。

所以大部分拍卖品的成交价都有一定高估。

另外,The Second Price Sealed Auction(密封二价拍卖)是个天才的想法,即叫价最高者成交,但只需支付叫价次高的价格,如果加上密封则是完全不知道他人叫价,避免有人串通控制拍卖。

据说Google AdWords的广告位竞拍就是用这种的加权版本(权重是Google自己计算的竞标广告质量、与关键词的契合度)。

这种拍卖方式的一个优点是能将叫价中的买家的意愿、对拍卖品的真实估价,以及买家最终支付的价格区分开;课堂上能推导出,在这种拍卖模型中,参与者叫自己心中真实的估价是最优策略。

而传统的“公开最高价成交”中,参与竞拍者可以先不叫自己心中真实的估计,取而代之从一个极低的价格叫起,试探拍卖者的底线。

更多关于拍卖模型的分析可以在该系列课程的最后一讲中看到。

版本选择

这门课程放出来的公开录制只有2007年一学期的,在YouTube的Yale Open Course频道可以观看,中文版网易公开课有。

另外,建议每次听讲完对着网络上公开的课堂讲义复习,并做一下期中和期末考试题。