绿林网

《博弈论究竟是什么》读后感1000字

《博弈论究竟是什么》读后感1000字

《博弈论究竟是什么》是一本由万维钢著作,新星出版社出版的精装图书,本书定价:49,页数:240,特精心收集的读后感,希望对大家能有帮助。

《博弈论究竟是什么》读后感(一):我们的世界怎么就这样了?

天下神功,无疑都需要苦练至纯,方能达到境界的攀升,但功夫之外的顿悟,实则是可遇不可求的修行。就比如郭靖在丐帮大会上身陷绝境,举目望着北斗七星,心里念着天罡北斗阵,却无意间参悟了九阴真经的精髓。同样的道理,作者写这本书的初衷,并非把博弈论作为解决问题的工具或者数学为主的理论,更多是科普博弈论作为思维工具,提供一种重新观察和理解世界的眼光,重新认识我们博弈场景的底层逻辑。 博弈的情景随处可见,只要满足三个条件:有人、有竞争、各为己战。 多数一线青年身处的996困境,加班这个词在公司里被忘却,9点下班才是正常操作,每个人都在受苦却又无法摆脱。试想如果这个困境被改变,或者这个局面根本不曾发生过,那么最优的状态是什么? 所有打工人按照契约精神,八小时工作准时打卡片刻不多留,对老板提出的加班费嗤之以鼻,员工都过上了work life balance的幸福生活!这貌似是我们期待的帕累托最优,一个理想的生活状态,一个没有内卷的世界,但世界显然没这么善解人意,因为这场关于工作资源的博弈局面是极其不稳定的。 首先,老板是高级玩家也是规则制定者之一,各为己战的员工可以选择自己游戏的方式,但即便一开始签署了我们所谓的准时下班协议,这种契约也会因为规则改变随时崩塌。 1.老板想尽可能推进度,提出了更加丰厚的加班费,同事A刚巧在攒首付,首先脱离大部队,这种局面也是极好,因为大家各取所需,老板获得产出、员工A获得高报酬、其他同事获得自由时间。 2.但员工A因为加班在半年后升了职,这就让一众同事坐不住了,纷纷效仿,公司80%的员工陆续加入。老板发现让员工加班拼命容易多了,逐渐降低了加班费标准,此时员工们虽有些动摇但又不愿单方面改变,眼看着周围同事都加薪,自己也不甘退后,博弈局面暂时稳定。 3.就业季来临,Hr桌子上毕业生简历堆了1米高,大量玩家涌入博弈游戏并表示接受996,毕业生更不管老员工的按时下班的上古契约,能上船的才叫水手,且先干了这杯毒酒。这种外部环境剧变让20%还在履行按时下班协议的少数分子岌岌可危,果然作为绩效垫底迎来了第一波裁员。已经放弃自由时间的80%大部队也加紧脚步,邻国都在招兵买马,我国且能坐得安稳? 4.于是全员接受了加班和加班费,尽管加班费已经退化为晚餐补贴,但不想拿补贴的人会被优化,所有人都不愿单方面改变加班习惯,不管别人怎么搞,我先得保住一席之地,这就达到所说的纳什均衡。 而这种状态从一个公司,逐步渗透到一个行业乃至整个社会也是必然的,因为有人、有竞争而且人人为己。所以不必追究互联网996的风潮从哪家大厂而起,从这个行业进入大众视野,被神化的那一刻,就注定走上这种道路。 类似的,对于教育资源的饿虎扑食已经蔓延到小学和幼儿园,本科生完全可以胜任的岗位要求硕士起步,付出无数努力只为领先同龄人一个身位,就是内卷。 这个局面既然已经达到纳什均衡,就很难破局,改变的方式无非几种: 1. 约定停火,全社会样本下几乎不可能; 2.第三方的介入改变博弈规则,劳动相关法律控制工作时长,但是游戏的操控者老板必然降低工资,引来了缺钱员工的叫苦不堪; 3. 降低博弈的报偿,如果所有老板都压薪,这份工作价值压缩后,必然有一些玩家改变博弈策略; 4. 做大蛋糕,提供更多机会。这就不是说说的事了,且等且珍惜。

《博弈论究竟是什么》读后感(二):阳谋的准则

脑图

一、读书目的

博弈论大学的时候学过,不过我一直不会求均衡解,一度认为博弈论在现实生活中有什么用。直到我遇到了《博弈论究竟是什么》,让我认识到博弈论的重要性,本书简短易读,没有博弈论中让人头疼的数学公式,是一本以现实为核心的博弈论入门读物。

二、本书的核心内容

本书很薄,全书是抛弃数学的基础上,向你介绍在真实世界中如何使用博弈论。它不是三十六计,告诉你如何使用阴谋诡计来蒙骗对手获得胜利;它是假设对方也是理性的聪明人基础上,即使对方完全知道你的策略,你也可以堂堂正正的采取的阳谋。

三、本书对我印象深刻内容

(一)思考问题的目标

我们平时思考问题以什么为目标,是最有利于自己的结果,还是最有利于各方的结果?书中给出答案,均衡点。这里涉及了4个概念。帕累托最优、压倒性策略、纳什均衡、聚焦点。 1、帕累托最优 理论上的系统最优解。 例如我们常说:我们各让一步,大家都会更好。人人都献出一点爱,世界将更美好。 帕累托最优是我们美好的梦想,但真实世界往往不如此,不是每个人都愿意付出,每个人都可能是自利的,只要有一个人不做出让步,帕累托最优就达不到,这个人反而可以得到好处,这就是真实世界中的囚徒困境。 2、压倒性策略 无论对手怎么做,这么做都对我最有利。 为什么有的人会违约或者不遵守规则,遵守规则,如果有人不遵守他会吃亏;不遵守规则,那样自己很得到好处。因此自己选择不遵守规则是“明智之举”,这就是所谓的压倒性策略。 3、纳什均衡 没有一方愿意单方面改变的稳定的模式。 例如:我们都说漫天要价、坐地还钱。谈判过程中经常出现多方面试探的情况,这就是双方在寻找均衡点。 4、聚焦点 众多纳什均衡中最明显的那个。 例如:你去买房,房价当然是最重要的,聚焦点可以理解周围房价的均价。你在高速上行驶,高速上的限速牌你也可以理解为聚焦点。 书中观点,理想的人喜欢帕累托最优,理性的人寻找纳什均衡。作为我们,最重要的就是找到纳什均衡。纳什均衡中,聚焦点则是我们重点中的重点。 我们拿战国时期举例:战国时期,百家争鸣。我们都知道儒家观点更仁慈,如果战国中所有的诸侯国都能施行仁政当然可以让天下稳定,这就是帕累托最优。但是此情况下,如果一家采用军事备战,那样他就具有对别国压倒性优势,别人不备战,他有优势;别人备战,他不会落后。因此军事备战就成了各国的压倒性策略。最后,战国中天下就达成了所有诸侯国都会采取军事备战的均衡状态,也就是纳什均衡。为什么战国时期儒家不被采纳,反而法家备受推崇,博弈论就可以给出很好的解释。当今世界,为什么还有军备竞赛,道理就在于此。 (二)合作也是博弈 博弈中必须选择对抗吗?不是的,博弈论不是让我们必须选择对抗,博弈中合作也会达成双赢的局面 1、合作有利于生存 (1)单次博弈与重复博弈 1)单次博弈 你可以理解为合作一次就不再合作。在这种情况下,人很可能违约。 例如:景点旁边的饭店为什么总曝出所谓的天价菜单?因为你可能就去一次这个饭店,此时饭店采取欺客现象反而是所谓的理性。 2)重复博弈 你可以理解为多方要进行多次博弈。这个时候,合作是理性行为,为了长期利益,各方都会倾向于采用遵守合约的方式。 例如:同样是饭店,为什么当地的小店最地道。这些小店往往是寻求当地的回头客,他们采取的就是重复博弈,为了招揽回头客,低价优质的饭菜将是他们遵守的规则,这也是一种纳什均衡。 所以,好的合作一定是均衡的,为了达成合作,我们必须促成重复博弈。 2、小额多次的博弈 (1)合作的博弈条件 1)各自认为不是最后一次 这里有个重点,是博弈各方都不能认为是最后一次博弈。 举个例子:小时候很多采用上门订奶的方式推销牛奶,开始我采用的是每个月交奶费的方式,连续几个月感觉不错;有一天推销员说有优惠活动,交一年送2个月;我认为长期合作挺好,因此交了一年的钱,结果第二个月开始,推销员卷款潜逃。我错在什么地方,就是自己认为是多次博弈,结果对方只是当最后一次博弈了。 2)背叛利益不够大 不要给对方创造一次背叛就能吃饱的条件。 还是我上面的例子,对方一次收了很多订奶费,这个时候背叛的利益就足够大了。想象现在健身房跑路或者集资跑路的现象,不都是同样的博弈格局吗? 3)背叛会受到惩罚 背叛后惩罚足够大也可以威慑对方。 法律起的就是这个作用。当然学校中的老师,家族中的长者都可以起到这个作用。 3、以牙还牙策略 我们想合作促进发展,但又害怕被对方坑,那应当采取什么策略呢?书中给了一个以牙还牙的策略。 开始采取合作态度,一旦对方背叛就实行惩罚性措施。 这样做的好处是开始采取促进合作的方式,如果双方都持有合作的态度,就能一直合作下去。如果对方背叛,则采取硬碰硬的策略攻击对方。 当然,博弈中我们也要遵循小额多次原则,并且要防止误判。比如双方因为理解不同导致对方做了不利于自己的行为,我们是不是可以把对方背叛放宽至2次,这都是可以讨论的。

(三)如何让对方相信自己 博弈都是动态的,也就是要根据对方的选择而选择。在动态博弈中,最重要的就是威胁与承诺,如何让对方相信自己的威胁与承诺则是我们要做的重点。 1、威胁 如何让对方相信自己威胁有3点。 (1)自己有实力 这是前提,一个小朋友说你欺负我就打你,你肯定付之一笑。 想有威胁力,首先要有这个实力。 (2)自己有决心 你必须表现出惩罚的决心,不能给对方有做了也不会受到惩罚的认识。 (3)对方知道自己有决心和实力 这点不言而喻,对手不知道,你再有实力和决心也是白搭。 2、承诺 如何让对方相信自己的承诺,现实中这点往往是我们最想做的,书中给出了3点建议。 (1)让对方拥有惩罚你的权利 这么做的好处是让对方拥有自己违约后惩罚自己的好处,等于是给对方吃了一个定心丸。 例如:合同中增加保证金、买卖中增加退货条款等。 (2)自断后路 断了自己后路,让对方认为自己只有这条路可走。 例如:项羽破釜沉舟,让士兵认为不成功则成仁,反而激发了士兵的积极性,获得关键性胜利,就是利用了这个原理。 (3)成为声望高的人 这点很好理解,比如推荐读书,樊登或者罗胖说就很有效果。一个你不认识的人给你推荐书,可能效果就很差。主播带货中,买李佳琪带货的产品假货概率相对较低,你买一个不知名的主播,那对产品质量的保证就相对较低。因为如果他们推荐书或者带货质量不高,就会反过来影响他们的声望,对于他们来说就是巨大的损失,他们自己也会极力避免此类情况。 所以成为一个领域的专家,获得较高的声望,就相当于拥有一笔无形的资产。 四:总结感受 书中介绍的内容远比我笔记丰富,还有很多让我印象深刻的部分。 1.后来者为什么可以居上?(后发者信息优势+后发者出手权) 2.自己策略如何不被针对?(混合策略,真正的随机) 3.如何刷选出自己需要的事物?(价格歧视策略) 4.俄罗斯与乌克兰如何步步升级的?(边缘策略) 5.选择鹰派还是鸽派更有前途?(数学的推理) 如果上述内容你很感兴趣,建议读一读原文。

五:总结感受

这是一本教你如何使用阳谋的小册子,有了它后,你对现实中某一局面的形成将见怪不怪。针对博弈论本身,我们可以不懂其中的数学,但一定要明白其中的思想。

《博弈论究竟是什么》读后感(三):万维钢版《博弈论》读后整理

1.人们喜闻乐见的计谋往往都只是骗术,比如自己要做A让别人以为自己做B,不希望对手做C就去吸引对手做D。比如《三十六计》中的瞒天过海,声东击西等等,但这类诡计都面临着三大问题,第一是风险太大,往往都是以信息完全不透明作为大前提;第二是不能长期使用,只能用一次;第三它们都是零和博弈,它容易给人一种误解,仿佛很多事情都是我要赢就一定要你输,但其实现实生活中包括商业竞争等都很少出现你死我活的局面。

2.博弈论中理性人的三大表现:你知道你要什么,并且对想要的东西有明确的排序;你的行动是在一定规则下争取想要的东西;你知道对手也是这么想的,而且对手也知道规则。也就是说如果人被情绪挟持时,是不能应用博弈论的。注:如果是长期这么做事,那其中可能也有理性的成分。所以为什么很多app上有各种骗局和假货,他们能长期存在,一定是博弈格局所决定,是各方的理性的选择。而博弈论的作用就是帮助我们去理解长期存在的不合理的现象以及改变不好的局面。

3.博弈论中的三大基础概念:帕累托最优,压倒性策略,纳什均衡。

4.帕累托改进:在不伤害任何一个人利益的同时,是至少一个人的境遇变得更好;帕累托最优:一个局面已经好到没有帕累托改进的余地。很多时候帕累托最优是一个不稳定的局面,博弈论告诉我们最优未必能长久,只有稳定的局面才能长久存在。

5.在囚徒困境中不管对方是招不招供,他本人最好的策略都是招供。这就是他的压倒性策略,即这个策略压到其他一切策略,不管对手怎么做,这个策略都是最好的。类似的,不管别人怎么做这么做都是不好的,就叫被压倒性策略。所以如果有压倒性策略,就一定要选择它,同时无论如何都不要选择被压倒性策略。

6.在囚徒困境中二人的压倒性策略都是招供,这个结果并不是帕累托最优,但却是最稳定的,在这个策略组合中,没有任何一方愿意单方面改变自己的策略。这种情况就是纳什均衡。

7.换个角度看世界,如果一种现象能够在社会中长期稳定的存在,那么它对参与的各方来说一定是个纳什均衡。评价一个局面不能只看他是不是整体最好,而要看他是不是让每个参与者都不愿意单方面改变。与人签协议也是,如果希望被各方遵守,那它必须是一个纳什均衡。

8.如果所有人都选择压倒性策略,那结果一定是一个纳什均衡,但纳什均衡中不一定每个人都采取压倒性策略。并不是每个博弈中都有压倒性策略,更多的时候你的策略只能随着别人的策略变化。也就是说纳什均衡中的策略是给定对手策略下最好的策略,而不是所有策略中都是最好的(压倒性策略)。

9.关于高考补课,这是一个纳什均衡,也是一个多人囚徒困境,当前局面的帕累托最优可以分两个角度看,从学习的角度看是大家都补课,所有人都得到了提升;从躺平的角度看是大家都不补课,这样就回归到在学校内的学习情况。其中的压倒性策略是不管别人补不补,我都要补课。这个局面是不可能单方面改变的。

10.补课的改变方式:强权改变博弈局面比如教育改革,k12的覆灭和双减;个体改变博弈规则,比如出国绕开高考,特长生或奥赛加分保送等;大环境改变博弈报偿,补课的核心还是在于学生数量远多于好大学的招生名额,同时高考基本决定了人生,但是如果高考不是唯一出路,电竞/直播/创业也一样能赚钱,博弈报偿降低导滞竞争压力大大降低。

11.纳什均衡是一个美丽的概念,能解释很多现象,帮助我们破解很多博弈局面,由于好的合作一定是纳什均衡,因此更能给我们设计机制提供约束条件。

12.政府对公路上车辆行驶速度的限制,其实就相当于提供了一个聚焦点。因为开车并不是越慢越安全,如果所有人都开得很快,那么开得慢的就是安全隐患,反之亦然。只要大家都用同样的速度开,每个速度都是纳什均衡。那到底用哪个速度呢?限速牌就提供了聚焦点。假设政府规定某一路段限速 100km/h,司机对此的理解不是速度最高为 100km/h,而是建议 100km/h。最终所有人的车速就在 90km/h 至 110km/h之间,合作达成。

13.聚焦点是在双方都有强烈合作愿望的情况下,促成合作的一个方便办法。

14.想要防止背叛,最直接的办法就是把单次博弈变成重复博弈。比如景点饭菜价高质次,连锁店有保障,商家说要做一百年,会员制等等。

15.密歇根大学的阿克塞尔罗德组织过一个博弈竞赛,题目就是无限次多轮囚徒困境,最终胜出的策略是:不管跟谁博弈,第一轮都选择合作;第一轮过后,复制对手上一轮的做法。这一策略就好像一个以直报怨的老实人,但最后老实人胜出了,多么令人高兴的发现,以牙还牙,简单粗暴有效。但这个策略是一个脆弱的策略,没有容错性,比如AB都是用同样的方法博弈,但是在某一轮中,A操作失误,就会导致再也不可能合作的死循环。所以产生了改进版策略:对方背叛一次,我继续合作;对方连续背叛两次,我再报复。在可能出错的博弈中,这个效果会更好。注意要区分风险程度,恶意程度和可恨程度。演化博弈论的研究发现,正义策略在一个社会的胜出速度跟重复博弈的次数有很大关系。

16.不过话说回来,做真正的好人的确有个重大好处—你会自我感觉很好。为了维持这个良好的感觉,你宁可栖牲金钱的利益。这大概就是开头那些实验中,有一半的人在最初就选择了合作的原因。现代社会就是这样,通俗小说、电影和电视剧里一般都是好人取得最后的胜利。你被这样的文化熏陶,就不自觉地想要跟好人一伙儿。好人跟好人之间形成了一个想象的共同体。这其实是一个幻觉,但是没办法,想象的共同体是最强大的社会力量。这种感觉有时候会如此强烈,以至于我们认为物质利益都是不值得的。这其实也是理性的,只要你知道自己心中什么最重要就行。

17.商店或电商承诺不比其他家贵和买贵退差价都是一种价格匹配,原本竞争对手降价是为了吸引更多顾客,但现在A表示如果B降价,就不足差价,那就意味着B降价也抢不到A的顾客,就不需要降价了。这是一种不需要直接对话的价格协调策略。

18.第三方监管的本质是改变了博弈的报偿。由于有了有效的监管,不合作就没有好处而且会有处罚,就会大大减少不合作的行为。

19.囚徒困境是非零和博弈,因为存在双赢局面,只不过不是个体的压倒性策略。零和博弈的特点一个人赢一着则另一个人必输一着,净获利为零。

20.动态博弈的特点是参与者有先后次序,要画决策树,决策者每走一步都要先想好对方会怎么应对,或者为了得到想要的结果,最初应该怎么办。更本质的是你可以改变游戏的规则,每次行动后,留给对手都是一个不一样的博弈局面,有出手权。

21.胆小鬼博弈:博弈论专家的建议是,如果你在这场博弈中想赢,你可以当着对手的面,把自己这辆车的方向盘卸掉。这个动作明确告诉对方你肯定不会转方向盘你的车已经没有方向盘了,只能走直线。那么现在两辆车会不会相撞就完全取决于对方。只要对方不想死一你知道他肯定不想死一他就只能转方向盘,这样你就赢了。你通过自己的行动改变了游戏规则。本来游戏规则是两个人都可以选择是做小鸡还是死,而你把规则政成了只有对手能进择做小鸡还是死。你效弃了自己的选项,但把做小鸡的唯一可能性交给了对方。只要你能确定对手的底线,那么先发制人,造成既定事实,就能逼迫对手就范。对此的反制方式是悬崖策略,动态的进行小鸡策略,逐步升级,最后寻求服软。

22.悬崖策略危险太大,事实上你让对方先出手就已经错了,最好的方式是给对方一个威慑,让对方根本不敢出手。

23.威慑的大前提:双方都充分理性且都不想被摧毁。威慑的三要素:我有实力,我有决心,你知道我有实力和决心摧毁你。

24.动态博弈有两个基本概念,威胁与承诺,二者都是博弈双方没有采取实际行动之前,一方对另一方的声明。核心为可信性,只有可信的承诺或威胁才有意义。

25.衡量可信性可计算事前最优与事后最优是否一致。比如学生威胁老师,不给及格就挨揍,事前最优是希望及格,如果分数下来不及格已成事实时,学生的最优选择是接受,而不是报复后被开除。

26.说服别人的方式主要还是靠威胁和承诺,关键在于如何提升可信性,取决于事后的利益格局,只有时候别无选择,前后二者一致,履行威胁或承诺才是可信的。提升可信性有三种办法:1.给别人惩罚的权利(签合同,结婚等等)2.主动取消自己的选项,或者给敌人增加选项(破釜沉舟,围师必阙,送钻戒彩礼,大操大办,限量版商品)3.建立声望(无需花费任何成本就能提出可信的威胁和承诺,在建立声望的时候是会比较难受的)。巧的是所有的方法都是通过自我限制来提升自己的可信度。如果观察到一个人/团体没有通过信任而强加统治,那么先考虑是不是它拥有着不参与博弈的地位或资源,不是桌上的player。

27.踢点球是一种没有纯策略的纳什均衡,需要使用混合策略,具体为射手首先要考察自己向左踢和向右踢进球的概率分别是多少,然后合理搭配自己向左和向右的概率,让守门员不管是扑向任何一边的概率都是一样的。最小最大值定理,即将对手能得到的最大报偿最小化。1.先按照一定概率混合自己的打法;2.混合打发的规律必须是对手无法利用的。

28.约翰纳什证明所有的博弈,不管有多少参与者,都至少存在一个纳什均衡,纯策略纳什均衡或者混合策略纳什均衡,即不管干什么,博弈论都能带来启发。

29.信用卡公司有个叫 “余额代偿” 的手段。也就是说假设你在其他信用卡公司欠了钱,你可以把这笔余额转移到我们公司来,我们公司会给你更低的利率,甚至可能前几个月你可以暂时不还。这一招并不仅仅是为了吸引新顾客---更是筛选有价值的顾客。信用卡公司的顾客可以分成三种。第一种顾客量入为出,每个月用信用卡花多少钱,月底出账单的时候就按时还上,信用卡对他们来说只是一个方便的支付手段而已。信用卡公司在这些人身上基本上赚不到钱,从商家收的一点手续费可能只够管理费用。第二种顾客把信用卡当做一个分期付款手段。他们会有一笔很大的支出,然后假慢还。第三种顾客是把自己的信用额度一次性花光,刷了卡就不打算还钱的人。只有第二种顾客能让信用卡公司赚到钱。会使用余额代偿服务 的恰恰也是第二种顾客,因为第一种顾客没有余额,第三种顾客没打算还钱。余额代偿是一个正向信号筛选的有力手段,能把别人最优质的顾客抢过来。

30.通过释放信号,解决信息不对称。

31.拍卖对竞拍者来说是囚徒困境的一种,所以存在多种拍卖方式,而且广告中选择广义第二高价奖励说真话。

32.策略的优劣不是永恒的。你必须考虑当前社会的博弈格局,特别是其他人都在使用什么策略,才能知道自己的最佳策略是什么。从上帝视角来看,策略可以演化!如果一个策略可以带来好的报偿,人们就会模仿这个策略,并流行开来么这就是演化博弈论要研究的课题。

33.假设1:世界上只有两种婚姻观,分别是物质和感情。假设2:如果物质男和物质女结婚,他们有共同语言,假设得到的报偿为1;感情男和感情女在一起少了很多欲望更享受精神生活,报偿为2;但是如果一个物质型和一个感情型那么婚姻毫无乐趣可言,报偿为0。假设3:人们在交往的时候往往会选择掩饰自己的真实想法,即婚姻配对接近随机。那么在这种情况下我们应该做物质型还是感情型呢?解题思路如下:假设物质型人占总人群比例为p,感情型为1-p。如果物质型人随机配对结婚,他的预期报偿数学期望为:p*1+(1-p)*0,感情型的人的预期报偿为:p*0+(1-p)*2。如果p>2/3时,物质型人的报偿会更高,此时需要做一个物质型的人;如果p<2/3时,就应该选择做感情型的人;相等时则二者均可。

34.鹰鸽博弈模型中鹰鸽比例应该维持在1:2的平衡点,这个平衡是稳定的,哪一方少就会有人主动加入。它的结论具有普遍意义,它告诉我们为什么社会上总是有少数鹰派和多数鸽派。也解释了为什么现代人相对比原始人更加温顺了。

35.我们年轻时候的雄心壮志变成了对社会的低头,我们感慨进风日下人心不古,我们嘱咐子女不要锋芒毕露,可我们又暗自期望他们能走一条少有人走的路。一切都仿佛是个性和现实之间的对抗殊不知一切的背后……都是数学。

36.你可能终生都会参加各种博弈,但每次博弈都不会决定终生。player只是我们众多身份中的一个,博弈不是人生的全部,能接受失败的人才有资格争取胜利。就像幼儿园老师在教小朋友玩游戏,首先教的不是怎么赢,而是发现自己输了的情况下不掀桌子,继续玩下去。赢了忘乎所以,输了呼天抢地是最土的行为。

37.参加博弈不一定非赢不可,如果对手不犯错误,纳什均衡的本质其实是平局。

38.参加博弈,其实就是老老实实的思考下列因素:

这个博弈规则是什么,我想要什么

我现在有什么,我可以放弃什么

对手的情况(理性程度等等)

经典模型:

1.全班选一个数字,谁的数字最接近全班平均值的2/3,谁就获胜,如果各方都足够理性那么正确答案应该是0。详见P9

2.海滩上卖冰激凌,大家都扎堆不是因为大家都盲从,而是不得不这么做,核心是先来着和后来者问题。最优解是1/4和3/4的位置摆摊。

3.两个小偷被抓,俩人都招供各判3年;一招一不招,招无罪,不招5年;二者都不招,各判1年。直接用托马斯谢林的博弈矩阵图。囚徒2招供囚徒2不招供囚徒1招供-3,-30,-5囚徒1不招供-5,0-1,-1全局最优解是都不招供,整体2年;但是个体最优解是无论对方招不招供,最佳策略都应该是招供(压倒性策略)。

4.让两个人从‘2,39,481,1342’中挑选一个数字,如果两个人选的一样就能获得奖励。最容易获胜的就是7,因为这是一个常用数字,会产生聚焦点。

5.胆小鬼博弈,笔直公路上各自开车相向而行,谁先打方向盘谁就是胆小鬼。

6.演化博弈:左撇子与右撇子的博弈,原则来说用哪只手都是一样的,但是一半一半却很容易在吃饭时发生冲突,是一种不稳定的状态,此时只要有一方人稍微多一点,其他人的最佳选择就是跟着改变,此时家长的最优选择就是看哪种人多,就让孩子用哪只手。

7.鹰鸽博弈,已知鸽派和鹰派相处时,总是鹰派占便宜,那么既然如此为什么还有那么多鸽派呢?假定鹰鸽相处,鹰1鸽0,鹰鹰相处,均为-1,鸽鸽相处,均为0.5。通过期望依然可以算得,当鹰派占比少于1/3时,做鹰派有利可图,相反则做鸽派抱团取暖更合适。

全文大总结

本文由作者上传并发布(或网友转载),绿林网仅提供信息发布平台。文章仅代表作者个人观点,未经作者许可,不可转载。
点击查看全文
相关推荐
热门推荐