纳什均衡(转载)
发布网友
发布时间:2023-06-13 02:51
我来回答
共1个回答
热心网友
时间:2024-12-03 15:56
最后我能给你解释道德绑架为什么让你反感,别觉得是学术你就不看了。
囚徒困境
两个囚徒被抓了,*为了让他们坦白交代,分别提审两个人,这里分三种情况
1、两个人都不交代,没有证据,直接无罪释放
2、其中一个人交代了,一个人没交代,交代了的因为戴罪立功,判1年,没交代的判9年
3、两个人都交代,每个人判6年
两个人没有串供的机会,所以只能自行判断,假设每个人交代和不交代都占50%,则
第一个人没说的时候判刑的危险(后果*概率)50%*0+50%*9=4.5
第一个人交代了的时候判刑的危险(后果*概率)50%*1+50%*6=3.5
所以第一个人的最优策略是:交代,同理可证第二个人的最优策略一样是交代
所以两个人都交代是最符合从个人出发的最佳策略
但是如果从整体出发,两个人都交代是四个选择里面最差的,因为两个人一共要判12年,哪怕是一个人交代一个人没交代,都只需要两个人一共判10年
这就是纳什均衡:每个人都从个人最佳选择的角度出发,最终集体的利益受损。
有人说看不懂这个推导,那么你直接记住这句话即可:聪明人在一块,因为自私,选出一个傻子方案。
以上是为了解释清楚举了一个极端的例子,实际上根据条件不一样,每个人都从个人最佳选择的角度出发,最终不一定导致集体的选择最差,但是一定不是最好。
对于纳什均衡的应用:
1、你的对手和队友中一定有蠢货(也可能是受情绪影响而做出愚蠢的选择),这导致任何精确的算计都不精确
2、但是采取任何博弈的时候,都应该假定对手是聪明人和老司机。
3、一个社会和一个整体不美好,不是因为某一些人坏或者某一些人傻,而是因为所有聪明人按照纳什均衡的博弈的结果。
4、博弈的根据是给对方一个可以相信的美好的未来。
5、保持友善,因为没有一个必胜的策略。
6、当你有中等能力的时候,不要做任何博弈,直接翻牌。(这一点有严谨的证明,公式太多,写了你也不爱看)
7、多次博弈的过程中,双方或者多方会突破纳什均衡,这一突破,往往会形成道德——欺诈游戏中那个傻女猪脚完成了凑齐红苹果的伟大壮举——突破纳什均衡是让双方共赢的结果
最后这一点多解释一下,如果双方都进去了以后,再出来,又一起作案,这次提前约定好,只要是被抓住,我们都不说,不就都无罪释放了吗?结果双方突破了纳什均衡——提前约束好的行为,就是道德(举的例子有点反,明白意思就好)。
所以为什么很多人现在感觉到了道德绑架:这跟我们提前说好的不一样啊,凭什么我的道德让我判9年你判1年啊。
链接:https://www.jianshu.com/p/eb8f3d77feab