今天给大家分享一个关于纯纳什均衡(纯纳什均衡策略)的问题。以下是这个问题的总结。让我们来看看。
纳什均衡
定义:
指满足以下性质的策略组合:在这个策略组合中,任何一个玩家单方面改变自己的策略(其他玩家的策略不变)都不会提高自己的收益。
纳什证明了纳什均衡必须存在的前提是每个局中人的策略选择有限,允许混合策略。
分类:
纯策略纳什均衡和混合策略纳什均衡
“纯策略纳什均衡”,即参与的所有人都玩纯策略;以及相应的“混合策略纳什均衡”,其中至少有一个局中人玩混合策略。不是每个博弈都会有纯战略纳什均衡。比如“硬币问题”只有混合战略纳什均衡,没有纯战略纳什均衡。但还是有很多博弈有纯策略纳什均衡(囚徒困境和猎鹿博弈)。甚至,有些博弈可以同时存在纯策略和混合策略均衡。
案例:
1.价格战
当两家公司打价格战时,纳什均衡意味着双方都有输的可能:在对方不改变价格的条件下,既不能提价,否则会进一步失去市场;你不能降价,因为你会赔钱。于是两家公司可以改变原有的利益格局,通过协商寻求新的利益评价和分配方案,即纳什均衡。
2.囚徒困境
两个小偷,A和B,因为共同入室盗窃被警察抓住了。警察把这两个人放在两个不同的房间里审问。对于每一个嫌疑人,警方给出的政策是,如果一个嫌疑人供认了罪行,两人都会被定罪。如果另一名嫌疑人也供认不讳,他们每人被判处八年监禁;如果另一个嫌疑人不招供就否认,会以妨碍公务罪(因为有证据证明他有罪)判两年有期徒刑,招供者减刑八年后立即释放。如果两人都否认,警方因证据不足不能判他们盗窃罪,但可以以非法侵入罪各判一年监禁。
囚徒困境的博弈分析
A╲B坦率地否认了这一点。
坦白-8,-80,-10
拒绝-10,0-1,1
关于案件,最好的策略是双方都否认,结果大家都只判一年。但是因为他们是孤立的,首先从心理学的角度来说,双方都会怀疑对方为了保护自己会背叛自己。这两个人会有这样一个计算过程:如果他坦白,如果我否认,我要坐10年牢,如果我坦白,最多8年;如果他否认,如果我也否认,我会被判一年,如果我坦白,我会被释放,他会被监禁10年。考虑到以上情况,无论他是否坦白,我坦白都是划算的。两个人都可以用这样的脑子。最终,两人都选择了坦白,被判处有期徒刑八年。
“看不见的手”原理的一个悖论是从纳什均衡中推导出来的:从利己出发,结果不是利己,既不是利己,也不是利己。
3.智能猪游戏
猪圈里有两头猪,一头大猪和一头小猪。猪圈的一侧有一个踏板。每踩一次踏板,就会有少量的食物落在猪圈另一侧远离踏板的喂食口上。如果一只猪踩了踏板,另一只猪就有机会先吃掉掉在另一边的食物。猪一踩踏板,就在猪跑到食槽前,大猪会把所有的食物都吃光;如果大猪踩了踏板,小猪还有机会跑到食槽里去争夺另一半,然后吃掉掉下来的食物。
那么,两只猪会采取什么策略呢?答案是:小猪会选择“搭便车”策略,即在低谷期舒服地等待;大猪不知疲倦地在踏板和食槽之间奔跑,只为一点点剩菜。
原因是什么?因为,小猪蹬车什么也得不到,但是不蹬车也能吃到食物。对于小猪来说,不管大猪踩不踩,不踩总是一个好的选择。另一方面,大猪知道小猪不能踩油门。自己踩油门总比不踩好,所以他得自己来。
4.饥饿的狮子游戏
假设有六只狮子A、B、C、D、E、F(实力从左到右排序)和一只羊。假设狮子A吃完羊后会打个盹,那么比A弱的狮子B会趁机吃掉狮子A,然后B会打个盹,然后狮子C会吃掉狮子B,以此类推。那么问题来了。狮子A敢吃羊吗?
为了简化解释,我们先给出这个问题的解决方案。问题必须逆向分析,即从最弱的狮子F开始,依次推进。假设狮子E睡着了,狮子F敢吃狮子E吗?答案是肯定的,因为狮子F后面没有其他狮子,所以狮子F可以在午睡的时候安全的吃掉狮子E。
往前推,既然狮子E睡着了会被狮子F吃掉,那么狮子E肯定不敢吃前面睡着的狮子D。
往前推,既然狮子E不敢吃狮子D,那么D就可以放心地在午睡中吃狮子C。依次往前推,得到C不吃,B吃,A不吃。所以答案是狮子A不敢吃羊。
推理结果如下:
但是,如果我们在狮子F后面加一个狮子G,总数变成7,我们就很容易得出结论,狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这一次,答案变成了狮子A敢吃羊。
对比两个游戏,我们发现狮子A敢不敢吃羊,取决于狮子的奇数和偶数。总数为奇数时,A敢吃羊。当总数为偶数时,A不敢吃。所以奇数狮和偶数狮的博弈形成了两个稳定的纳什均衡点。
影响:
纳什均衡理论奠定了现代主流博弈论和经济理论的根本基础。
纳什均衡的影响可以概括为以下六个方面:
1.改变了经济学的体系和结构
非合作博弈论的概念、内容、模型和分析工具已经渗透到经济学的大部分学科,如微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等。,并改变了这些学科的内容和结构,成为这些学科的基本研究范式和理论分析工具,从而改变了原有经济学理论体系各个分支的内涵。
2.扩大经济学研究经济问题的范围。
原始经济学缺乏有效的方法对不确定因素、变化的环境因素和经济个体之间的相互作用进行建模,因此无法在微观层面解剖和分析经济问题。纳什均衡及相关模型分析方法,包括扩展博弈方法、逆向归纳法、子博弈完美纳什均衡等概念方法,为经济学家提供了深入的分析工具。
3.加强了经济研究的深度。
纳什均衡理论并不回避经济个体之间的直接互动,也不满足于经济个体之间复杂经济关系的简单化。在分析问题时,不仅要停留在宏观层面,更要深入分析表象背后的深层次原因和规律,强调从微观个体行为规律的角度发现问题的根源,从而更深入、更准确地理解和解释经济问题。
4.形成了基于经典博弈的研究范式体系。
也就是说,我们可以将各种问题或经济关系按照经典博弈的类型或特点进行分类,按照经典博弈相应的分析方法和模型进行研究,从而方便地将在一个领域获得的经验移植到另一个领域。
5.经济学与其他社会科学和自然科学的关系得到了扩大和加强。
纳什均衡之所以伟大,是因为它平凡,它几乎无处不在。纳什均衡理论不仅适用于人类的行为规律,也适用于人类以外的其他生物的生存、运动和发展规律。纳什均衡和博弈论的桥梁作用使得经济学与其他社会科学和自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
6.改变了经济学的语言和表达方式。
在进化博弈论方面颇有造诣的日本经济学家神取道宏(1997)曾对保罗·萨缪尔森的名言做了一个幽默的引申,“你甚至可以把一只鹦鹉变成一个训练有素的经济学家,因为它只需要学会两个词,即‘供给’和‘需求’。”他说:“现在这只鹦鹉需要重新学习。
什么是纳什均衡?
纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什(johnf nash)命名。在博弈过程中,无论对手的策略选择是什么,都会有一方选择某种策略,这种策略称为优势策略。如果两个局中人的策略组合构成了各自的优势策略,则该组合被定义为纳什均衡。
当每个参与者的均衡策略是使自己的期望收益最大化时,一个策略组合称为纳什均衡,其他所有参与者都遵循这个策略。
扩展数据;
纳什均衡可以分为两类:纯战略纳什均衡和混合战略纳什均衡。
要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。
所谓纯策略,就是给玩家提供一个完整的游戏定义。特别是纯策略决定了在任何情况下要做出的动作,策略集是玩家可以执行的纯策略集。
混合策略是通过给每个纯策略分配一个概率而形成的策略。混合策略允许玩家随机选择纯策略。在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定概率时,可以获得最优支付。因为概率是连续的,所以即使策略集是有限的,也会有无限的混合策略。
当然,严格来说,每一个纯策略都是“退化”的混合策略。特定纯策略的概率是1,另一个是0。
所以“纯策略纳什均衡”是指所有参与者都玩纯策略,而对应的“混合策略纳什均衡”是指至少有一个参与者玩混合策略。不是每个博弈都会有纯战略纳什均衡。比如“硬币问题”只有混合战略纳什均衡,没有纯战略纳什均衡。
但仍有很多博弈存在纯策略纳什均衡(如协调博弈、囚徒困境博弈、鹿博弈)。甚至有些游戏可以同时拥有纯策略和混合策略的平衡。
参考源;百度百科-纳什均衡
纳什均衡的通俗解释是什么?
纳什均衡的流行解释是:
纳什均衡是博弈论中的一个重要术语,以约翰·纳什命名。在一场博弈的过程中,无论对手如何选择自己的策略,都会有一方选择某种策略,这种策略称为优势策略。
如果在所有其他参与人的策略都确定的情况下,任何一个参与人选择了最佳策略,那么这个组合就被定义为纳什均衡。
扩展数据:
纳什均衡可以分为两类,纯战略纳什均衡和混合战略纳什均衡。所谓纯策略,就是给玩家提供一个完整的如何玩游戏的定义。
特别是纯策略决定了在任何情况下都要做的练习。策略集是玩家可以执行的一组纯策略。混合策略是通过给每个纯策略分配一个概率而形成的策略。
混合策略允许玩家随机选择一个纯策略。混合策略的博弈均衡要用概率来计算,因为每个策略都是随机的,当达到一定概率时,就可以实现最优支付。因为概率是连续的,所以即使策略集是有限的,也会有无限的混合策略。
以上是纯纳什均衡和纯纳什均衡策略的介绍。不知道你有没有从中找到你需要的信息?如果你想了解更多这方面的内容,记得关注这个网站。