人人书

博弈论:决策制胜的法则全文阅读

外国小说文学理论侦探推理惊悚悬疑传记回忆杂文随笔诗歌戏曲小故事
人人书 > 科普学习 > 博弈论:决策制胜的法则

何时达到均衡?

书籍名:《博弈论:决策制胜的法则》    作者:乔迪·德罗夫
推荐阅读:博弈论:决策制胜的法则txt下载 博弈论:决策制胜的法则笔趣阁 博弈论:决策制胜的法则顶点 博弈论:决策制胜的法则快眼 博弈论:决策制胜的法则sodu
上一章目录下一章
    《博弈论:决策制胜的法则》何时达到均衡?,页面无弹窗的全文阅读!



我们在前一部分中分析的博弈从很多方面来看都很简单。玩家只有两人(属双人博弈),而且每人只有两种选择(都是2×2的收益矩阵)。另外,它们都是零和博弈,因为双方的收益总和都是0(损失即为负收益)。玩家在每一轮中的决策都减少到了一到两种。根据博弈条件,双方都会选择一种确定的策略(即双方的最优策略),该博弈也由此确定,同时博弈的结果还会与对弈值(就像前一部分中的第一个例子一样)相对应。我们前面说过,如果博弈有鞍点,也就是说,其矩阵的某一个值既是极大极小值(每一行最小值中的最大值),也是极小极大值(每一列最大值中的最小值),那该博弈就一定有解决方案。否则,玩家就无法运用纯策略,而必须采用混合策略,该策略要保密,并且要在考虑运气因素的前提下进行选择。当收益矩阵具有对称性时,玩家应该采取的策略就是完全随机地进行选择(就像前一部分中的第二个例子一样)。要不然,玩家即使仍然采用了随机策略,也必须衡量每一种可能行为所产生的结果(就像前一部分中的第三个例子一样)。

约翰·冯·诺依曼(1903-1957)

约翰·冯·诺依曼在多个科研领域都颇有造诣,是20世纪最杰出的数学家之一。他出生于布达佩斯,并在这里开始学习数学,后来到柏林学习物理,又到苏黎世学习化学工程。1930年,他移居美国。在哥廷根生活期间,在希尔伯特的指导下,他致力于纯数学理论问题的研究,并且与海森堡共同开发了第一个量子理论公式。他在众多领域做出了重大贡献,包括集合论、泛函分析、逻辑学、概率论、应用数理经济、量子物理学和气象学等。

后来,他的兴趣逐渐从纯粹数学转向应用数学,进而发展到多个领域,比如原子物理学、数字计算机设计、认知心理学以及经济学。他的重要贡献之一是在应用数理经济领域,于1944年同普林斯顿的奥斯卡·莫根施特恩合著了《博弈论与经济行为》,创立了博弈论。该书标志着博弈论的形成,被视为该数学分支领域中最重要的贡献。20世纪50年代初,人们开始利用该理论分析现实世界的多种情境。

约翰·冯·诺依曼(右)和罗伯特·奥本海默,后者是第一颗原子弹开发项目主任,该照片拍摄于1952年,他们身后是当时速度最快、最精确的计算机



具有纯策略的抽象游戏


现在,我们来分析第一类博弈,看一看游戏矩阵扩大,即玩家可能的选择不止两种的情况。

我们先看下面这个双人游戏:在下表所示的矩阵(该博弈的收益矩阵)中,玩家A从三行(R1、R2、R3)中选择,对方从三列(C1、C2、C3)选择,双方都不知道对方的做法。双方的选择确定了矩阵中的一个数值(即他们选择的行和列的交点),该数值就是第二位玩家必须支付给第一位玩家的钱数。那么要想获得最大收益,或者把损失降到最低,双方应该分别怎么做呢?

玩家A要根据可能的选择分析其最低收益(如果选择R1,收益为-2;如果选择R2,收益为2;如果选择R3,收益为-1);那么最低收益中的最佳值(即极大极小值)就是2。假如该游戏是确定的,玩家A就必须选择R2。同样,玩家B要找到将损失降到最小的做法(如果选择C1,损失为6;如果选择C2,损失为7;如果选择C3,损失为2)。那么最大损失中的最小值(即极小极大值)也是2。假如该游戏是确定的,玩家B就必须选择C3。

既然该博弈的极大极小值和极小极大值刚好一致,支付数额都是2英镑,我们就可以说,该博弈是确定的,其对弈值为2,可以通过该纯策略来破解:A选择R2,B选择C3。而且,数值2就是一个鞍点(即最小值中的最大值和最大值中的最小值相一致的那个数值),或者说均衡点。

这个例子可以进一步扩展,玩家人数不变,但其原有的3种选择可以扩展到n种。这样的话,相应的收益矩阵也就变成了n×n矩阵。假如存在鞍点,那么只要玩家双方都采用纯策略(也就是对双方最有利的做法),该博弈就能达到均衡点。此类博弈的结果都是固定的,因为假如一方改变策略,就会陷入不利的境地,从而让对方更占优势。



上一章目录下一章
推荐书籍:恋爱中的苏格拉底:哲学入门十讲 表达力:人生情商课 岸萤 儿童发展心理学 记忆记忆 南货店 萨缪尔森传:现代经济学奠基者的一生·第一卷 希特勒最后的阴谋 我想要两颗西柚 舍不得看完的中国史:秦并天下