何时达到均衡？

《博弈论：决策制胜的法则》何时达到均衡？,页面无弹窗的全文阅读!

我们在前一部分中分析的博弈从很多方面来看都很简单。玩家只有两人（属双人博弈），而且每人只有两种选择（都是2×2的收益矩阵）。另外，它们都是零和博弈，因为双方的收益总和都是0（损失即为负收益）。玩家在每一轮中的决策都减少到了一到两种。根据博弈条件，双方都会选择一种确定的策略（即双方的最优策略），该博弈也由此确定，同时博弈的结果还会与对弈值（就像前一部分中的第一个例子一样）相对应。我们前面说过，如果博弈有鞍点，也就是说，其矩阵的某一个值既是极大极小值（每一行最小值中的最大值），也是极小极大值（每一列最大值中的最小值），那该博弈就一定有解决方案。否则，玩家就无法运用纯策略，而必须采用混合策略，该策略要保密，并且要在考虑运气因素的前提下进行选择。当收益矩阵具有对称性时，玩家应该采取的策略就是完全随机地进行选择（就像前一部分中的第二个例子一样）。要不然，玩家即使仍然采用了随机策略，也必须衡量每一种可能行为所产生的结果（就像前一部分中的第三个例子一样）。

约翰·冯·诺依曼（1903-1957）

约翰·冯·诺依曼在多个科研领域都颇有造诣，是20世纪最杰出的数学家之一。他出生于布达佩斯，并在这里开始学习数学，后来到柏林学习物理，又到苏黎世学习化学工程。1930年，他移居美国。在哥廷根生活期间，在希尔伯特的指导下，他致力于纯数学理论问题的研究，并且与海森堡共同开发了第一个量子理论公式。他在众多领域做出了重大贡献，包括集合论、泛函分析、逻辑学、概率论、应用数理经济、量子物理学和气象学等。

后来，他的兴趣逐渐从纯粹数学转向应用数学，进而发展到多个领域，比如原子物理学、数字计算机设计、认知心理学以及经济学。他的重要贡献之一是在应用数理经济领域，于1944年同普林斯顿的奥斯卡·莫根施特恩合著了《博弈论与经济行为》，创立了博弈论。该书标志着博弈论的形成，被视为该数学分支领域中最重要的贡献。20世纪50年代初，人们开始利用该理论分析现实世界的多种情境。

约翰·冯·诺依曼（右）和罗伯特·奥本海默，后者是第一颗原子弹开发项目主任，该照片拍摄于1952年，他们身后是当时速度最快、最精确的计算机

具有纯策略的抽象游戏

现在，我们来分析第一类博弈，看一看游戏矩阵扩大，即玩家可能的选择不止两种的情况。

我们先看下面这个双人游戏：在下表所示的矩阵（该博弈的收益矩阵）中，玩家A从三行（R1、R2、R3）中选择，对方从三列（C1、C2、C3）选择，双方都不知道对方的做法。双方的选择确定了矩阵中的一个数值（即他们选择的行和列的交点），该数值就是第二位玩家必须支付给第一位玩家的钱数。那么要想获得最大收益，或者把损失降到最低，双方应该分别怎么做呢？

玩家A要根据可能的选择分析其最低收益（如果选择R1，收益为-2；如果选择R2，收益为2；如果选择R3，收益为-1）；那么最低收益中的最佳值（即极大极小值）就是2。假如该游戏是确定的，玩家A就必须选择R2。同样，玩家B要找到将损失降到最小的做法（如果选择C1，损失为6；如果选择C2，损失为7；如果选择C3，损失为2）。那么最大损失中的最小值（即极小极大值）也是2。假如该游戏是确定的，玩家B就必须选择C3。

既然该博弈的极大极小值和极小极大值刚好一致，支付数额都是2英镑，我们就可以说，该博弈是确定的，其对弈值为2，可以通过该纯策略来破解：A选择R2，B选择C3。而且，数值2就是一个鞍点（即最小值中的最大值和最大值中的最小值相一致的那个数值），或者说均衡点。

这个例子可以进一步扩展，玩家人数不变，但其原有的3种选择可以扩展到n种。这样的话，相应的收益矩阵也就变成了n×n矩阵。假如存在鞍点，那么只要玩家双方都采用纯策略（也就是对双方最有利的做法），该博弈就能达到均衡点。此类博弈的结果都是固定的，因为假如一方改变策略，就会陷入不利的境地，从而让对方更占优势。