人人书

博弈论:决策制胜的法则全文阅读

外国小说文学理论侦探推理惊悚悬疑传记回忆杂文随笔诗歌戏曲小故事
人人书 > 科普学习 > 博弈论:决策制胜的法则

合作的数学:非零和博弈

书籍名:《博弈论:决策制胜的法则》    作者:乔迪·德罗夫
推荐阅读:博弈论:决策制胜的法则txt下载 博弈论:决策制胜的法则笔趣阁 博弈论:决策制胜的法则顶点 博弈论:决策制胜的法则快眼 博弈论:决策制胜的法则sodu
上一章目录下一章
    《博弈论:决策制胜的法则》合作的数学:非零和博弈,页面无弹窗的全文阅读!



为了说明零和博弈和非零和博弈之间的差别,我们来看一个打广告的例子。两家同类公司A和B想给自己的产品打广告,并收到了同一个电视频道的报价。他们的广告时段可以选在下午(该频道收看这一时段节目的观众占40%),或者晚间(同类观众占60%),但不能都选,而且已知两个时段之间没有重叠。两家公司如果选择同一时段打广告,那么就能分别让该时段30%的观众来购买他们的产品,同时失去另一时段的全部观众;而如果他们选择不同时段打广告,那么就能分别吸引到其所在时段观众的50%。两家公司应该如何选择?他们应该将自己的决策告诉对方,还是最好保密?

我们可以用收益矩阵来体现这场博弈,里面的数值是两家公司吸引的消费者的百分比。不过,这个矩阵跟之前那些有所不同,每一项不可能只有一个数值,因为一家公司的收益并不是另一家公司的损失,两家公司都是获益的。因此,这里的每一项都包含两个数值,分别对应两家公司采取相应策略时的收益。

A和B假如都在下午打广告,那么分别会吸引全部观众的12%(即40%的30%);而假如他们选择的时段不同,那结果则呈现对称性。所以,如果A选择下午,B选择晚间,A会得到全部观众的20%(即40%的50%),B会得到全部观众的30%(即60%的50%);如果他们的决策相反,那相应的收益也会互换。

我们要是按照之前的方法来分析这场博弈,那现在就应该假设双方都会争取其收益矩阵中的最大利益,从而列出两个矩阵(分别呈现两家公司的收益)。

公司A的矩阵

公司B的矩阵

显然,两个矩阵具有对称性,而且公司A的策略对应各行,公司B的策略对应各列,对两家公司的分析是类似的。这和零和博弈的分析方法完全一致。矩阵中没有鞍点(极大极小值为18,极小极大值为20),这意味着我们要找到一个混合策略,并由此得出公司A的对弈值。该混合策略包括以3/5的概率运用策略1(下午时段)和2/5的概率运用策略2(晚间时段),对弈值为19.2(每次博弈的平均收益)。同样,考虑到矩阵的对称性,公司B的混合策略与之恰恰相反。每五次博弈中,他们要随机运用策略1两次,策略2三次,从而获得相同的平均收益。到目前为止,所有的步骤似乎都与之前无异,我们可以认为这就是双方的最优策略——该博弈已经得以破解。

然而,我们只要更加仔细地分析一下就会发现,两家公司都希望在不影响对方的前提下增加自己的收益。这样一来,之前的解决方案就不是最佳选择了,利用零和博弈混合最优策略的方法所得出的对弈值也不一定是双方可能获得的最高收益值了。

这是因为在零和博弈中,最优策略的基本思想是限制(或减少)对方的最大收益,这就意味着最大限度地增加自己的收益。但是,现在情况不同了。假设公司A不采用混合策略,而是决定选择纯策略2(晚间时段),而公司B采用混合的最优策略。这样的话,A的平均收益就是:30·2/5+18·3/5=22.8,而B的收益还是19.2。可以看到,B的收益没变,而A的收益增加了,这种情况在零和博弈中是不可能出现的。当然,B也会有同样的想法,即自己采用纯策略2,并期望A采用混合策略。这样的话,B就能增加收益,而A的收益也不会减少。

可要是两家公司都采用策略2,情况又会如何?那双方都只能获得18%,收益减少的幅度相同。到这里,问题似乎陷入僵局,因为尽管双方都可以在不影响对方的情况下增加自己的收益,但是当他们同时这样做的时候,不但没有达到这个目的,反而让自己的收益比平均期望值更低。

不过,还有另一种可能。我们假设双方达成协议,都不选择令其收益最低的策略(即在同一时段打广告)。有了这项协议,两家公司就能获得更大的收益,甚至能让双方的收益相同。如果A交替选择策略1和策略2,且B交替选择策略2和策略1,那么两家公司每次打广告的平均收益都是25(对A来说,收益值20和30会交替出现,而对B来说,收益值30和20会交替出现)。因此,这种解决方案似乎才是最好的,也是均衡的。



上一章目录下一章
推荐书籍:恋爱中的苏格拉底:哲学入门十讲 表达力:人生情商课 岸萤 儿童发展心理学 记忆记忆 南货店 萨缪尔森传:现代经济学奠基者的一生·第一卷 希特勒最后的阴谋 我想要两颗西柚 舍不得看完的中国史:秦并天下