人人书

博弈论:决策制胜的法则全文阅读

外国小说文学理论侦探推理惊悚悬疑传记回忆杂文随笔诗歌戏曲小故事
人人书 > 科普学习 > 博弈论:决策制胜的法则

数学与期望

书籍名:《博弈论:决策制胜的法则》    作者:乔迪·德罗夫
推荐阅读:博弈论:决策制胜的法则txt下载 博弈论:决策制胜的法则笔趣阁 博弈论:决策制胜的法则顶点 博弈论:决策制胜的法则快眼 博弈论:决策制胜的法则sodu
上一章目录下一章
    《博弈论:决策制胜的法则》数学与期望,页面无弹窗的全文阅读!



我们在运气游戏中做决策时,所依据的最重要的概念之一就是所谓的“数学期望”(mathematical expectation)。我们先来看几个例子,然后给出该术语的完整定义。假设我们要玩这样一个游戏:抛出两枚硬币,如果都是正面朝上,赢4英镑;都是反面朝上,赢1英镑;一枚正面朝上,一枚反面朝上,输3英镑。我们赢钱的把握大吗?估计能赢或者能输多少?

抛出两枚硬币,可能产生4种结果:两枚正面(p=1/4),两枚反面(p=1/4),一枚正面一枚反面(p=1/4),一枚反面一枚正面(p=1/4)。所以,平均来说,每抛4次,就会两正,两反,两次一正一反。这就意味着,平均来看,输赢结果为1·£4+1·£1+2·(-£3)=-£1。由此可见,这场赌局我们不应该参与,否则就会平均每4局输掉1英镑,更准确地说,是每局输掉25便士。该游戏结果也可以这样来算,将每一种可能情况的概率乘以相应的赢钱数额(或者输钱数额),然后取各项之和,即:

1/4·£4+1/4·£1+1/2·(-£3)=-£0.25

再来看第二个例子。一场骰子赌局,如果点数为6,庄家回报6个筹码;点数为奇数,回报4个筹码;其他情况没有筹码。每轮我们应该下注多少才能保证输赢持平?

我们已知,p(6点)=1/6,p(奇数点)=1/2,所以每轮下来,预计结果为:1/6·6+1/2·4+1/3·0=3个筹码。所以,只要下注3个筹码,就能输赢持平(即玩家不输不赢)。

通过这个例子,我们可以引入数学期望和平衡赌博两个概念,并且从更加广义的范畴来定义它们。假设E1、E2、E3……En代表运气游戏中可能发生,但不会同时发生的事件,其发生概率分别为p1、p2、p3……pn(p1+p2+p3+……+pn=1),相应的回报为r1、r2、r3……rn,那么某个游戏(或某个随机试验)的预计回报,或者说数学期望(X,在这个游戏中即事件E1、E2、E3……En的结果)就可以被定义为:

X=p1·r1+p2·r2+p3·r3+……+pn·rn

根据这个定义,如果某种赌博游戏的数学期望(即每一轮的平均回报)与下注数额相等,那么我们才能称之为公平的(或者说平衡的)。我们还可以说,这类游戏的总体数学期望(预计回报减去赌注)为0。

利用数学期望来判断运气游戏是否平衡,还可以用另外一种方法。

三枚骰子的赌博

某运气游戏玩法如下:玩家给1到6的某个数字,比如3,下注1英镑。同时掷出三枚骰子,如果掷得一个3,赢1英镑;两个3,赢2英镑;三个3,赢3英镑。不论哪种情况,玩家都能赢回下注的1英镑赌金。如果三枚骰子都不是3,则输掉赌金。这个游戏平衡吗?对玩家有利,还是对庄家有利?

乍一看,这种赌法似乎对玩家有利,而事实并非如此。如果我们按照下面的思路来考虑问题的话,这场赌博好像很诱人。由于有三枚骰子,每一枚得到制胜点数的概率都是1/6,那么赢钱的概率就至少是1/2。而且,我们甚至有机会掷得两个甚至三个3。也就是说,该游戏是有利于玩家的。

然而,以上推理是不正确的。其实,该游戏的结果有216(6·6·6)种。出现三个3的情况只是其中一种(p=1/216),出现两个3的情况有15种(p=15/216),玩家赌金翻倍的情况有75种(p=75/216)。因此,玩家输掉赌金的情况就有125(216-1-15-75)种。

输钱的次数(125)要比赢钱的次数(90)更多。我们来计算一下下注1英镑的数学期望:

3·1/216+2·15/216+1·75/216-1·125/216=108/216-125/216=-17/216=-0.0787……

所以,这个游戏是有利于庄家的,预计其每局可赢将近8便士。

由此看出,数学期望在运气游戏中是很有用处的。另外,此概念还可以用于很多随机情境中。这些情境往往与运气游戏毫不相关,举例如下:

提前报名

假设一次会议将于明年7月召开,你很想参加,但由于有工作和其他一些事情,你拿不准是否能够成行。

如果在3月1日之前缴费,报名费是150英镑(如果参加不了,报名费不退);如果在这之后报名,报名费则是200英镑(甚至到会当天报名缴费也可以)。

2月28日,你估计自己参会的可能性(我们用p来代表此概率)。到底是提前缴费,还是到会之后再缴费呢?概率p的值能给你提供什么信息?

如果提前缴费,期望值是损失150英镑(因为不管你是否参会,费用概不退还)。

如果到会缴费,期望值是损失£200·p+(1-p)·0=-£200·p(只有到会之后才付钱)。

假如p=150/200=0.75,二者就会相等。

因此,假如p>0.75,最好提前报名;假如p<0.75,最好到会以后再报名。假如p=0.75,那怎么做都无所谓。



上一章目录下一章
推荐书籍:恋爱中的苏格拉底:哲学入门十讲 表达力:人生情商课 岸萤 儿童发展心理学 记忆记忆 南货店 萨缪尔森传:现代经济学奠基者的一生·第一卷 希特勒最后的阴谋 我想要两颗西柚 舍不得看完的中国史:秦并天下