生活中的游戏——博弈无处不在
安徽省高考分数线-三年级下学期班主任工作计划
生活中的游戏——博弈无处不在
日常生活中的一切,均可从博弈论得到解释,大到近段
时间北约轰炸南联盟,小到今天早
上你突然咳嗽了几声。因为生活的本质,就是在进行一场游戏。 可能你觉得,北约轰炸南联盟用博弈论来分析是可以的,但对自己早上咳嗽也可以用博弈论
来理解觉
得不可思议,因为自己就一个人,和谁进行游戏?非也,并非只有你一人,还有一
个叫做“自然(Nat
ure)”的“人”,你在同它进行游戏。你可以把“自然”理解为无所不能
的上帝,上帝现在有两种策
略,让你生病或不生病。你咳嗽了,你就不得不根据自己咳嗽的
信息判断上帝的策略,然后采取对应的策
略。上帝采取让你生病的策略,你就采取吃药的策
略来对付;上帝采取不让你生病的策略,你就采取不予
理睬的策略。看,这不就是一场你和
上帝进行博弈的游戏吗?
“自然”是研究单人博弈的重
要假定。比如一个农夫种庄稼也是同自然进行博弈的一个过程。
自然的策略可以是:天旱、多雨、风调雨
顺。农夫对应的策略分别是:防旱、防涝、放心地
休息。当然,自然究竟采用哪种策略并不确定,于是农
夫只有根据经验判断(或根据气象预
报)来确定自己的行动。如果估计今年的旱情教重,就可早做防旱准
备;如果估计水情严重,
就早做防涝准备;如果估计是风调雨顺,农夫就可以悠闲地东转转西走走了。又
比如,农夫
该在土地上种小麦还是水稻?也是一个同自然进行博弈的游戏。自然可以选择小麦买高价还<
br>是水稻卖高价,农夫则根据对自然的可能行动的猜测来确定自己的行动。与一般的博弈不同
的是,
不管“自然”采取何种策略,也不管你采取何种策略,“自然”的支付(或得益)都
是为0的。 生活中更多的游戏不是单人博弈,而是双人或多人的博弈。比如:商场谈判、政治斗争、夫
妻吵架、
恋爱结婚„„都是这类博弈。
再给大家介绍一个有趣的博弈例子。它出自张维迎教授的《博弈论与信
息经济学》,讲的是
猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应
的按钮。
按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若
小猪先到
,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下
表示(没格第一个数字
是大猪的得益,第二个数字是小猪的得益):
小猪
按 等待
大猪 按 5,1 4,4
等待 9,-1 0,0
在这个例子中,我们可以发现,大猪选择按
,小猪最好选择等待,大猪选择不按,小猪还是
最好选择等待。即不管大猪选择按还是不按,小猪的最佳
策略都是等待。也就是说,无论如
何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不
按的话都饿肚子,按
的话还可以有4个单位的收益。所以纳什均衡是(大猪按,小猪等待)。
这个例子是一个多劳不多得的例子。现实中这种情况是很普遍的,一些努力工作的人和不工<
br>作的人得到与付出并不相称。改革也有类似的情况,在改革过程中利益的转移必定使一部分
人先富
一部分人生活水平没得到改善,前一部分人更有改革的积极性。也就是说,改革往往
由“
大猪”推动,“大猪”越多,改革速度越快。这个例子也可以反映斯密的“看不见手”
教条,本来大猪是
追求自身的利益,结果给小猪也带来了利益。它也解释了“搭便车”行为,
例子中的小猪是一个典型的“
搭便车”者,因为它坐享大猪的成果。在这里我们可以联系一
下第二章提到的科斯定理,如果我们严格界
定产权,是可以改变这种状况的。比如,以法律
的形式规定,大猪按出的饲料归大猪支配,小猪按出的饲
料归小猪支配,那么大猪小猪都存
在去按的动力和积极性。相反,产权不清晰,比如吃大锅饭的情况下,
结果是不劳有获、劳
而少获,有点类似一幅漫画——卖力的驴子挨鞭子(一只驴子拉着一辆车,车上是一
个农夫
和另外几头驴子,农夫的鞭子落在拉车的驴子身上催它快跑;这只驴子并没有错,它遭罪只
因为它比别的驴子强壮)。于是人们工作的积极性没有了。我想,这也是为什么我国改革开
放不久,就
提出了废除“大锅饭”,砸碎“三铁”(铁饭碗、铁交椅、铁工资)的原因所在了。
在智
猪博弈中,无论大猪采取何种行动,小猪都是采取等待。我们把小猪的“等待”称为“占
优战略”(有点
“以不变应万变”的意思)。生活中这样的博弈也不少。比如,某一天你觉得
应该是你太太的生日,但又
不能肯定:如果是太太的生日的话,①你可以送一束花,太太会
特别高兴,你的效用增加5个单位,②你
不送花,但太太会埋怨你忘了她的生日,你的效用
降低2个单位;如果不是太太的生日的话,①你可以送
太太一束花,太太感到意外的惊喜,
你的效用增加3个单位,②你不送花,结果生活同往常一样,可视为
你的效用增加0单位。
在这个博弈里,我们看到,“自然”可以有两种策略:确定今天是太太的生日或确
定今天不
是太太的生日,但不论“自然”采取何种策略,你的最好行动都是买花。买花是你的占优战略。博弈距阵如下(自然的得益皆为0):
自然
是太太的生日 不是太太的生日
你 买花 5,0
3,0
不买花 -2,0 0,0
夫妻
吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱(或称鹰派和鸽派)。博弈的
可能结果有四种组
合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。至于
哪一种是纳什均衡,必须列出其
支付矩阵才可以确定。支付矩阵不一定非要用量化确定的数
字表示,也可以用支付函数表示。经济学家们
常用支付函数进行讨论。根据生活的实际观察,
夫软弱妻软弱是婚姻最稳定的一种,因为互相都不愿让对
方受到伤害或感到难过,常常情愿
自己让步。动物学的研究有相同的结论,性格温顺的雄鸟和雌鸟更能和
睦相处,寿命也更长。
夫强硬妻强硬是婚姻最不稳定的一种,大多数结局是负气离婚。夫强硬妻软弱和妻
强硬夫软
弱是最常见的一种,许多夫妻吵架都是这样,最后终归是一方让步,不是丈夫撤退到院子里点根烟,就是妻子避让到卧室里嚎啕大哭。
犯罪和防止犯罪是罪犯和警察之间进行博
弈的一场游戏。警察可以加强巡逻,或者休息。犯
罪者可以采取作案、不作案两种策略。如果罪犯知道警
察休息,他的最佳选择就是作案;如
果警察加强巡逻,他最好还是不作案。对于警察,如果他知道犯罪者
想作案,他的最佳选择
是加强巡逻,如果犯罪者采取不作案,自己最好去休息。当然,犯
罪者和警察都不可能完全
知晓对方将采取的行动,因此他们都将估计对方采取某种行动的概率,从而决定
自己要采取
的行动。结果是,他们将以一定的概率随机地采取行动,这叫“混合策略”。
我们可以简单地分析一下混合策略(对数字不感兴趣的读者可以不看下面一段)。下面是犯
罪者
与警察的支付矩阵(假定犯罪者在警察休息时一定作案成功,在警察巡逻时作案一定会
被抓住):
犯罪者
不作案 作案
警察 巡逻 0,0 2,-2
休息 2,0 -1,1
这个矩阵的数字含义可以表示,警察巡逻,犯罪者不作案,双方都没有收益也没有损失;警<
br>察巡逻,犯罪者作案,警察因抓到罪犯受到表彰,得到效用2单位,罪犯被判刑丧失效用2
单位;
警察休息,犯罪者不作案,警察休息的很愉快得到效用2单位,犯罪者没有收益也没
有损失;警察休息,
犯罪者作案,警察因失职被处分而丧失效用1单位,罪犯犯罪成功获得
效用1单位。这个博弈是没有纳什
均衡的。
但是,如果警察知道犯罪者以p的概率选择作案(不作案概率就为1-p),他
该怎样采取自己
的行动?对警察而言,巡逻的预期效用为0×(1-p)+2p=2p,休息的预期效用
为2×(1-p)
-1×p=2-3p。显然,当2p>2-3p即p>0.4的时候,警察最好选择巡
逻;反之2p<2-3p即p<0.4的
时候,警察宁愿选择休息。假设警察应以q的概率巡逻(休息的
概率就为1-q),那么犯罪者
最好的行动是什么?他作案的预期效用是-2×q+1×(1-q)=1
-3q,不作案的预期效用为0×q+0×
(1-q)=0。显然,当1-3q>0即q<0.33时,
他的理性选择是作案,反之不作案。在这个博
弈中,警察以0.33的概率巡逻0.67的概率休息,犯
罪者以0.4 的概率作案0.6的概率不作
案构成一个混合纳什均衡。
上述混
合纳什均衡可以这样理解,如果警察以高于0.33的概率巡逻,犯罪者最好是躲避起
来。犯罪者一旦躲
避,警察就没有收获,于是降低巡逻的概率,于是犯罪者重新活跃,于是
警察又提高巡逻概率„„从一个
长期来看,两者的均衡将维持在警察以0.33的概率巡逻犯
罪者以0.4的概率作案上面。现实中,我
们看到,当严打的时候(警察出击的概率较高),
犯罪分子便收敛一阵(降低作案概率);严打的时期一
过,犯罪分子又开始兴风作浪,在不
能容忍罪犯过分猖狂的时候,警界不得不再次开始严打。
在上述例子中,可能大家觉得警察和犯罪者都根据一定概率采取自己的行动不太好理解,那<
br>么可以尝试这样理解他们:作案的犯罪者越多,那么出动的警察将会越多,作案的犯罪者越
少,出
动的警察将越少;反过来,出动的警察越多,作案的犯罪者就越少,出动的警察越少,
作案的犯罪者就越
多。极端地假设一个例子(它有助于我们的理解),警局有100名警察,
犯罪集团有100名犯罪者,
那么上例博弈中,警察以0.33的概率巡逻而犯罪者以0.4 的概
率作案这一纳什均衡可以理解为:
在巡逻的警察少于33人时,犯罪集团最好派40名以上的
犯罪者作案;在巡逻警察多于
33人时,犯罪集团最好派40名以下的犯罪者作案;反过来,
犯罪集团派40名以下犯罪者作案,警局
最优选择出动33名以下的警察;犯罪集团派40名
以上犯罪者作案,警局最优选择出动33名以上的警
察。当然,如果犯罪集团倾巢出动,那
么警察的选择也是全部出动,但警察一旦全部出动,犯罪者最好选
择全部不作案,犯罪者一
旦选择全部不作案,警察最好全部选择休息„„最后长期的均衡状态是,警局派
33名警察
巡逻,犯罪集团派40个人作案。这可以解释现实中,为什么警界总安排有巡逻力量,而犯<
br>罪者也总保持一定的作案数量。
你面临的具体生活事件又何尝不是一场博弈呢?我
曾经在一次讲课中给某毕业班的学生提
到了博弈论的观点(就是运筹学里面非常简单的零和博弈那种)。
下课后,就有一名学生向
我“求教”对付“赵老师”的办法。赵是分管毕业分配的教师。这名学生可真有
灵性,他已
经把博弈论运用到他和决定他前途的赵老师之间了。当时的情况是,赵希望该同学及早和用<
br>人单位签约(因为赵希望早一点把所有同学分配出去以完成任务),而该同学希望等更好的
单位。
当然,这个博弈中局中人的收益函数我们不能确切地知道,因此它是一个不完全信息
的非合作博弈(但不
可是零和博弈),博弈的结果也许还和双方的讨价还价能力有关。我当
时给这学生的建议是:你要尽可能
了解赵的“信息”(即赵的各种真实想法);你要向赵传递
强硬的信息(态度坚决);你要准备充分理由
,增强讨价还价能力。
不但生活中许多事情可以看作是一场博弈,整个人生也是一场博弈
。这个博弈中的“局中人”
一个是你自己,另一个叫做“命运”。你和命运之间在展开一场以一生时间为
限的游戏。谁
输谁赢,取决于你的策略和行动。贝多芬说“我要扼住命运的咽喉”,他成功了。人生是一
场游戏——在这个游戏中,你以一生作注,和命运进行着一场豪赌,要么赢得痛快淋漓,要
么输
得一败涂地。世事纷纭如棋局,你在红尘中的每一步,都象落下一枚棋子,一招失误,
并不意味着满盘结
束,只要没有和盘,就不能认输。可惜的是,不少的人,甘听命运摆布。
可是也有一些人,奋起与世事抗
争。我比较欣赏持那种态度的人:世事我曾抗争,得失不必
在我。
我觉得,不论
最后的结果如何,人都应该争取。很多时候我们也需要一种胆识,敢于面对命
运的胆识。我们有理由相信
,自己会成为游戏的胜利者。该赌一把的时候,不要犹豫,坐失
良机。有句歌词兼流行广告说的好:该出
手时就出手。只不过,在你所有的人生的博弈中,
你必须重视“策略”。