-
博弈论的基本概念
?
博弈论是研究两人或多人谋略和决策的理论。
?
博弈论思想古已有之,我国古代的
《孙子兵法》就不仅是一部军事著作,
而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、
桥牌、
赌博
中的胜负问题,人们对博弈局势的把握只停留在经验上
,
没有向理论化发
展,
正式发展成一门学科则是在
20
世纪初。
1928
年冯
·
诺意曼证明了博弈
论的基本原理,从
而宣告了博弈论的正式诞生。
1944
年,冯
< br>·
诺意曼和摩
根斯坦共著的划时代巨著
< br>《博弈论与经济行为》
将二人博弈推广到
n
人博
弈结构并将博弈论系统的应用于经济领域,
从而
奠定了这一学科的基础和
理论体系。纳什的开创性论文《
n
p>
人博弈的均衡点》(
1950
),《非合作
博弈》(
1951
)等等,给出了纳什
均衡的概念和均衡存在定理。
此外,
塞尔顿、
哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈
论已发展
成一门较完善的的学科。
?
参与者:
参与者是指一个博弈中的决策主体,
通常又称为参与人或局中人。
参与人的目的是通过合理悬着自己的行动,
以便取得最大化的收益。
< br>参与
者可以是自然人,也可以是团体。
?
信息:
信息是指参与者在博弈过程中能了解和观察到的知识。
信息对参
与
者是至关重要,
每一个参与者在每一次进行决策之前必须根据
观察到的其
他参与者的行动和了解到的有关情况作出自己的最佳选择。
< br>完全信息是指
所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来
说
是共同知识。
?
策略:
策
略是参与者如何对其他参与者的行动作出反应的行动规则,
它规
定参与者在什么时候选择什么行动。
通常用
s
< br>i
表示参与者
i
的一个特定策<
/p>
略,用
S
i
表示
参与者
i
的所有可选择的策略的集合(又成为而
i
的策略空
间)
。如果
n
个参与者没人选择一个策略,那么
s
=
(
s1
,
s2
,
…
,
s
n
)称
为一个策略组合
。
?
收益
:
收益是在一个特定的策略组合下参与者能得到的确定的效用。
通常
用
u
i
表
示参与者
i
的收益,它是策略组合的函数。
?
均衡:均衡是所有参与者的
最优策略组合,记为
s
*
。
几个经典的博弈实例
?
例一
囚徒困境
两个共同作案的犯罪嫌疑人被捕,
并受到指控。
除非至
少一人认罪,
否则警方无充分证据将他们按最论
刑。
警方把他们隔离审讯,
并对他们说明不同行动所带来的后果
。如果两人都采取沉默的抗拒态度,
因警方证据不足,
两人将均
被判为轻度犯罪入狱一个月;
如果双方都坦白,
根据案情两人将
被判入狱六个月;
如果一个招认而另一个拒不坦白,
招认
者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。
?
例二
海滩占位
甲、
乙两个冷饮摊贩,
他们在一个直线
状的海滩上,
以
同样的价格,
相同的质
量向均匀散布在海滩上的众多游客销售冷饮。
既然
是做生意,<
/p>
目的总是多赚钱,
甲乙两人有时在同一地点做同样的生意,
竞
争是难免的,
这两个摊贩应该怎样安排自己
的摊位,
才能相安无事的做自
己的生意?(假定游客总是到据自
己最近的摊位购买冷饮)
。
?
例三
智猪争食
猪圈里有一头打猪和一头小猪。里面有一个猪食槽,槽
的对面装有控制开关。
只要去拱开关,
就会有一次
6
个单位的饲料流进槽
里。如果它们都不去拱开关,那么它们都吃不到饲料;如果小猪
去拱,那
么等到它跑回来时,
大猪已把饲料吃光了;
如果大猪去拱,
等它回来时可
以吃到
1
个单位的饲料;
如果他们一起去拱,
在一起跑回来,
那么大猪可
以抢到
< br>4
个单位的饲料,
小猪也能吃到
2
个单位的饲料。
假定每拱一次开
坦白
沉默
囚<
/p>
徒
一
坦白
沉默
-6
,
-6
-9
,
0
0
,
-9
-1
,
-1