-
博弈类型及其表述形式
1
博弈的分类
博弈模型一般分为合作博弈(
cooperative
game
)和非合作博弈(
non- cooperative
game
)
,如图
1.1
。合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是
p>
以参与人群的可能联合行动集合为基本元素(
Martin e
and Ariel Rubinstein
,
2000
,
P2
)
,也就是说
,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的
合作、联合或联盟的
关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、
联合或联盟的关系
,并因为这种关系影响到博弈的结局。合作博弈强调的是团体理性
(
collective rationality
)
、效率
、公正和公平;非合作博弈强调的是个人理性、个人最
优决策,其结果可能是有效率的,
也可能是低效率或无效率的(张维迎,
1996
,
P5
)
。
20
世
纪
50
年代,合作博弈的
研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈
论的研究主流逐步转向
在非合作博弈领域。有些人认为非合作博弈模型比合作博弈更“基
本”
< br>,但有些人认为两者不相上下(
Martin
e
and Ariel
Rubinstein
,
2000
,
P2
)
。
合作博弈,有时也叫做联盟博弈(
coalitional g
ame
)
,一般根据有无转移支付而分为
两类:可转移支付联盟博弈(
coalitional game with
transferable payoff
)和不可转移
支付联
盟博弈(
coalitional game with non-
transferable
payoff
)
< br>。可转移支付也叫有旁
支付(
side payment
)
,可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来
衡量他
们的赢得,
且各联盟的赢得可以按任意方式在联盟成员中
分摊;
否则,
就是不可转移支付联
盟博
弈。
可转移支付合作博弈
合作博弈
不可转移支付合作博
博弈
静态博弈
完全信息静态博弈
动态博弈
非合作博弈
完全信息博弈
完全信息动态博弈
不完全信息静态博弈
不完全信息博
图
1.1
博弈的分类
不完全信息动态博弈
非合作博弈的分类主要从两个角度进行划分。
一是参与者的行动顺序。
从这个角度博弈
可以分
为静态博弈(
static
game
)和动态博弈(
dynamic
game
)
。静态博弈是指参与者同时
选择行动或虽非同时但后行动
者并不知前行动者采取了何种行动;
动态博弈是指参与者的行
动
有先后顺序且后行动者能够观察到先行动者所选择的行动。二是参与者掌握的信息水平。
从这个角度,博弈可以分为完全信息博弈和不完全信息博弈。完全信息(
complet
e
information
)指的是每一个参与者对所有其他
参与者的特征、战略空间及支付函数有准确
的知识;否则就是不完全信息(
incomplete
information
)
。
综合上述两种分类方法,可将非合作博弈分成四类。这四类博弈及其对应的均衡概念,
大致上反映了
20
世纪
50
年代以来非合作博弈理论的主要进展和
1994
年三位诺贝尔经济学
将得主的主要贡献,
同时也大
致表明了
“纳什均衡”
及其精炼在博弈论发展中的地位和影响<
/p>
(如表
1.1
)
。
表
1.1
非合作博弈的分类及对应的均衡概念、主要贡献者
行动顺序
信息
完全信息
(
每一参与者对
所有其他参与
者的特征、战略
空间及支付函
数有准确的知
识
)
不完全信息
(
每一参与者对
所有其他参与
者的特征、战略
< br>空间及支付函
数没有准确的
知识
)
静
态
(
参与者
同时选择行动或虽非同时但
后行动者并不知前行动者采取了何
种
行动
)
动
态
(
参与者
的行动有先后顺序且后行动
者能够观察到先行动者所选择的行
动
)
完全信息静态博弈;
纳什均衡;
John
(1950,1951)
完全信息动态博弈;
子博弈完美纳什均衡;
Reinhard Selten(1965)
不完全信息静态博弈;
贝叶斯纳什均衡
John
yi(1967-1968)
不完全信息动态博弈;
完美贝叶斯纳什均衡;
Reinhard Selten(1975),
and
(1982),
erg and (1991)
2
博弈的表述形式
现代博弈理论根据不同的博弈类型给出了博弈模型的三种基本表达形式:标准式
(
normal
form
)表述、
扩展式表述(
extensive
form
representation
)和特征函数型表述。
前两者主要用于非合作博弈,后者主要用于合作博弈。
2.1
标准式表述
标准式表述又称为战略式表述(
strategic
form
)或矩阵式表述(
matrix form
)
。标
准式表述将战略局势抽象为三个基本要素:
(
a
)博弈
的参与者集
N
?
{
1
,
2
,
?
,
n
}
;<
/p>
(
b
)每个参
与者的战略集
S
i
,
< br>?
i
?
N
;
(
c
)
每个参与者的支付函数集
R
i
,
?
i
?
N
。
因此,
一个标准式表
述的博弈可以表示为
G
??
N
,
{
S
i
},
{
R
i
}
?
。
标准式表述主要用来<
/p>
表示静态博弈。标准式博弈也叫做战略博弈。
2.2
扩展式表述
扩展式表述在标准式表述的基础上,扩展了描述博弈局势的要素,比如参与者的行动
顺序以及外生事件的概率分布等,
可以描述更复杂的博弈局势,
极大地扩大了博弈理论所能
描述的范围,一般用来表述动态博弈。扩展式表述一般包
含六个要素:
(
a
< br>)博弈的参与者集
N
?
{
1
,
2
,
?
,
n
}
;
(
b
)参与者的行动顺序(
the order of moves
)
:即什么参与者在什么时候行动;
(
c
)参与者的行动空间(
act
ion set
)
:在每次行动时,参与者有些什么行动可供选
择;
(
d<
/p>
)参与者的信息集(
information set
)
:每次行动时,参与者知道些什么;
(
e
)参与者的支付函数:在行动结束时,每个
局中人得到什么;
(
f
)外生事件(即“自然”的选择)的概率分布。
2.3
特征函数型表述
特征函数型表述主要用来表述联盟博弈或合作博弈。令参与者集合为
N<
/p>
,则称
N
的任
意
子集
S
为联盟
(
coalition
)
,
所有联盟的
全体记为
?
(
N
)
。
可转移支付联盟博弈包括两个
要
素:
(
a
)
有限的参与者集
N
?
{
1
,
2
,
?
,
n
}
;
(
b
)将
N
的每个非空子集
S
< br>(即一联盟)与某个实数
v
(
S
)
相联系的一个特征函数
v
。
因此,可转移支付联盟博弈可记为(
N
,
v
)
。其中特征函数
v
是指定义在
?
(
N
)
上
的一
个实函数,其中
v
(
S
)
表示联盟
S
通过协调其成员的策略所能保证得到的最大赢得。
不可转移支付联盟博弈包括四个要素:
(
a
)有限的参与者集
N
?
{
1
,
2
,
?
,
n
}
;
(
b
)结果集
X
;
(
c
)
将
N
的每个非空子集
S
(即一联盟)赋一个集合
V
(
S
)
?
X
的特
征函数
V
;
(
d
)对每个参与者
i
?
N
有一个
X
上的支付函数
R
i
(
X
),
?
i
?
N
。
因此,不可转移支付联盟博弈可记为
(
N
,
V
,
X
< br>,
{
R
i
(
X
)})
。
博弈的三种表述形式之差别,主要在于描述信息的多寡。扩展型表述形式包括的信息
最多,
如果去掉其中参与者行动顺序和信息结构等信息,
可以简化出标准型表述形式。
在标
准型表述形
式的基础上,
如果引入有约束力的义务且可强制执行的假设,
省
略掉战略集,
则
可进一步简化为特征函数型表述形式。
三种表述形式的可转化性,
表明非合作博弈与合作博
弈之间是可转化的。
《博弈论的诡计》提要与思考
囚徒困境:这个简单的例子,几乎是博弈论的代名词。两个基
于
“
坦白从宽,抗
拒从严
”
审讯的囚徒,从理性的角度出发,会产生怎样的结局?结果若是,从个人理
性并追求个人利益最大化,
那么二人皆坦白,
< br>也就是背叛。
这在四种策略中并不占优,
那为什么不采用
集体最有策略呢而合作。很简单集体的优化,必然侵害个人利益的最
大化。
当然这一切前提是理性假设,
也就是著名的经济人假设:
经济学中的人都是
“
小
人
”
(管理学则认为人是
“
君子
”
,有意思而有道理的比喻)
。
破解这一困境的途径则是
打破信息孤立,而执法者的反制则是维持孤立或者加强威胁。无
论背叛还是合作,谁
在这里面坚持到最后,谁将取胜。
重复博弈:囚徒困境,砸了传统经
济学的场子。因为个人的自利行为,并不一定
导致集体利益的最大化,
< br>“
看不见的手
”
拉不住,人类向
堕落之城下滑的趋势,难道这
真是一个悲哀?索性并非如此,撇去博弈论的理性假设不说
。博弈论者很快发现囚徒
困境只在单次博弈情形下明显,一旦博弈的开始陷入重复,合作
将到来。因为,未来
的收益将左右目前的决策。
以牙还牙:
重复的博弈理论上导致了合作的产生,
但是谁也不能保证合作的继续,
因为之前已经说过,合作的代价是建立在损害个人利益基础之上的。如果个人放弃未
来收益或当前背叛收益大于未来收益,背叛的风险仍然存在。那么在重复博弈中怎样
的策略才是最优。若干睿智而复杂在经过计算机中
PK
之后,极
其原始的
“
以牙换牙
”
策略脱颖而出,固然这个策略简单至极,其威力却无穷,以至于人们在短暂的欣喜之
后,发现这把太阿指之剑倒持的可怕,一旦重复链条中出现一次(也许不经意的)背
叛,那据此原则行事的博弈将永无止境的背叛下去,个人利益极度膨胀的同时,集体
利益
无限衰微。幸好,这个世界不是模型,也不是如此简单。很多时候,我们不必以
牙还牙,
第三方的规范:道德与法律就是我们的假牙,他们更加有利、有理、有节。
人质困境:一场憋屈的博弈。抢打
出头鸟,人质联合固然可以制服歹徒,但是谁
愿出头。这一点给了无数处于劫持者地位的
一方以机会,类似于秦的远交近攻、各个
击破的策略,将最终全盘赢下。人质可有反制的
策略,当然有,不过艰难至极。人质
可以选择沉默,这样他有一定时间苟延残喘;或者联
合劫持者对付人质,结局还是取
决于劫持者,万一他过河拆桥怎么办;同时反抗,集体将
获得左右策略,但是这需要
壮士断腕的勇气,部分人可能因此受伤。这里是实力与勇气的
较量,而且实力暂居上
风。
酒吧博弈:如果人人理性,那么每一天到达酒吧的人数将是差
不多正好的,但是
人非圣贤,
往往是有限理性的。
第一次到酒吧的人多,
那么大多人人认为酒吧人太多,
太挤。第二次决定的时候,参考前次而不去酒吧。少数去的人发现酒吧的人第二天很
少
,感觉很爽,第三次将继续回来,并重新带回许多人
……
循环就
此开始。酒吧博弈
一方面显示,现实的博弈参与者,是极其有限理性的,其理性只前延后
伸一小段。历
史数据只对计算机有用,对人,则不一定。
-
-
-
-
-
-
-
-
-
上一篇:新闻报道常用词汇
下一篇:职业规划以及自我能力SWOT分析