-
博弈论
(一)
:基本知识
< br>1.1
定义
:
博弈论,又称对策
论,是使用
严谨的数学模型研究冲突对抗条件下最优
决策问题的
理论,
是研究竞争的逻辑和规律
的数学分支。
< br>即,博弈论是研究决策主体在
给定信息结构下如何决策以最大化自己的
效用,以及不同决策主体之间的均衡。
1.2<
/p>
基本要素:参与人、各参与人的策
略集、各参与人的收益函数,<
/p>
是博弈最重要
的基本要素。
1.3
博弈的分类:博弈论根据其所采用
的假设不
同而分为合作博弈理论和非合作
博弈理论。
两者的区别在于参与
人在博弈过
程中是否能够达成一个具有约束力的协议
(
binding agreement
)
。
p>
倘若不能,
则称非合
作博弈(
Non-cooperative
game
)
。
合作博弈强调的是集体主义,团体理
性,是效率、公平、公正;而非合作博弈则
主要研究人们在利益相互影响的局势中如
何选择策略使得自己的收益最
大,
强调个人
理性、个人最优决策,其结果有时有效率,
有时则不然。
目前经济学家谈到博弈论主要
指
的是非合作博弈,
也就是各方在给定的约
束条件下如何追求各自
利益的最大化,
最后
达到力量均衡。
博弈的划分可以从参与人行动的次序
和参与人对其他参与人的特
征、
战略空间和
支付的知识、
信息,<
/p>
是否了解两个角度进行。
把两个角度结合就得到了
4
种博弈:
a
、完全信息静态博弈,纳什均衡,
Nash(1950)
< br>b
、完全信息动态博弈,子博弈精炼纳
什均衡,泽尔腾(
1965
)
c
、不完全信息静态博弈,贝叶斯纳什
均衡,海萨尼(
1967-1968
)
d
、不完全信息动态博弈,精炼贝叶斯
纳
什
均
衡
,
泽
尔
腾
(
19
75
)
Kreps,
Wilson(1982) Fudenberg, Tirole(1991)
1.4
课程主要内容:完全信息静态博弈
完全信息动态博弈
不完全信息静态博弈
机制设计
合作博弈
1
1.5
博弈模型的两种表示形式:策
略式
表
述
(Strategic
form),
扩
展
式
表
述
(
Extensive
form
)
1.6
占优均衡:
< br>a
、占优策略:在博弈中如果不管其他
参与人选择什么策
略,
一个参与人的某个策
略给他带来的支付值始终高于其他策略
,
或
至少不劣于其他策略,
则称该策略
为该参与
人的严格占优策略或占优策略。
对于所有的
s-i
< br>,
si*
称为参与人
i
的严格占优战略,如果满足:
ui(si*,s-i)>ui(si',s-i)
?
s-i,
?
si'
?
si*
b
、占优均衡:一个博弈的某个策略组
合中,
如果对应的所有策略都是各参与人的
占优策略,
则称该策略
组合为该博弈的一个
占优均衡。
1.7
重复剔除严劣策略均衡:
a
、
“严劣”和“弱劣”的含义:
设
s
i
p>
’
和
s
i
’’
是参与人
i
可选择
的两个策
略,若对其他参与人的任意策略组合
s
-i
,
均
成立
u<
/p>
i
(
s
i
’
,
s
-i
) <
u
i
(
s
i
’’
,
s
-i
),
则说策略
s
i
’
严劣于策略
s
i
’’
。
上面式子中,若将“<
/p>
<”
改为“≤”
,则
说策略
s
i
’
弱劣于策略
s
i
’’
。
b
、
定义:
重复剔除严格策略就是
各参与人在其各自策略集中,
不断剔除严劣策略?如果最终
各参与人仅剩下一个策略,则
该策略组合就被称为重复剔除
严劣策略均衡。
(
二
):<
/p>
纳
什
均
衡
(
Nash
Equilibrium
)
2.1
纳什均衡定义:对于一个策略式表
述的博
弈
G=
{
N,S
i
,
u
i
,
p>
i
∈
N
}
,
称策略组合
s
p>
*
=(
s
1
, …
s
i
, …,
s
n
)
是一个
纳什均衡,如果对于
每一个
i
∈
N
,
s<
/p>
i
*
是给定其他参与人选择
s
-i
*
={
s
1
*
,
…
,
s
i<
/p>
-1
*
,
s<
/p>
i
+1
*
,
…
,
s
n<
/p>
*
}
情况下参与人
i
的最优策略
(经济理性策略)
,
即:
u
i
(<
/p>
s
i
*
,
s
-i
*
)
≥
u
i
(<
/p>
s
i
,
s
-i
*
),
对于任意的
s
i
∈
S
i
,
任意的
i
∈
N
均成立。
通俗定义:纳什均衡是一种策略组合,
给定对手的策略,
每个参与人选择自己的最
优策略。纳什均衡
是一种稳定的策略组合:
当所有参与人的选择公开以后,
每个人
都满
意自己作出了正确的选择;
没有人能得到更
好的结果了。
在博弈论中这种结果被称为纳
什均衡(<
/p>
NE
)
。
2.2
定理:
Nash
在
1950
年证明:任何<
/p>
有限博弈
,
都至少存在一个
NE
——
Existence
of
Nash
Equilibrium
。即
在一个有
n
个参与人的策
略式博弈
G={S1,
?
,Sn;
u1,
?
,un}
中,
如果
n
是有限的,
且
Si
是有限集
(
i=1
,
?
,n
)
,
则该
博弈至少存在一个纳什均衡
(在混
合策略意
义下)
Wilson
(
1971
)证明,几乎所有有限博
弈,
都存在有限奇数个
NE
,
包括纯策略
NE
和混合策略
p>
NE
。——
Oddness
Theorem
2.3
纳什均衡、占优均衡、重复剔除严
p>
劣策略均衡的关系
定理
a
每
一个占优均衡、重复剔除严劣策
略均衡一定是纳什均衡,
但反过
来不一定成
立;
定理
b
纳
什均衡一定不能通过重复剔除严
劣策略方法剔除。
2.4
划线法
先找出自己针对其他博弈方每种策略或策
略组合(对多人博弈)的最佳对策,即自己<
/p>
的可选策略中与其他博弈方的策略或策略
组合配合,
给自己带来最大得益的策略
(这
种相对最佳策略总是
存在的,
不过不一定唯
一)
,然后在此
基础上,通过对其他博弈方
策略选择的判断,
包括对其他博弈方
对自己
策略判断的判断等,
预测博弈的可能结果和
确定自己的最优策略。这就是划线法。
2.5
箭头法
箭头法对于理解博弈关系很有好处
,
是
寻找相对稳定性策略组合的分析方法。
对博
弈中的每个策略组
合进行分析,
考察在每个
策略组合处各个参与方能否通过改变自
己
2
的策略而增加得益。如能,则
从所分析的策
略组合对应的得益数组引一箭头到改变策
略后策略
组合对应的得益数组。
最后综合对
每个策略组合的分析情况,<
/p>
形成对博弈结果
的判断。划线法和箭头法的结果是一致的,
可以相互替代。
(
三
)
:
混
合<
/p>
策
略
(
Mixe
d
Strategies
)纳什均衡
3.1
定义:混合策略的定义:在博弈
G={N, Si, ui, i
∈
N}
中,假设参与人
i
的纯策
略构成的策
略集合为
Si={si1,
?
, si
k}
,若参
与人
i
以概率分布
pi=(pi1,
?
,
pik)
在其
k
个
< br>可选策略中随机选择“策略”
,称这样的选
择方式为混合
策略。这里,
0
≤
pij
≤
1,
对<
/p>
于
j=1
,
?
,
k
都成立,且有
,
pi1+
?
+ pik=1
。
纯策略可看成特殊的混合策略。
上述定义是
在有
限博弈前提下进行的。
3.2
混合策略意义下策略组合的表述
{x1
∈
X1,
?
,
xn
∈
Xn}
,其中
Xi
,
i
=1,
?
, n
表示参与人
< br>i
所有纯策略生成的概
率空间,
xi
为参与人
i
的一个具体混合策略<
/p>
猜硬币博弈的一个混合策略就可记为
{
(
1/2,
1/2
)
,(1/2, 1/2)}
3.3VNM
效用函数(
Von
Neumann
and
Morge
nstern
冯
·
诺依曼和摩根斯坦)
如果某个随机变量
X
以概率
Pi
取值
xi
,
i=1,2,
?
,n
,而某人在确定地得到
xi
时的效
p>
用为
u(xi)
,
那么,
该随机变量给他的效用便
是:
U(X) = P
1
u(x1) +
P
2
u(x2) + ... +
P
n
u(xn)
< br>表示关于随机变量
X
的期望效用。
因此
U(X)
称为期望效用函数,又叫做冯·诺依曼——
p>
摩根斯坦效用函数(
VNM
函数)
。
3.4
基于混合策
略意义下的博弈策略式
表述
定义:基
于
(v-N-M
效用的
)
策略式博弈
由
a
、参与人集合
b
、每个参与人有一个
(纯)策略集合
c
p>
、对于每一个参与人来
说,
由所有参与人纯
策略组合构成的风险结
果空间,存在一个
v-N-M
效用
3.5
混合策略意义下的纳什均衡
定义:对于博弈
G= {N, Si, ui, i
∈
N}
,
基于
v-N-M
效用的混合策略组合
α
*
是一个
纳什均衡,
若对于每
一个
i,
以及
i
的任意一
个混合策略
α
i
,
α
*
对应的期望支付
至少和
(
α
i
,
α
*-i
)
的期望支付一样大
换句话说,称混
合策略组合
α
*
是一个
纳什均衡,
如果没有一个参与人通过偏离策
略
α
*i
实现支付的增加
3.6
一个定理
对于
N-
人静态博弈问题,设混合策略
纳什均衡对应的策略组合为
(Xi ,
X
–
i )
。
对于任意的
i
,
若最优混合策略为
Xi=
{x1,
?
,xl
,
0
?
0}(
不失一般性,假设前
l
个
分量严格大于
0)
,记分量
xk
(k=1,
?
, l)
对
应的纯策略
sk,
则对于参与人
i
而言,
sk
与其他参与人
的最优混
合策略组合
X
–
i
形成的局势的
收益值
,
等于纳
什均衡混合策略组合
(Xi,
X
–
i
)
的收益值。即
ui (sk, X
–
i ) = ui (Xi,
X
–
i )
成立
,
k=1,
?
, l
3.7
方法:
a
、求解混合策略均衡可以用期望收益
等值法
b
、
2
×
2
双矩阵博弈的图解法
:
反应函数
的三个交点即是纳什均衡
(四)
:
多重纳什均衡解及其分析
4.1
帕雷托占优均衡
帕雷托占优均衡的含义是:
在多个纳什
均衡中,
若存在一个纳什均衡,其支付结果
针对每个参与人而言
都严格优于其它纳什
均衡,则该纳什均衡是帕雷托占优纳什均
衡
。
4.2
风险占优均衡
(risk-
dominant
equilibrium)
参与人对风险
占优均衡的选择倾向,
有
一种强化的机制。
当部分或所有参与人选择
风险占优均衡的可能性增强的时候,
任一参
与人选择帕雷托占优均衡策略的期望支付
会进一步减小
,
而这又使得帕雷托占优均衡
策略的支付更小,
从而形成一种选择风险占
优均衡策略的正反馈机制,
并
使其出现的概
率越来越大。
当参与人
数目增加时,
选择合作的风险
将会更大,
可借助该点考虑招标机制如何减
3
少投标方勾结问题。
上述问题是我们知道建
立诚信机制社会的
重要意义。
上述问题引出
一个博弈相关分支为协调博弈
(coordination
game)
4.3
聚点均衡
由实际问题抽象出来的博弈模型中,
更
多的一类问题是:<
/p>
多个纳什均衡间不存在帕
雷托占优关系或明显的风险占优关系,<
/p>
如夫
妻爱好问题的两个纯策略均衡。
这时
如何预
测哪一个纳什均衡会出现是一个很有意义
的问题
以夫妻爱好博弈为例,
在实际中往往二
人很默契地知道如何进行博弈,
双方往往知
道
怎么进行选择策略,
且能够相互了解
(这
里面排除了互相协商后达成的一致)
实际博弈中参与人往往
会利用博弈模
型以外的信息,
实现对特定博弈均衡一致关
注的“聚点”
这些信息如:
参与人共同的文化背景或
规范,共同的知识,
具有特定
意义事物的特
征,某些特殊的数量、位置关系等
聚点均衡确实反映了人们在多重纳什
均衡选择中的某些规律性,
但因为涉及因素
太多,对于一般博弈模型很难总结普遍规
律,只能具体问题具体分析
聚点:
人们通常会协调彼此的行为。
(你
弱他就强)
;先例产生的影响远大于逻辑或
者法律效力;
人们总是
乐于安守现状或接受
自然形成的界线(三八线)
4.4
相关均衡
(correlated
equilibrium)
实际上,
在现实中遇到选择困难时
,特
别是在长期中反复遇到相似选择难题时,
常
会通过收集更多信息,
形成特定的机制和规
则,为某种
形式的制度安排等主动寻找思
路。
相
关均衡就是这样的一种均衡选择机
制。
对于实际中比较复杂的博弈问题,
参与
人是否有能力设计这种
机制,
并且有足够能
力理解、信任这种机制,是有一定疑问的。
相关均衡作为社会经济制度创新的一
种解释也许更有意义。
4.5
防共谋
均衡
(coalition-proof
equilibrium)
-
-
-
-
-
-
-
-
-
上一篇:coso内部控制模型
下一篇:swot自我分析范文3篇(优秀版)