关键词不能为空

当前您在: 主页 > 英语 >

博弈论知识点总结完整版

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2021-02-02 19:00
tags:

-

2021年2月2日发(作者:manage什么意思)


博弈论



(一)


:基本知识


< br>1.1


定义


:


博弈论,又称对策 论,是使用


严谨的数学模型研究冲突对抗条件下最优


决策问题的 理论,


是研究竞争的逻辑和规律


的数学分支。

< br>即,博弈论是研究决策主体在


给定信息结构下如何决策以最大化自己的

< p>
效用,以及不同决策主体之间的均衡。



1.2< /p>


基本要素:参与人、各参与人的策


略集、各参与人的收益函数,< /p>


是博弈最重要


的基本要素。


< p>
1.3


博弈的分类:博弈论根据其所采用


的假设不 同而分为合作博弈理论和非合作


博弈理论。


两者的区别在于参与 人在博弈过


程中是否能够达成一个具有约束力的协议



binding agreement




倘若不能,


则称非合


作博弈(


Non-cooperative game





合作博弈强调的是集体主义,团体理


性,是效率、公平、公正;而非合作博弈则


主要研究人们在利益相互影响的局势中如


何选择策略使得自己的收益最 大,


强调个人


理性、个人最优决策,其结果有时有效率,


有时则不然。


目前经济学家谈到博弈论主要


指 的是非合作博弈,


也就是各方在给定的约


束条件下如何追求各自 利益的最大化,


最后


达到力量均衡。



博弈的划分可以从参与人行动的次序


和参与人对其他参与人的特 征、


战略空间和


支付的知识、


信息,< /p>


是否了解两个角度进行。


把两个角度结合就得到了


4


种博弈:



a


、完全信息静态博弈,纳什均衡,


Nash(1950)

< br>b


、完全信息动态博弈,子博弈精炼纳


什均衡,泽尔腾(


1965




c


、不完全信息静态博弈,贝叶斯纳什


均衡,海萨尼(


1967-1968




d


、不完全信息动态博弈,精炼贝叶斯










19 75




Kreps,


Wilson(1982) Fudenberg, Tirole(1991)





1.4


课程主要内容:完全信息静态博弈



完全信息动态博弈



不完全信息静态博弈



机制设计



合作博弈



1



1.5


博弈模型的两种表示形式:策 略式





(Strategic


form),








Extensive form





1.6


占优均衡:


< br>a


、占优策略:在博弈中如果不管其他


参与人选择什么策 略,


一个参与人的某个策


略给他带来的支付值始终高于其他策略 ,



至少不劣于其他策略,


则称该策略 为该参与


人的严格占优策略或占优策略。




对于所有的


s-i

< br>,



si*


称为参与人


i


的严格占优战略,如果满足:



ui(si*,s-i)>ui(si',s-i)




?



s-i,


?



si'


?


si*



b


、占优均衡:一个博弈的某个策略组


合中,

如果对应的所有策略都是各参与人的


占优策略,


则称该策略 组合为该博弈的一个


占优均衡。



1.7


重复剔除严劣策略均衡:



a




“严劣”和“弱劣”的含义:





s


i




s


i


’’


是参与人


i


可选择 的两个策


略,若对其他参与人的任意策略组合


s


-i


,



成立



u< /p>


i


(


s


i



,


s


-i


) <


u


i


(


s


i


’’


,


s


-i


),


则说策略


s


i



严劣于策略


s


i


’’





上面式子中,若将“< /p>


<”


改为“≤”


,则

说策略


s


i


弱劣于策略


s


i


’’





b




定义:


重复剔除严格策略就是


各参与人在其各自策略集中,

< p>
不断剔除严劣策略?如果最终


各参与人仅剩下一个策略,则


该策略组合就被称为重复剔除


严劣策略均衡。






):< /p>







Nash


Equilibrium




2.1


纳什均衡定义:对于一个策略式表


述的博 弈


G=



{


N,S


i


,


u


i


,



i



N


}




称策略组合


s


*


=(


s


1


, …


s


i


, …,


s


n


)


是一个 纳什均衡,如果对于


每一个


i



N


,


s< /p>


i


*


是给定其他参与人选择


s


-i


*


={


s


1


*


,



,


s


i< /p>


-1


*


,


s< /p>


i


+1


*


,



,


s


n< /p>


*


}


情况下参与人

i


的最优策略


(经济理性策略)



即:


u


i


(< /p>


s


i


*


,


s


-i


*


)



u


i


(< /p>


s


i


,


s


-i


*


),


对于任意的



s


i



S


i


,


任意的



i



N


均成立。




通俗定义:纳什均衡是一种策略组合,


给定对手的策略,


每个参与人选择自己的最


优策略。纳什均衡 是一种稳定的策略组合:


当所有参与人的选择公开以后,


每个人 都满


意自己作出了正确的选择;


没有人能得到更


好的结果了。


在博弈论中这种结果被称为纳


什均衡(< /p>


NE





2.2


定理:



Nash



1950


年证明:任何< /p>


有限博弈



都至少存在一个


NE


——


Existence


of


Nash


Equilibrium


。即



在一个有


n


个参与人的策

略式博弈


G={S1,


?


,Sn; u1,


?


,un}


中,


如果


n


是有限的,



Si


是有限集



i=1 ,


?


,n




则该


博弈至少存在一个纳什均衡


(在混 合策略意


义下)



Wilson



1971


)证明,几乎所有有限博


弈,


都存在有限奇数个


NE


包括纯策略


NE


和混合策略


NE


。——


Oddness Theorem


2.3


纳什均衡、占优均衡、重复剔除严


劣策略均衡的关系



定理


a



每 一个占优均衡、重复剔除严劣策


略均衡一定是纳什均衡,


但反过 来不一定成


立;



定理


b



纳 什均衡一定不能通过重复剔除严


劣策略方法剔除。



2.4


划线法



先找出自己针对其他博弈方每种策略或策


略组合(对多人博弈)的最佳对策,即自己< /p>


的可选策略中与其他博弈方的策略或策略


组合配合,


给自己带来最大得益的策略


(这


种相对最佳策略总是 存在的,


不过不一定唯


一)


,然后在此 基础上,通过对其他博弈方


策略选择的判断,


包括对其他博弈方 对自己


策略判断的判断等,


预测博弈的可能结果和


确定自己的最优策略。这就是划线法。



2.5


箭头法



箭头法对于理解博弈关系很有好处


,



寻找相对稳定性策略组合的分析方法。


对博


弈中的每个策略组 合进行分析,


考察在每个


策略组合处各个参与方能否通过改变自 己


2



的策略而增加得益。如能,则 从所分析的策


略组合对应的得益数组引一箭头到改变策


略后策略 组合对应的得益数组。


最后综合对


每个策略组合的分析情况,< /p>


形成对博弈结果


的判断。划线法和箭头法的结果是一致的,


可以相互替代。








合< /p>





Mixe d


Strategies


)纳什均衡



3.1


定义:混合策略的定义:在博弈


G={N, Si, ui, i



N}


中,假设参与人


i


的纯策


略构成的策 略集合为


Si={si1,


?


, si k}


,若参


与人


i

以概率分布


pi=(pi1,


?


, pik)


在其


k


< br>可选策略中随机选择“策略”


,称这样的选


择方式为混合 策略。这里,


0



pij




1,


对< /p>



j=1 ,


?


, k


都成立,且有


, pi1+


?


+ pik=1



纯策略可看成特殊的混合策略。


上述定义是


在有 限博弈前提下进行的。



3.2


混合策略意义下策略组合的表述



{x1



X1,


?


,


xn



Xn}


,其中


Xi


,


i


=1,


?


, n


表示参与人

< br>i


所有纯策略生成的概


率空间,


xi


为参与人


i


的一个具体混合策略< /p>



猜硬币博弈的一个混合策略就可记为


{



1/2, 1/2



,(1/2, 1/2)}


3.3VNM


效用函数(


Von


Neumann


and


Morge nstern



·


诺依曼和摩根斯坦)



如果某个随机变量


X


以概率


Pi


取值


xi



i=1,2,


?


,n


,而某人在确定地得到


xi


时的效


用为


u(xi)



那么,


该随机变量给他的效用便


是:



U(X) = P


1


u(x1) + P


2


u(x2) + ... + P


n


u(xn)


< br>表示关于随机变量


X


的期望效用。


因此


U(X)


称为期望效用函数,又叫做冯·诺依曼——


摩根斯坦效用函数(


VNM


函数)




3.4


基于混合策 略意义下的博弈策略式


表述



定义:基 于


(v-N-M


效用的


)


策略式博弈





a


、参与人集合




b


、每个参与人有一个


(纯)策略集合




c


、对于每一个参与人来


说,


由所有参与人纯 策略组合构成的风险结


果空间,存在一个


v-N-M

< p>
效用



3.5


混合策略意义下的纳什均衡



定义:对于博弈


G= {N, Si, ui, i

< p>


N}



基于

< p>
v-N-M


效用的混合策略组合


α


*


是一个


纳什均衡,


若对于每 一个


i,


以及


i

的任意一


个混合策略


α


i



α


*


对应的期望支付 至少和


(


α


i



α


*-i )


的期望支付一样大



换句话说,称混 合策略组合


α


*


是一个


纳什均衡,


如果没有一个参与人通过偏离策



α


*i


实现支付的增加



3.6


一个定理


对于


N-


人静态博弈问题,设混合策略

纳什均衡对应的策略组合为


(Xi ,



X



i )




对于任意的


i ,


若最优混合策略为


Xi=


{x1,


?


,xl



0


?


0}(


不失一般性,假设前


l



分量严格大于


0)


,记分量


xk (k=1,


?


, l)



应的纯策略


sk,



则对于参与人


i

而言,


sk


与其他参与人


的最优混 合策略组合


X



i


形成的局势的


收益值


,


等于纳 什均衡混合策略组合



(Xi,



X



i )


的收益值。即


ui (sk, X



i ) = ui (Xi,


X



i )


成立





k=1,


?


, l


3.7


方法:



a


、求解混合策略均衡可以用期望收益


等值法



b



2

×


2


双矩阵博弈的图解法


:


反应函数


的三个交点即是纳什均衡



(四)



多重纳什均衡解及其分析



4.1


帕雷托占优均衡



帕雷托占优均衡的含义是:


在多个纳什


均衡中,


若存在一个纳什均衡,其支付结果


针对每个参与人而言 都严格优于其它纳什


均衡,则该纳什均衡是帕雷托占优纳什均


衡 。



4.2


风险占优均衡


(risk- dominant


equilibrium)


参与人对风险 占优均衡的选择倾向,



一种强化的机制。

当部分或所有参与人选择


风险占优均衡的可能性增强的时候,


任一参


与人选择帕雷托占优均衡策略的期望支付


会进一步减小 ,


而这又使得帕雷托占优均衡


策略的支付更小,


从而形成一种选择风险占


优均衡策略的正反馈机制,


并 使其出现的概


率越来越大。



当参与人 数目增加时,


选择合作的风险


将会更大,


可借助该点考虑招标机制如何减


3



少投标方勾结问题。


上述问题是我们知道建


立诚信机制社会的 重要意义。


上述问题引出


一个博弈相关分支为协调博弈


(coordination


game)


4.3


聚点均衡


由实际问题抽象出来的博弈模型中,



多的一类问题是:< /p>


多个纳什均衡间不存在帕


雷托占优关系或明显的风险占优关系,< /p>


如夫


妻爱好问题的两个纯策略均衡。


这时 如何预


测哪一个纳什均衡会出现是一个很有意义


的问题



以夫妻爱好博弈为例,


在实际中往往二


人很默契地知道如何进行博弈,


双方往往知


道 怎么进行选择策略,


且能够相互了解


(这


里面排除了互相协商后达成的一致)



实际博弈中参与人往往 会利用博弈模


型以外的信息,


实现对特定博弈均衡一致关


注的“聚点”



这些信息如:


参与人共同的文化背景或


规范,共同的知识,


具有特定 意义事物的特


征,某些特殊的数量、位置关系等



聚点均衡确实反映了人们在多重纳什


均衡选择中的某些规律性,


但因为涉及因素


太多,对于一般博弈模型很难总结普遍规

律,只能具体问题具体分析



聚点:


人们通常会协调彼此的行为。


(你


弱他就强)


;先例产生的影响远大于逻辑或


者法律效力;


人们总是 乐于安守现状或接受


自然形成的界线(三八线)



4.4


相关均衡


(correlated equilibrium)


实际上,


在现实中遇到选择困难时 ,特


别是在长期中反复遇到相似选择难题时,



会通过收集更多信息,


形成特定的机制和规


则,为某种 形式的制度安排等主动寻找思


路。



相 关均衡就是这样的一种均衡选择机


制。



对于实际中比较复杂的博弈问题,


参与


人是否有能力设计这种 机制,


并且有足够能


力理解、信任这种机制,是有一定疑问的。



相关均衡作为社会经济制度创新的一


种解释也许更有意义。



4.5


防共谋 均衡


(coalition-proof


equilibrium)

-


-


-


-


-


-


-


-



本文更新与2021-02-02 19:00,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/602156.html

博弈论知识点总结完整版的相关文章

  • 爱心与尊严的高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊严高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊重的作文题库

    1.作文关爱与尊重议论文 如果说没有爱就没有教育的话,那么离开了尊重同样也谈不上教育。 因为每一位孩子都渴望得到他人的尊重,尤其是教师的尊重。可是在现实生活中,不时会有

    小学作文
  • 爱心责任100字作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任心的作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文