博弈论知识点总结完整版_高中生题库网|高考真题|高考试题-「密云二中」

-

2021年2月2日发(作者：manage什么意思)

博弈论

（一）

：基本知识

1.1

定义

博弈论，又称对策论，是使用

严谨的数学模型研究冲突对抗条件下最优

决策问题的理论，

是研究竞争的逻辑和规律

的数学分支。

即，博弈论是研究决策主体在

给定信息结构下如何决策以最大化自己的

效用，以及不同决策主体之间的均衡。

1.2

基本要素：参与人、各参与人的策

略集、各参与人的收益函数，

是博弈最重要

的基本要素。

1.3

博弈的分类：博弈论根据其所采用

的假设不同而分为合作博弈理论和非合作

博弈理论。

两者的区别在于参与人在博弈过

程中是否能够达成一个具有约束力的协议

（

binding agreement

）

。

倘若不能，

则称非合

作博弈（

Non-cooperative game

）

。

合作博弈强调的是集体主义，团体理

性，是效率、公平、公正；而非合作博弈则

主要研究人们在利益相互影响的局势中如

何选择策略使得自己的收益最大，

强调个人

理性、个人最优决策，其结果有时有效率，

有时则不然。

目前经济学家谈到博弈论主要

指的是非合作博弈，

也就是各方在给定的约

束条件下如何追求各自利益的最大化，

最后

达到力量均衡。

博弈的划分可以从参与人行动的次序

和参与人对其他参与人的特征、

战略空间和

支付的知识、

信息，

是否了解两个角度进行。

把两个角度结合就得到了

种博弈：

、完全信息静态博弈，纳什均衡，

Nash(1950)

b

、完全信息动态博弈，子博弈精炼纳

什均衡，泽尔腾（

1965

）

、不完全信息静态博弈，贝叶斯纳什

均衡，海萨尼（

1967-1968

）

、不完全信息动态博弈，精炼贝叶斯

纳

什

均

衡

，

泽

尔

腾

（

19 75

）

Kreps,

Wilson(1982) Fudenberg, Tirole(1991)

1.4

课程主要内容：完全信息静态博弈

完全信息动态博弈

不完全信息静态博弈

机制设计

合作博弈

1.5

博弈模型的两种表示形式：策略式

表

述

(Strategic

form),

扩

展

式

表

述

（

Extensive form

）

1.6

占优均衡：

 a

、占优策略：在博弈中如果不管其他

参与人选择什么策略，

一个参与人的某个策

略给他带来的支付值始终高于其他策略，

或

至少不劣于其他策略，

则称该策略为该参与

人的严格占优策略或占优策略。

对于所有的

s-i

 ，

si*

称为参与人

i

的严格占优战略，如果满足：

ui(si*,s-i)>ui(si',s-i)

?

s-i,

?

si'

?

si*

b

、占优均衡：一个博弈的某个策略组

合中，
如果对应的所有策略都是各参与人的

占优策略，

则称该策略组合为该博弈的一个

占优均衡。

1.7

重复剔除严劣策略均衡：

a

、

“严劣”和“弱劣”的含义：

设

s

i

’

和

s

i

’’

是参与人

i

可选择的两个策

略，若对其他参与人的任意策略组合

s

-i

,

均

成立

u

i

(

s

i

’

,

s

-i

) 

<”

改为“≤”

，则
说策略

s

i

’
弱劣于策略

s

i

’’

。

b

、

定义：

重复剔除严格策略就是

各参与人在其各自策略集中，

不断剔除严劣策略?如果最终

各参与人仅剩下一个策略，则

该策略组合就被称为重复剔除

严劣策略均衡。

（

二

）：

纳

什

均

衡

（

Nash

Equilibrium

）

2.1

纳什均衡定义：对于一个策略式表

述的博弈

G=

{

N,S

i

,

u

i

,

i

∈

N

}

，

称策略组合

s

*

=(

s

1

, …

s

i

, …,

s

n

)

是一个纳什均衡，如果对于

每一个

i

∈

N

,

s

i

*

是给定其他参与人选择

s

-i

*

={

s

1

*

,

…

,

s

i

-1

*

,

s

i

+1

*

,

…

,

s

n

*

}

情况下参与人
i

的最优策略

（经济理性策略）

，

即：

u

i

(

s

i

*

,

s

-i

*

)

≥

u

i

(

s

i

,

s

-i

*

),

对于任意的

s

i

∈

S

i

,

任意的

i

∈

N

均成立。

通俗定义：纳什均衡是一种策略组合，

给定对手的策略，

每个参与人选择自己的最

优策略。纳什均衡是一种稳定的策略组合：

当所有参与人的选择公开以后，

每个人都满

意自己作出了正确的选择；

没有人能得到更

好的结果了。

在博弈论中这种结果被称为纳

什均衡（

NE

）

。

2.2

定理：

Nash

在

1950

年证明：任何

有限博弈

，

都至少存在一个

NE

——

Existence

of

Nash

Equilibrium

。即

在一个有

n

个参与人的策
略式博弈

G={S1,

?

,Sn; u1,

?

,un}

中，

如果

n

是有限的，

且

Si

是有限集

（

i=1 ,

?

,n

）

，

则该

博弈至少存在一个纳什均衡

（在混合策略意

义下）

Wilson

（

1971

）证明，几乎所有有限博

弈，

都存在有限奇数个

NE
，

包括纯策略

NE

和混合策略

NE

。——

Oddness Theorem

2.3

纳什均衡、占优均衡、重复剔除严

劣策略均衡的关系

定理

a

每一个占优均衡、重复剔除严劣策

略均衡一定是纳什均衡，

但反过来不一定成

立；

定理

b

纳什均衡一定不能通过重复剔除严

劣策略方法剔除。

2.4

划线法

先找出自己针对其他博弈方每种策略或策

略组合（对多人博弈）的最佳对策，即自己

的可选策略中与其他博弈方的策略或策略

组合配合，

给自己带来最大得益的策略

（这

种相对最佳策略总是存在的，

不过不一定唯

一）

，然后在此基础上，通过对其他博弈方

策略选择的判断，

包括对其他博弈方对自己

策略判断的判断等，

预测博弈的可能结果和

确定自己的最优策略。这就是划线法。

2.5

箭头法

箭头法对于理解博弈关系很有好处

,

是

寻找相对稳定性策略组合的分析方法。

对博

弈中的每个策略组合进行分析，

考察在每个

策略组合处各个参与方能否通过改变自己

2

的策略而增加得益。如能，则从所分析的策

略组合对应的得益数组引一箭头到改变策

略后策略组合对应的得益数组。

最后综合对

每个策略组合的分析情况，

形成对博弈结果

的判断。划线法和箭头法的结果是一致的，

可以相互替代。

（

三

）

：

混

合

策

略

（

Mixe d

Strategies

）纳什均衡

3.1

定义：混合策略的定义：在博弈

G={N, Si, ui, i

∈

N}

中，假设参与人

i

的纯策

略构成的策略集合为

Si={si1,

?

, si k}

，若参

与人

i
以概率分布

pi=(pi1,

?

, pik)

在其

k

个
 可选策略中随机选择“策略”

，称这样的选

择方式为混合策略。这里，

0

≤

pij

≤

1,

对

于

j=1 ,

?

, k

都成立，且有

, pi1+

?

+ pik=1

。

纯策略可看成特殊的混合策略。

上述定义是

在有限博弈前提下进行的。

3.2

混合策略意义下策略组合的表述

{x1

∈

X1,

?

,

xn

∈

Xn}

，其中

Xi

,

i

=1,

?

, n

表示参与人
 i

所有纯策略生成的概

率空间，

xi

为参与人

i

的一个具体混合策略

猜硬币博弈的一个混合策略就可记为

{

（

1/2, 1/2

）

,(1/2, 1/2)}

3.3VNM

效用函数（

Von

Neumann

and

Morge nstern

冯

·

诺依曼和摩根斯坦）

如果某个随机变量

X

以概率

Pi

取值

xi

，

i=1,2,

?

,n

，而某人在确定地得到

xi

时的效

用为

u(xi)

，

那么，

该随机变量给他的效用便

是：

U(X) = P

1

u(x1) + P

2

u(x2) + ... + P

n

u(xn)

 表示关于随机变量

X

的期望效用。

因此

U(X)

称为期望效用函数，又叫做冯·诺依曼——

摩根斯坦效用函数（

VNM

函数）

。

3.4

基于混合策略意义下的博弈策略式

表述

定义：基于

(v-N-M

效用的

)

策略式博弈

由

a

、参与人集合

b

、每个参与人有一个

（纯）策略集合

c

、对于每一个参与人来

说，

由所有参与人纯策略组合构成的风险结

果空间，存在一个

v-N-M

效用

3.5

混合策略意义下的纳什均衡

定义：对于博弈

G= {N, Si, ui, i

∈

N}

，

基于

v-N-M

效用的混合策略组合

α

*

是一个

纳什均衡，

若对于每一个

i,

以及

i
的任意一

个混合策略

α

i

，

α

*

对应的期望支付至少和

(

α

i

，

α

*-i )

的期望支付一样大

换句话说，称混合策略组合

α

*

是一个

纳什均衡，

如果没有一个参与人通过偏离策

略

α

*i

实现支付的增加

3.6

一个定理

对于

N-

人静态博弈问题，设混合策略
纳什均衡对应的策略组合为

(Xi ,

X

–

i )

。

对于任意的

i ,

若最优混合策略为

Xi=

{x1,

?

,xl

，

0

?

0}(

不失一般性，假设前

l

个

分量严格大于

0)

，记分量

xk (k=1,

?

, l)

对

应的纯策略

sk,

则对于参与人

i
而言，

sk

与其他参与人

的最优混合策略组合

X

–

i

形成的局势的

收益值

,

等于纳什均衡混合策略组合

(Xi,

X

–

i )

的收益值。即

ui (sk, X

–

i ) = ui (Xi,

X

–

i )

成立

，

k=1,

?

, l

3.7

方法：

a

、求解混合策略均衡可以用期望收益

等值法

b

、

2
×

2

双矩阵博弈的图解法

:

反应函数

的三个交点即是纳什均衡

（四）

：

多重纳什均衡解及其分析

4.1

帕雷托占优均衡

帕雷托占优均衡的含义是：

在多个纳什

均衡中，

若存在一个纳什均衡，其支付结果

针对每个参与人而言都严格优于其它纳什

均衡，则该纳什均衡是帕雷托占优纳什均

衡。

4.2

风险占优均衡

(risk- dominant

equilibrium)

参与人对风险占优均衡的选择倾向，

有

一种强化的机制。
当部分或所有参与人选择

风险占优均衡的可能性增强的时候，

任一参

与人选择帕雷托占优均衡策略的期望支付

会进一步减小，

而这又使得帕雷托占优均衡

策略的支付更小，

从而形成一种选择风险占

优均衡策略的正反馈机制，

并使其出现的概

率越来越大。

当参与人数目增加时，

选择合作的风险

将会更大，

可借助该点考虑招标机制如何减

3

少投标方勾结问题。

上述问题是我们知道建

立诚信机制社会的重要意义。

上述问题引出

一个博弈相关分支为协调博弈

(coordination

game)

4.3

聚点均衡

由实际问题抽象出来的博弈模型中，

更

多的一类问题是：

多个纳什均衡间不存在帕

雷托占优关系或明显的风险占优关系，

如夫

妻爱好问题的两个纯策略均衡。

这时如何预

测哪一个纳什均衡会出现是一个很有意义

的问题

以夫妻爱好博弈为例，

在实际中往往二

人很默契地知道如何进行博弈，

双方往往知

道怎么进行选择策略，

且能够相互了解

（这

里面排除了互相协商后达成的一致）

实际博弈中参与人往往会利用博弈模

型以外的信息，

实现对特定博弈均衡一致关

注的“聚点”

这些信息如：

参与人共同的文化背景或

规范，共同的知识，

具有特定意义事物的特

征，某些特殊的数量、位置关系等

聚点均衡确实反映了人们在多重纳什

均衡选择中的某些规律性，

但因为涉及因素

太多，对于一般博弈模型很难总结普遍规
律，只能具体问题具体分析

聚点：

人们通常会协调彼此的行为。

（你

弱他就强）

；先例产生的影响远大于逻辑或

者法律效力；

人们总是乐于安守现状或接受

自然形成的界线（三八线）

4.4

相关均衡

(correlated equilibrium)

实际上，

在现实中遇到选择困难时，特

别是在长期中反复遇到相似选择难题时，

常

会通过收集更多信息，

形成特定的机制和规

则，为某种形式的制度安排等主动寻找思

路。

相关均衡就是这样的一种均衡选择机

制。

对于实际中比较复杂的博弈问题，

参与

人是否有能力设计这种机制，

并且有足够能

力理解、信任这种机制，是有一定疑问的。

相关均衡作为社会经济制度创新的一

种解释也许更有意义。

4.5

防共谋均衡

(coalition-proof

equilibrium)

-

-

-

-

-

-

-

-

本文更新与2021-02-02 19:00，由作者提供，不代表本网站立场，转载请注明出处：https://www.bjmy2z.cn/gaokao/602156.html

返回列表：英语

上一篇：coso内部控制模型
下一篇：swot自我分析范文3篇(优秀版)

当前您在：主页 > 英语 >

博弈论知识点总结完整版

-

-

-

-

-

-

-

-

-

返回列表：英语

博弈论知识点总结完整版的相关文章

爱心与尊严的高中作文题库

爱心与尊严高中作文题库

爱心与尊重的作文题库

爱心责任100字作文题库

爱心责任心的作文题库

爱心责任作文题库

爱心长在作文题库

爱心中国感恩励志作文题

爱心助考作文题库

爱心助农作文题库

爱心尊重宽容拒绝作文题

爱心尊重作文题库

爱心作文题库好段

爱心作文题库120字

爱心作文题库读者

爱心作文题库分论点

爱心作文题库简短

爱心作文有哪些题库

爱需要被尊重作文题库

爱需要传递200字作文题库

爱需要公平作文题库

爱需要行动作文800高中作

爱需要行动作文题库

爱需要交流与沟通作文题

当前您在： 主页 > 英语 >

-

-

-

-

-

-

-

-

-

博弈论知识点总结完整版的相关文章

当前您在：主页 > 英语 >