博弈论(第四讲)



《博弈论(第四讲)》由会员分享,可在线阅读,更多相关《博弈论(第四讲)(42页珍藏版)》请在文档大全上搜索。
1、 理性是共同知识时的理性是共同知识时的博弈求解博弈求解 基本概念:理性、信念、混合策略与期望效用基本概念:理性、信念、混合策略与期望效用博弈求解:参与者是理性的博弈求解:参与者是理性的博弈求解:参与者是理性的且参与者知道博弈求解:参与者是理性的且参与者知道参与者是理性的参与者是理性的博弈求解:理性成为共同知识博弈求解:理性成为共同知识定位博弈定位博弈合伙人博弈合伙人博弈第4讲 理性是共同知识时的博弈求解4.1 基本概念基本概念4.1.1基本概念基本概念理性理性 当一位参与者尽可能使自己的支付最大化并采取行动时, 就认为这位参与者是理性理性的。 参与者有足够的能力对自身的处境进行判断 参与者有足
2、够的能力对其他参与者的行为进行预期 参与者有足够的能力对各种行动方案进行评估 参与者以自身支付支付最大化原则采取行动 理性意味着仅仅追求自身的利益,而不管这些利益是如何 被定义的。偏好4.1 基本概念基本概念4.1.2基本概念基本概念信念信念 信念是参与人对其他参与人行为的主观判断。从数学上看,参与人i的信念是关于其他参与人的策略的一个概率分布,用-i来表示, -i S-i,其中S-i是指除了参与人i的其他所有参与人所采取策略的概率分布集合。 在两方博弈中(-i=j),假定每个参与人都有有限数量的策略。参与人i对于参与人j所采取策略的信念是一个函数jSj,其中对于参与人j的每一个策略sjSj,
3、 j ( sj )表示参与人i认为参与人j可能采取sj的概率。 j性质:对于每一个sjSj , 有 j ( sj ) 0且 sjSj j ( sj ) =1 比如,参与人j的策略有A,B,C三种, j ( A )=1/3, j ( B)=1/6 , j ( C )=1/2。4.1 基本概念基本概念4.1.3基本概念基本概念混合策略混合策略 u 一个参与人的混合策略是指这个参与人根据一个概率分布来随机选择策略的行为。参与人i的混合策略用i表示, i Si, Si为参与人i的混合策略集合。 u 比如,一个参与人可以在U和D两种策略之间进行选择,他选择U的概率为1/2,选择D的概率也为1/2,则他的
4、混合策略为(1/2,1/2)。 i 性质: i中的每个元素不小于0,各元素之和为1. 混合策略包括了纯策略,纯策略是混合策略的一种特殊情况。 4.1 基本概念基本概念基本概念期望效用 (上) 一个参与人的期望效用是指这个参与人采取策略一个参与人的期望效用是指这个参与人采取策略si,而其,而其他人根据他人根据-i采取行动时的采取行动时的“平均平均”得益。得益。 以右图所示的博弈为例,假设参与人1相信参与人2采取策略L的可能性为1/2,采取策略M和R的可能性都是1/4。即2(L)=1/2, 2(M)=1/4, 2(R)=1/4。这个信念简写为(1/2,1/4,1/4)。如果参与人1选择U,他的期望
5、效用为:4.1 基本概念基本概念基本概念期望效用 (下) 当在博弈中有参与人使用混合策略时,参与人的支付也当在博弈中有参与人使用混合策略时,参与人的支付也使用期望效用来计算。使用期望效用来计算。仍以右图所示的博弈为例,假设参与人2选择M,参与人1采取混合策略(1/3,1/3,1/3),那么参与人1的支付为:u1(,M)=(1/3)*0+(1/3)*1+(1/3)*2=1参与人2的支付为: u2(,M)=(1/3)*2+(1/3)*2+(1/3)*3=7/3 【小练习】试计算参与人1采取混合策略(1/3,1/3,1/3),参与人2采取混合策略(0,1/2,1/2)时,双方的支付情况。4.1 基本
6、概念基本概念基本概念最优反应(上) 假设参与人i对于其他参与人采取的策略具有信念,-i S-i,参与人i的策略si Si如果对于任何si Si都满足ui(si,i) ui(si,i),那么si是一个最优反应。 以右图所示的博弈为例,假设参与人1相信参与人2采取策略L的可能性为1/3,采取策略C的可能性为1/2,采取策略R的可能性为1/6.这个信念可表示为(1/3,1/2,1/6)。参与人1采取策略U、M、D的期望效用分别为: 4.1 基本概念基本概念基本概念最优反应(下) 仍以右图所示的博弈为例,假设参与人2对参与人1所采取的策略具有信念(1/2,1/4,1/4)。 参与人2采取策略L、C、R
7、的期望效用分别为: 4.2 博弈求解:参与者是理性的博弈求解:参与者是理性的 严格优于(严格优于(strictly dominates):无论其他对手):无论其他对手的策略是什么,若策略的策略是什么,若策略s产生的支付(收益)严格产生的支付(收益)严格高于高于s产生的收益,那么策略产生的收益,那么策略s为严格优于策略为严格优于策略s。 4.2 博弈求解:参与者是理性的博弈求解:参与者是理性的 弱优于(弱优于(weakly dominates):无论其他对手的策):无论其他对手的策略是什么,若策略略是什么,若策略s产生的支付(收益)不低于产生的支付(收益)不低于s产产生的收益,那么策略生的收益,
8、那么策略s为弱优于策略为弱优于策略s。4 4.2.2 .2.2 博弈求解:参与者是理性的博弈求解:参与者是理性的 弱优于弱优于4.2 博弈求解:参与者是理性的博弈求解:参与者是理性的 4 4.2.2 .2.2 博弈求解:参与者是理性的博弈求解:参与者是理性的 占有策略占有策略歌剧托斯卡的博弈情景反映了个人理性与歌剧托斯卡的博弈情景反映了个人理性与集体理性之间的重要区别。集体理性之间的重要区别。占优策略(占优策略(dominant strategy):如果一个策略严格):如果一个策略严格优于其他策略,那么称这个策略为占优策略。优于其他策略,那么称这个策略为占优策略。如果一个策略被占优,则称为劣势
9、策略。如果一个策略被占优,则称为劣势策略。 一个理性参与者从不使用严格劣势策略,一个理性参与者从不使用严格劣势策略,一个理性参与者总是使用占优策略。一个理性参与者总是使用占优策略。4.2 博弈求解:参与者是理性的博弈求解:参与者是理性的 4 4.2.4.2.4博弈求解:参与者是理性的博弈求解:参与者是理性的小练习小练习找出以下博弈中的劣势策略:找出以下博弈中的劣势策略:要点提示:要点提示:在一个策略未被纯策略占优时,要考虑在一个策略未被纯策略占优时,要考虑这个策略是否被混合策略占优!这个策略是否被混合策略占优!4.2 博弈求解:参与者是理性的博弈求解:参与者是理性的 4.2.5 博弈求解:参与