博弈论

文章目录
  1. 1. 导论
  2. 2. 完全信息静态博弈
    1. 2.1. 分析方法
    2. 2.2. 纳什均衡
    3. 2.3. 无限策略博弈分析和反应函数
    4. 2.4. 混合策略和混合策略纳什均衡
    5. 2.5. 纳什均衡的存在性
    6. 2.6. 聚点和相关均衡
  3. 3. 完全且完美信息动态博弈
    1. 3.1. 委托人-代理人理论
    2. 3.2. 颤抖手均衡
  4. 4. 重复博弈
  5. 5. 完全但不完美信息动态博弈
  6. 6. 不完全信息静态博弈
  7. 7. 不完全信息动态博弈
    1. 7.1. 连续变量期望
  8. 8. 博弈学习和进化博弈论

导论

囚徒的困境是图克(Tucker)1950年提出的

破坏者:其策略选择对自身利益没有影响,却对其他博弈方有很大影响的博弈方。(例:奥运申办)

博弈的根本特征是策略的相互依存性

完全信息静态博弈

分析方法

上策:如果不管其他博弈方选择什么策略,一博弈方的某个策略带给他的得益至少不低于其他策略。这种策略即上策。

上策均衡:一个策略组合的所有策略都是各博弈方各自的上策,这种策略组合为该博弈的“上策均衡”

严格下策:不管其他博弈方的策略如何变化,某种策略给一博弈方带来的得益总比另一种策略小,则称前一种策略为相对于后一种的严格下策。

严格下策反复消除法。

划线法:选定对手某一策略,在该策略下自己的最优策略画条线,得益数组两个数字都画上线时,该策略组合具有稳定性,可能是博弈的结果。

箭头法:只有指向而无指离的策略组合具有稳定性。

纳什均衡

在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。

上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡。

纳什均衡的性质:一致性预测,所有博弈方都不会选择与预测不一致的策略。只有纳什均衡才有这样的性质。

纳什均衡,或者说非合作博弈的结果,可能是低效率的。

无限策略博弈分析和反应函数

古诺模型:产量竞争

伯特兰德模型:价格竞争

伯特兰德中,产品具有同质性,但又不是完全可替代

两个厂商各自的需求函数为:

\[q_1=a_1-b_1P_1+d_1P_2\]

\[q_2 = a_2-b_2P_2+d_2P_1\]

d1d2即两个厂商产品的替代系数。

混合策略和混合策略纳什均衡

混合策略纳什均衡必须让对方两个纯策略纳什均衡期望得益相同。(P53)

所以算期望得益的时候只需算一个己方策略的得益即可。

混合策略也可用严格下策反复消去法

纳什均衡的存在性

每个有限博弈都至少有一个混合纳什均衡。

帕累托上策均衡:某个纳什均衡给所有博弈方带来的利益都大于其他纳什均衡。

风险上策均衡:如果所有博弈方在预计其他博弈方采用各种策略的概率相同时,某一策略给他带来的期望得益最大,各博弈方都偏爱这样的策略的策略组合,就称之为风险上策均衡。自我强化机制:偏好风险上策均衡时会进一步降低帕累托上策均衡。

聚点和相关均衡

聚点均衡:地理分组

相关均衡:抛硬币决定

防共谋均衡:所有博弈方都参加的串通不会改变博弈结果。

完全且完美信息动态博弈

子博弈不能包括原博弈第一阶段

子博弈完美纳什均衡:如果一个策略在整个博弈和它的所有子博弈中都构成纳什均衡

不在均衡路径上的选择:不能实现的策略

逆推出来的各阶段最优选择,一定是子博弈完美纳什均衡。

斯塔克伯格模型:动态的市场均衡产量博弈。需要把第二阶段的反应函数直接代入第一阶段的得益函数。

委托人-代理人理论

是否努力,是否接受(工作),是否委托。

无不确定性;有不确定性但可监督;有不确定性且不可监督。

颤抖手均衡

必须是纳什均衡,偏离对偏离者没有损失的策略。(对某一方来说可以有偶然偏误,可以尝试计算混合策略均衡,如果某一方没有混合策略,那么其对手就没有颤抖手均衡)

蜈蚣博弈:博弈阶段越长,合作可能性越大。

重复博弈

无限次重复博弈的每阶段得益都是\(\overline \pi\)时,有:

\[\overline \pi / (1-\delta)=\sum_{t=1}^{\infty}\delta^{t-1}\pi_t\]

如果原博弈有唯一的纯策略纳什均衡,则有限次重复博弈唯一子博弈完美纳什均衡,即各博弈方每次重复时都采用原博弈的纳什均衡策略。

多个纯策略纳什均衡的有限次重复博弈:试探合作与触发装置。

完全但不完美信息动态博弈

完美贝叶斯均衡:在静态博弈中就是纳什均衡,加上概率判断即可(例-练习册P151)

贝叶斯法则:

\[p(g|s)={p(g)·p(s|g)\over p(s)}={p(g)·P(s|g)\over p(g)·p(s|g)+p(b)·p(s|b)}\]

市场完全失败:所有卖方都不敢卖;市场完全成功:只有好商品的卖方将商品投放市场;市场部分成功:好坏都卖,卖方都买;市场接近失败:好商品全卖,坏商品部分卖,买方随机买。

柠檬原理:信息不完美且消费者缺乏识别能力的市场中,劣质品赶走优质品,最后搞垮整个市场的机制。

逆向选择:同样信息不完美且消费者缺乏识别能力的市场中,当价格可变时,市场不断向低端发展的机制。

市场类型归纳(P185)

改善市场效率,消除信息不完美性:加大监管和处罚力度(对管理部门的处罚);昂贵的承诺。

不完全信息静态博弈

至少一个博弈方不完全清楚其他某些博弈方得益情况,只知道相关概率

贝叶斯纳什均衡:在不完全信息静态博弈中的纳什均衡。是完美贝叶斯均衡的特殊形式

暗标拍卖(P201)

线性策略均衡(P207)

练习册P161

不完全信息动态博弈

声明博弈

信号博弈

连续变量期望

\[f(x),x\in (a,b)\]

则,f(x)期望是\(E_f=\int_a^bf(x){1\over b-a}\)

\({1\over b-a}\)是概率密度函数

博弈学习和进化博弈论

最优反应动态:对自身情况较为了解,缺乏预测对手能力,只能根据对手当前情况作出反应。如古诺调整

虚拟行动:同样缺乏预见能力,但能根据历史行为形成判断对手策略的主观概率分布

复制动态:

\[{dx_1(t)\over dt}/x_1(t)=u_1-\overline u\]

策略1种群比例的增长率等于该策略得益与种群平均得益之差。\(x_1(t)\)即占比

进化稳定策略(ESS)(P264),ESS必定是相应完全理性博弈的纳什均衡,否则就缺乏基本的稳定性。

非对称的ESS必须都是纯策略的。