Skip to content

Situation, Normal form and Extensive form

1. 博弈格局的分析

1.1 Players 局中人

人的特点

  • 效用和追求(名【零和】、利【正和】、情【负和】)
  • 耐心程度
  • 面相?

人的 strategies and moves 策略和行动

人之间的关系: alliance/coalition, hostility

1.2 博弈格局的性质

正和、零和、负和

大部分博弈具有双重性;可以互相转变

1.3 博弈的规则 rules of game

博弈规则:固定不变;操纵

  • 司法管辖权

协议是否具有强制力

  • 老赖

一次性 or 重复博弈

  • 远亲不如近邻

1.4 信息与判断

1.4.1 不完全信息(incomplete/asymmetric)与逆向选择

完全信息 complete information:

  • 支付矩阵是共同知识;每个局中人都充分了解博弈的结构,包括人数、策略集、支付函数等。
  • 每个局中人不知道对手的举动,即某一状态下对手会采取怎样的策略。
  • 例子:下象棋

逆向选择:

  • 由不完全信息博弈导致
  • 例子:二手车市场;卖方对车况的了解比买方多,产生了事前的信息不对称。买主由于不知道实际情况,只愿意以市场均价支付,导致优质二手车逐渐退出市场,劣货驱逐良货。

1.4.2 不完美信息 imperfect information 与道德风险

完美信息 perfect information

  • 局中人采取行动时知道之前其它人的行动历史;对应每个信息集都是单节点的博弈
  • 例子:象棋、跳棋

不完美信息:

  • 行动时不知道其它人之前的行动,信息集中有多个节点
  • 例子:军棋(盲棋)

道德风险:

  • 来源:保险行业:驾驶员上车险之后开车会更加大意,参保人的行为在参保前后是否一致只能靠其自律。

    是一种事后信息不对称。

    例子:政府是否应该拯救陷入困境的银行。

1.4.3 The Harsanyi transformation 海萨尼转换

通过扩展式描述,将不完全信息博弈转换为完全但不完美信息博弈

引入「自然」来决定选择多种可能的支付函数中的一个;自然先决策,局中人不知道自然的决策。描述时注意正确标注信息集,反映「不完美」。

1.4.4 先验认识与后验判断

  • 偏见执拗(bios confirmation);行为经济学
  • 博弈论需要假设大家拥有相同的世界观:判断一致性假设

1.5 制定策略 strategy

a complete contingent plan of action

一套行动计划,而非某个具体行动

完备性,相机性

2. 博弈的策略式描述

策略式博弈:标准式博弈、静态博弈:所有玩家在同一时间做出决策 $$ G = (S_1, \cdots, S_n; u_1, \cdots, u_n) $$ 三个要素:

  • players: \(i \in {1, 2, \cdots, n}\)
  • strategies: \(S_i\) 为 player i 的策略集合
  • payoffs: \(u_i: S_1 \times \cdots \times S_n \rightarrow \mathbf{R}\) 为 player i 的报酬函数

2.1 支付矩阵

image-20230308142120287

刻画只有两个局中人的博弈:

  • 左边是 player 1 ,上边是 player 2
  • 左边是 player 1 的策略集合,上边同理
  • player 1 的报酬在前

3. 博弈的扩展式描述

扩展式博弈 Extensive Game :动态博弈:玩家轮流做决策

博弈树

3.1 构成扩展式的要素

  • 局中人集合
  • 行动顺序
  • 依赖行动的报酬
  • 采取行动时掌握的信息
  • 外生事件的概率分布

3.2 信息集

描述局中人所掌握的信息状况

方法:集合及其划分 partition

把博弈树上的某局中人不能区分的决策节点形成一个集合,则为信息集

信息集包含的节点越多,说明局中人掌握的信息越少

3.3 完美信息博弈

如果博弈树上所有局中人的所有信息集都是单节点的,则该博弈为完美信息博弈;否则,为不完美信息博弈

完美信息博弈 implies

  • 没有任何两个人同时行动
  • 顺序行动时,后行动者能观察到先行动者的选择
  • 所有局中人都可以观察自然的行动

3.4 扩展式博弈中的策略

为局中人的每一个信息集决定行动的规则:信息集集合 \(\rightarrow\) 行动集合的映射

4. 两种表述方式的转换

image-20230308154628579

扩展式转策略式:

  • 信息集
  • 每个信息集的行动空间
  • 局中人的纯策略空间为每个信息集行动空间的笛卡尔积

5. 知识阶次与共同知识

因果推理与循环推理

5.1 知识阶次

  • zero-order: 每个人都是理性的,但不知道其它人是否理性
  • first-order: 每个人理性,并知道其它人理性,但不知道其它人知道自己理性
  • ..., n-th order

5.2 共同知识

\(n \rightarrow +\infty\), common knowledge : 某一事实是所有局中人的 \(n\) 阶知识,且 \(n\) 趋向正无穷

共同知识假设:理性是共同知识

  • 意义:参与人博弈的各方没有智力高低之分;否则博弈的胜负结果由局中人推理能力/智力的差异决定,而不能反映策略的优劣,这不是博弈论研究的目的
  • 扩展式博弈:共同知识为博弈树(的结构)
  • 策略式博弈:共同知识为支付矩阵

Last update: April 19, 2023
Authors: Co1lin