对策问题
利益相互冲突的各方,其结局不取决于其中任意一方的努力,而是各方所采取的策略的综合结果。
(囚徒困境问题)
对策的基本要素
局中人
在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。
通常用 $I$ 表示局中人的集合。如果有 $n$ 个,则 $I=\{1,2,…,n\}$。
策略集
在一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人 $i,i\in I$ ,都有自己的策略集 $S_i$ 。
赢得函数(支付函数)
在一局对策中,各局中人所选定的策略组称为一个局势,即若 $s_i$ 是第 $i$ 个局中人的一个策略,则 $n$ 个局中人的策略组 $s=(s_1,s_2,…,s_n)$ 就是一个局势。全体局势的集合 $S$ 可用各局中人策略集的笛卡尔积表示,即 $S=S_1\times S_2\times…\times S_n$ 。
当局势出现后,对策的结果也就确定了。也就是说,对任意局势,$s\in S$ ,局中人 $i$ 可以得到一个赢得 $H_i(s)$ ,称之为第 $i$ 个局中人的赢得函数。这样,就得到一个向量赢得函数 $H(s)=(H_1(s),…,H_n(s))$ 。
零和对策(矩阵对策)
这是一种特殊的对策问题。在这类对策中,只有两名局中人,每个局中人都只有有限个策略可供选择。在任意纯局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。
设局中人 ⅠⅡ 的策略集分别为 $S_1=\{\alpha_1,…,\alpha_m\},S_2=\{\beta_1,…,\beta_n\}$ ,当局中人 Ⅰ 选定策略 $\alpha_i$ 和局中人 Ⅱ 选定策略 $\beta_j$ 后,就形成了一个局势 $(\alpha_i,\beta_j)$ ,可见这样的局势共有 $nm$ 个。
对任意局势 $(\alpha_i,\beta_j)$ ,记局中人 Ⅰ 的赢得值为 $a_{ij}$ ,并称
为局中人 Ⅰ 的赢得矩阵(或为局中人 Ⅱ 的支付矩阵)。由于假定对策为零和的,故局中人Ⅱ的赢得矩阵就是 $-A$ 。
当局中人Ⅰ、Ⅱ和策略集 $S_1,S_2$ 及局中人Ⅰ的赢得矩阵 $A$ 确定后,一个零和对策就给定了,零和对策又称为矩阵对策并可以简记称 $G=\{S_1,S_2;A\}$ 。
定义1:(鞍点)用 $(x^,y^)$ 来表示函数 $f(x,y)$ 的一个鞍点
定义2:设 $G=\{S_1,S_2;A\}$ 为矩阵对策,其中 $S_1=\{\alpha_1,…,\alpha_m\},S_2=\{\beta_1,…,\beta_n\},A=(a_{ij})_{m\times n}$ 若等式
成立,记 $V_G=a_{i^j^}$ ,则称 $V_G$ 为对策 $G$ 的值。称使得上式成立的纯局势 $(\alpha_{i^},\beta_{j^})$ 为对策 $G$ 的鞍点或稳定解,赢得矩阵中与 $(\alpha_{i^},\beta_{j^})$ 相应的元素 $a_{i^j^}$ 称为赢得矩阵的鞍点,$\alpha_{i^}$ 与 $\beta_{j^}$ 分别称为局中人Ⅰ与Ⅱ的最优纯策略。
定理:零和对策 $G$ 具有稳定解的充要条件为 $\mu+v=0$ ,其中 $\mu$ 为Ⅰ的最小赢得,$v$ 是Ⅱ的最小赢得。
当对策问题有解时,其解可以不唯一,此时解之间的关系有如下两条性质。
性质1:无差别性。若 $(\alpha_{i_1},\beta_{j_1}),(\alpha_{i_2},\beta_{j_2})$ 是对策 $G$ 的两个解,则必有 $a_{i_1j_1}=a_{i_2j_2}$ 。
性质2:可交换性。若 $(\alpha_{i_1},\beta_{j_1}),(\alpha_{i_2},\beta_{j_2})$ 是对策 $G$ 的两个解,则 $(\alpha_{i_1},\beta_{j_2}),(\alpha_{i_2},\beta_{j_1})$ 也是解。
零和对策的混合策略
当我们遇到 $\mu+v\neq0$ 时,赢得矩阵中不存在鞍点,此时在只用纯策略的范围内,对策问题无解。下面引进零和对策的混合策略。
设局中人Ⅰ用概率 $x_i$ 选用策略 $\alpha_i$ ,局中人Ⅱ用概率 $y_i$ 选用策略 $\beta_j$ ,$\sum_{i=1}^mx_i=\sum_{j=1}^ny_j=1$ ,记 $x=(x_1,…,x_m)^T$ ,$y=(y_1,…,y_n)^T$ ,则局中人Ⅰ的期望赢得为 $E(x,y)=x^TAy$
分别称 $S^_1 S^_2$ 为局中人Ⅰ和Ⅱ的混合策略,可记作
定义4:若存在 $m$ 维概率向量 $\overline{x}$ 和 $n$ 维概率向量 $\overline{y}$ ,使得对一切 $m$ 维概率向量 $x$ 和 $n$ 维概率向量 $y$ 有
则称 $(\overline{x},\overline{y})$ 为混合对策问题的鞍点