对策问题

利益相互冲突的各方，其结局不取决于其中任意一方的努力，而是各方所采取的策略的综合结果。

（囚徒困境问题）

对策的基本要素

局中人

在一个对策行为（或一局对策）中，有权决定自己行动方案的对策参加者，称为局中人。

通常用 $I$ 表示局中人的集合。如果有 $n$ 个，则 $I=\{1,2,…,n\}$。

策略集

在一局对策中，可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人 $i,i\in I$ ，都有自己的策略集 $S_i$ 。

赢得函数（支付函数）

在一局对策中，各局中人所选定的策略组称为一个局势，即若 $s_i$ 是第 $i$ 个局中人的一个策略，则 $n$ 个局中人的策略组 $s=(s_1,s_2,…,s_n)$ 就是一个局势。全体局势的集合 $S$ 可用各局中人策略集的笛卡尔积表示，即 $S=S_1\times S_2\times…\times S_n$ 。

当局势出现后，对策的结果也就确定了。也就是说，对任意局势，$s\in S$ ，局中人 $i$ 可以得到一个赢得 $H_i(s)$ ，称之为第 $i$ 个局中人的赢得函数。这样，就得到一个向量赢得函数 $H(s)=(H_1(s),…,H_n(s))$ 。

零和对策（矩阵对策）

这是一种特殊的对策问题。在这类对策中，只有两名局中人，每个局中人都只有有限个策略可供选择。在任意纯局势下，两个局中人的赢得之和总是等于零，即双方的利益是激烈对抗的。

设局中人 ⅠⅡ 的策略集分别为 $S_1=\{\alpha_1,…,\alpha_m\}，S_2=\{\beta_1,…,\beta_n\}$ ，当局中人 Ⅰ 选定策略 $\alpha_i$ 和局中人 Ⅱ 选定策略 $\beta_j$ 后，就形成了一个局势 $(\alpha_i,\beta_j)$ ，可见这样的局势共有 $nm$ 个。

对任意局势 $(\alpha_i,\beta_j)$ ，记局中人 Ⅰ 的赢得值为 $a_{ij}$ ，并称

$A=\begin{bmatrix} a_{11} & a_{12} & ... & a_{1n}\\ a_{21} & a_{22} & ... & a_{2n}\\ ... & ... & ... & ...\\ a_{m1} & a_{m2} & ... & a_{mn}\\ \end{bmatrix}$

为局中人 Ⅰ 的赢得矩阵（或为局中人 Ⅱ 的支付矩阵）。由于假定对策为零和的，故局中人Ⅱ的赢得矩阵就是 $-A$ 。

当局中人Ⅰ、Ⅱ和策略集 $S_1,S_2$ 及局中人Ⅰ的赢得矩阵 $A$ 确定后，一个零和对策就给定了，零和对策又称为矩阵对策并可以简记称 $G=\{S_1,S_2;A\}$ 。

定义1：（鞍点）用 $(x^,y^)$ 来表示函数 $f(x,y)$ 的一个鞍点

定义2：设 $G=\{S_1,S_2;A\}$ 为矩阵对策，其中 $S_1=\{\alpha_1,…,\alpha_m\}，S_2=\{\beta_1,…,\beta_n\},A=(a_{ij})_{m\times n}$ 若等式

$\max_i \min_j a_{ij}=\min_j \max_i a_{ij}=a_{i^*j^*}$

成立，记 $V_G=a_{i^j^}$ ，则称 $V_G$ 为对策 $G$ 的值。称使得上式成立的纯局势 $(\alpha_{i^},\beta_{j^})$ 为对策 $G$ 的鞍点或稳定解，赢得矩阵中与 $(\alpha_{i^},\beta_{j^})$ 相应的元素 $a_{i^j^}$ 称为赢得矩阵的鞍点，$\alpha_{i^}$ 与 $\beta_{j^}$ 分别称为局中人Ⅰ与Ⅱ的最优纯策略。

定理：零和对策 $G$ 具有稳定解的充要条件为 $\mu+v=0$ ，其中 $\mu$ 为Ⅰ的最小赢得，$v$ 是Ⅱ的最小赢得。

当对策问题有解时，其解可以不唯一，此时解之间的关系有如下两条性质。

性质1：无差别性。若 $(\alpha_{i_1},\beta_{j_1}),(\alpha_{i_2},\beta_{j_2})$ 是对策 $G$ 的两个解，则必有 $a_{i_1j_1}=a_{i_2j_2}$ 。

性质2：可交换性。若 $(\alpha_{i_1},\beta_{j_1}),(\alpha_{i_2},\beta_{j_2})$ 是对策 $G$ 的两个解，则 $(\alpha_{i_1},\beta_{j_2}),(\alpha_{i_2},\beta_{j_1})$ 也是解。

零和对策的混合策略

当我们遇到 $\mu+v\neq0$ 时，赢得矩阵中不存在鞍点，此时在只用纯策略的范围内，对策问题无解。下面引进零和对策的混合策略。

设局中人Ⅰ用概率 $x_i$ 选用策略 $\alpha_i$ ，局中人Ⅱ用概率 $y_i$ 选用策略 $\beta_j$ ，$\sum_{i=1}^mx_i=\sum_{j=1}^ny_j=1$ ，记 $x=(x_1,…,x_m)^T$ ，$y=(y_1,…,y_n)^T$ ，则局中人Ⅰ的期望赢得为 $E(x,y)=x^TAy$

分别称 $S^_1 S^_2$ 为局中人Ⅰ和Ⅱ的混合策略，可记作

$S^*_1=\{(x_1,...,x_m)^T|x_i\ge,i=1,...,m;\sum_{i=1}^mx_i=1\}\\ S^*_2=\{(y_1,...,y_n)^T|y_j\ge,j=1,...,n;\sum_{j=1}^ny_j=1\}$

定义4：若存在 $m$ 维概率向量 $\overline{x}$ 和 $n$ 维概率向量 $\overline{y}$ ，使得对一切 $m$ 维概率向量 $x$ 和 $n$ 维概率向量 $y$ 有

$\overline{x}^TA\overline{y}=\max_xx^TA\overline{y}=\min_y\overline{x}^TAy$

则称 $(\overline{x},\overline{y})$ 为混合对策问题的鞍点