混合策略 - 知识百科

混合策略

更新时间：2023-01-07 21:55

混合策略是参与对策的局中人以一定的概率值随机地选取的策略。它可以用向量形式进行表述。在矩阵对策中，它只有在没有鞍点的情况下才出现。因为在矩阵对策中没有鞍点时，参与对策的局中人无法有目的地选取对策来求得平衡局势，只有随机地从策略集合中选取策略。

应用

乒乓球运动员(博弈方)博弈过程中都存在各自的最优反应规则，并能够根据这一规则构建最优反映曲线，最终得出乒乓球战术行为混合策略纳什均衡

基础知识

策略：参与人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人的“相机行动方案”。

纯策略：如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动，称为纯策略，简称“策略” ，即参与人在其策略空间中选取唯一确定的策略。

混合策略：如果一个策略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动，称为混合策略。参与人采取的不是明确唯一的策略，而是其策略空间上的一种概率分布。

混合策略扩展博弈：博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈，就是原博弈的“混合策略扩展博弈”。

纳什均衡：一般将严格占优策略均衡、重复剔除的占优策略均衡、纯策略纳什均衡和混合策略纳什均衡统称为纳什均衡。严格占优策略均衡是重复剔除的占优策略均衡的特例；重复剔除的占优策略均衡是纯策略纳什均衡的特例；纯策略纳什均衡是混合策略纳什均衡的特例。

混合策略纳什均衡(MNE)：由最优的混合策略构成的混合策略组合。

区别

在完全信息博弈中，如果在每个给定信息下，只能选择一种特定策略，这个策略为纯策略。如果在每个给定信息下只以某种概率选择不同策略，称为混合策略。

混合策略是纯策略在空间上的概率分布。纯策略可以理解为混合策略的特例，即在诸多策略中，选择该纯策略的概率为1，选其他纯策略的概率为0。纯策略的收益可以用效用表示，混合策略的收益只能以预期效用表示。

举例

两个参与人各拿一枚硬币，并选择出正面向上还是反面向上。若两枚硬币是一致的(即全部正面或全部反面)，则参与人2赢走参与人1的硬币；若两枚硬币不一致(一正一反)，参与人1赢得参与人2的硬币。支付如表1：

上述博弈的特征是：