运筹说 第137期 | 对策论精品案例
在实际工作中,我们能发现对策论在经济管理中有着许多应用,本章节选取了一些典型案例,包括矩阵对策的纯策略问题和混合策略问题,进行详细讲解。
前两期我们学习了二人无限零和对策、多人非合作对策以及合作对策,本期小编将为大家介绍矩阵对策的纯策略问题和混合策略问题,讲解精品案例。
1.矩阵对策的纯策略
1.1纯策略的概念
在对策论中,纯策略是指局中人在对策中选择一个确定的行动或策略,并且在整个过程中都坚持执行该策略,而不考虑对手的动作或其他随机因素。纯策略是一种确定性的选择方式,局中人根据自己的偏好或利益最大化准则来选择最佳策略。
1.2例题展示
例1:(二人有限零和博弈问题)某服装厂需要在秋季决定冬季大衣的生产量。根据市场预测,冬季销量可能有三种情况:低迷状态下销售800件,正常状态下销售1200件,火爆状态下销售1500件。冬季生产成本是300元/件,冬季销售价格:低迷状态下350元/件(需打折促销),正常状态下400元/件,火爆状态下450元/件(可能缺货)。滞销成本:未售出的大衣需在季末以200元/件清仓处理。工厂有三个生产策略:策略A是生产800件,策略B是生产1200件,策略C是生产1500件。在不确定市场需求的情况下,服装厂应该选择哪个生产策略,才能在最坏情况下保证最大收益?
解:局中人Ⅰ为服装厂,局中人Ⅱ为市场需求,服装厂三个策略记为α1,α2,α3,市场需求三个策略分别记为β1,β2,β3。
如果将服装厂冬季生产大衣的实际收益(即销售所得减去生产成本与滞销成本 )作为局中人 Ⅰ(服装厂)的赢得,可得服装厂的赢得矩阵如下表所示。
故 (α1,β1)为该对策的解,最优策略是生产800件,在最坏情况下(市场低迷)可确保4万元利润。
例2:现有甲、乙两个能源企业生产同一种太阳能光伏板,用于家庭和商业建筑的电力供应。随着环保意识的提高和可再生能源的发展,太阳能光伏板的市场需求不断增加,但市场竞争也越来越激烈。两个企业都想通过改革管理获取更多的市场销售份额。甲企业的策略措施有:(1)降低产品价格;(2)提高产品质量,延长保修年限;(3)推出新型太阳能光伏板产品。乙企业考虑的策略措施有:(1)增加广告费用;(2)增设维修网点,扩大维修服务;(3)改进产品性能。
假定市场份额一定,由于各自采取的策略措施不同,通过预测,今后两个企业的市场有份额变动情况如上表所示(正值为甲企业增加的市场占有份额,负值为减少的市场占有份额)。试通过对策分析,确定两个企业各自的最优策略。
因为maxminaij=minjmaxiaij=5,所以VG=5(对策值),即甲企业的最优策略是“推出新产品”,乙企业的最优策略是“改进产品性能”。
2.矩阵对策的混合策略
2.1 混合策略的概念
混合策略是参与对策的局中人以一定的概率值随机地选取的策略。在矩阵对策中,混合策略只有在没有鞍点的情况下才出现,因为在矩阵对策中没有鞍点时,参与对策的局中人无法有目的地选取对策来求得平衡局势,只有随机地从策略集合中选取策略,下面选取例题分别对混合策略求解的三种方法进行讲解。
2.2混合策略的解法
例3:(西南交大2012年考研题)某城市有两家油气公司相互竞争,公司 A有三个广告策略,公司 B也有三个广告策略,经计算,当双方采取不同的广告策略时,公司 A 所占市场份额增加的百分数如下表所示,把此问题表示成一个线性规划模型,并用单纯形法求解。
解:根据题目得该问题的赢得矩阵
设局中人Ⅰ的混合策略为x=(x1,x2,x3)T,设局中人Ⅱ的混合策略为y=(y1,y2,y3)T,则求局中人Ⅱ的最优策略规划问题为:
minjmaxiE(i,j)=minjv
其中,E(i,j) 是收益矩阵的元素,表示局中人Ⅰ选择i、局中人Ⅱ选择j时的收益,v是局中人Ⅱ选取不同策略(y1,y2,y3)时的对策值,该求解问题可化为两个互为对偶的线性规划问题:
令y’=y/v,利用变量代换与线性规划对偶性相关原理将min函数转换为max函数,即:
所以
用单纯形法求解问题:
最终的单纯形表为:
所有的检验数均≤0,且非基变量y3'的检验数=0,所以有无穷多最优解,y1'=1/2,y2'=1/4,y3'=0,1/v=3/4,则v=4/3,因此局中人B最优混合策略为:(y1*,y2*,y3*)T=v(1/2,1/4,0)T=(2/3,1/3,0)T
因为局中人A最优混合策略与局中人B最优解互为对偶变量,所以可得局中人A最优混合策略为(x1*,x2*,x3*)T=v(1/4,0,1/2)T=(1/3,0,2/3)T
例4:(图解法求解)利用图解法求解下列矩阵对策,其中赢得矩阵A为:
解:(1)A可以看作
第1行优超于第2行,因此去掉第二行,得到:
设局中人Ⅱ的混合策略为(y,1-y)T,则:
根据最不利当中选取最有利的原则,局中人Ⅱ的最优选择就是如何确定,以便三个纵标值中的最大值尽可能地小。从图可知,AB为对策值。
为求出点y和对策的值VG,联立过B点两条线段α1和α3所确定的方程:
解得:
故局中人Ⅱ的最优策略为:(2/3,1/3)T
(2):A可以看作
第1列优超于第2列,因此去掉第二列,得到A1:
A1第3行优超于第1行,故划去第1行,得A2:
设局中人Ⅱ的混合策略为(y,1-y)T,则:
从下图中可知,AB为对策值。
通过联立方程式:
解得:y=9/22,VG=-1/11
方程组法求解:
方程组法由于事先假定xi∗和yj∗ 均不为零,故当最优策略的某些分量为零时,方程组可能无解,因此,这种方法在超2*2矩阵的应用中有一定的局限性,一般不适用于超2*2矩阵对策 ,但对于2*2的矩阵,当局中人Ⅰ的赢得矩阵不存在鞍点(同时满足行最小值还有列最大的值)时,各局中人的最优混合策略中的 xi∗和yj∗均大于零。
例5:(方程组法求解)用方程组法求解下列矩阵对策的解
解:原对策矩阵对于一切的i=1,2,3,都有ai1≤ai3,所以局中人Ⅱ的纯策略β1优超于β3,可以删去第三列得到A1:
此时,A1对于一切的j=1,2,都有a2j≥a3j,所以局中人Ⅰ的纯策略α2优超于α3,可以删去第三行得到A2:
A2不存在鞍点,各局中人的最优混合策略中的 xi∗和yj∗均大于零,可用方程组法进行求解:
解得x1=1/3,x2=2/3,y1=2/3,y2=1/3,v=7/3,原对策矩阵的解为:X*=(1/3,2/3,0)T,Y*=(2/3,1/3,0)T,VG=7/3
3.总结
混合策略是指局中人以一定的概率分布选择不同的纯策略,与纯策略不同,混合策略下局中人不是简单地选择一个确定的策略,而是以一定的概率来选择不同的纯策略,从而达到一种随机性选择的效果,混合策略引入了随机性,使得局中人的策略选择具有一定的不确定性。
在对策论中,纯策略和混合策略都是用来描述玩家在对策中的策略选择,但它们的性质和应用场景有所不同,混合策略通常用于解决复杂的对策情况,而纯策略则更适用于简单的对策情况。
以上就是精品案例的全部内容了,通过本期学习,大家是否学会了纯对策与混合对策的经典求解方法呢?下一期小编将带大家进行相关方法的代码实现,敬请关注!
作者 | 马书良 李遵兵
责编 | 邱宇
审核 | 徐小峰
· 知乎 | 运筹说 ·
· 简书 | 运筹说 ·
· CSDN | 运筹说 ·