天才一秒记住【热天中文网】地址:https://www.rtzw.net
警察与小偷博弈
小偷
盗窃A区
盗窃B区
警察巡逻A区 3,0 2,1巡逻B区 1,2 3,0
由上面分析,我们可以得出这个博弈没有纯策略纳什均衡点,只有混合策略均衡点。
在混合策略均衡点下,双方的策略选择是其最优策略选择。
此时,警察的一个最佳选择是:用抽签的方法决定去A区巡逻还是去B区巡逻。
因为A区建设银行的财产价值是B区首饰店的两倍,所以用两个签(比如1、2)代表去A区巡逻,一个签(比如3)代表去B区巡逻。
如果抽到1、2号签,就去A区巡逻;如果抽到3号签,就去B区巡逻。
这样警察就有23的概率去A区巡逻,13的概率去B区巡逻,其概率的大小与巡逻地的财产价值成正比。
而小偷的最优选择也是同样以抽签的办法决定去A区行窃还是去B区偷盗,只是与警察相反:小偷抽到1、2号签去B区行窃,抽到3号签去A区行窃。
那么,小偷就有13的概率去A区偷盗,23的概率去B区偷盗。
上面所说的警察与小偷所采取的策略便是混合策略。
按上述混合策略,警察的总期望收益是73万元,与只巡逻A区得2万元的收益的策略相比,明显得到了提高。
原因如下:
当警察去A区巡逻时,小偷有13的概率去A区偷盗,23的概率去B区偷盗,此时,警察巡逻A区的期望收益为73(13×3+23×2=73)万元;当警察去B区巡逻时,小偷同样有13的概率去A区偷盗,23的概率去B区偷盗,此时,警察巡逻B区的期望收益为73(13×1+23×3=73)万元。
警察的总期望收益为73(23×73+13×73=73)万元。
同理,我们也可知小偷采取混合策略的总期望收益是23万元,比得1万元收益的只偷盗B区的策略(前提是警察只巡逻A区)要差。
当博弈一方所得为另一方所失时,对于博弈的任何一方而言,此时只有混合策略均衡点,而不可能有纯策略的纳什均衡点。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!