在案件的侦破过程中,警察并非对嫌犯所有的犯罪事实都一清二楚,在很大程度上需要嫌犯自己招供。因此,嫌犯往往在"坦白从宽"和"抗拒从严"之间左右为难。特别是在多人共同作案时,一人所极力保守的秘密却被同伙泄露得点滴不剩,这样势必会给自己带来"抗拒从严"的不利后果。然而,"坦白从宽"并非唯一的最优选择。假设大家都保持沉默,也许处罚是最低的。因此,多人同时被审讯时的处境不同于一人被审,原因在于多人之间的互动作用会令嫌犯陷入一种困境,这就是博弈论中常见的"囚徒困境"。
"囚徒困境"假设甲、乙两个人一起携带炸药准备到一处作案,被警察发现并抓了起来。警方怀疑这两个人还犯有其他重罪,但没有证据。于是,警方将他们分别关押并单独审讯,告诉他们:如果不配合审讯拒绝坦白的话,一旦你的同伙招供,你将受到严惩。如果你们俩都坦白--我们按罪量刑,但肯定比一人顽抗到底要轻。在这种情况下,两个嫌犯都必须独立做出抉择:坦白交代,或者保持沉默。于是会出现以下几种情况
(1)两人都不坦白:警察以非法携带枪支罪将两人各判两年有期徒刑。
(2)其中一人坦白而另一人拒绝坦白,坦白者作为污点证人将不会被起诉,另一人将因罪被重判9年。
(3)如果两人都坦白,则双方都会因罪各判6年
两个嫌犯该如何抉择?彼此信任还是互相背叛?从表面上看,他们当然应该合作这样两人都只判两年。但是两个嫌犯都很聪明,他们仔细审视了自身的处境,发现并非如此。
为了用博弈论的语言来描述它,首先需要明确博弈的三要素,亦即参与者、每个参与者的策略集,以及每个参与者在不同策略下所对应的得益。
·参与者:嫌犯甲和嫌犯乙。
·策略集:每个参与者可选择的只有"坦白"策略和"沉默"策略,所以,他们的策略集都是(坦白,沉默)。
·收益(得益):意即博弈结束后,参与者可得到的回报。因徒困境中,双方得到的回报由双方所选策略决定。例如,当因徒甲选择"坦白"而囚徒乙选择"沉默"时,因徒甲的得益为0,囚徒乙的得益为-9。
上述三点对于两个参与者而言是共同知识。同时,两个参与者是理性的,将选取能够最大化自己利益的策略。厘清三要素之后,可用博弈的语言重述完全信息静态博弈。
上图所示的囚徒困境得益矩阵可以直观的了解这个博弈。
当嫌犯甲采取"沉默"的策略时,嫌犯乙若沉默收益为-2、若坦白收益为0,由此可知嫌犯乙一定会选择坦白。
当嫌犯甲采取"坦白"的策略时,嫌犯乙若沉默收益为-9、若坦白收益为-6,由此可知嫌犯乙一定会选择坦白。
此时可以发现,不管嫌犯甲采取何种策略,嫌犯乙都会选择坦白,此时嫌犯乙有着占优策略。而嫌犯甲知道嫌犯乙的占优策略,即一定选择坦白时,嫌犯甲若沉默收益为-9、若坦白收益为-6,由此可知嫌犯甲也一定会选择坦白。由此可知,结局是双方都坦白。聪明的嫌犯反而得不到最好的结果。这就是囚徒困境,它由梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(MelvinDresher)于1950年提出,后来被艾伯特·塔克以囚徒的方式阐述出来。
参考文献:
[1]葛泽慧,于艾琳,赵瑞,赵世豪.博弈论入门[M].清华大学出版社:2018.
[2]张维迎.博弈论与信息经济学[M].上海人民出版社:2004.
来源: 北京理工大学