博弈论在公安领域的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1博弈论在公安研究领域的应用博弈论(GameTheory)是一种游戏的理论,又叫对策论,是以数学为基础,研究决策主体行为发生相互作用时的决策以及这种决策的均衡问题的一门学科。博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的约束条件下,依靠所掌握的信息,同时或先后,一次或多次,从各自可能的行为或策略集合中进行选择并实施,各自从中取得相应结果或收益。博弈论的基本概念包括参与人、策略、行为、信息、次序、收益、结果和均衡。博弈的分类可以从参与人行为的次序和参与人对其他参与人的特征、策略空间和支付的知识、信息是否了解两个角度进行。从不同的角度,博弈有不同的分类。1.按照参与人的先后顺序、博弈持续的时间和重复的次数,博弈分为静态博弈和动态博弈。2.按照参与人对其他参与人所掌握的信息完全与完备程度,博弈可以分为完全信息博弈与不完全信息博弈,完美信息博弈与不完美信息博弈等。3.按照参与人之间是否存在合作,博弈可以分为合作博弈和非合作博弈,合作博弈强调的是集体主义、团体理性,是效率、公平、公正;非合作博弈则强调个人理性和个人最优决策。现代博弈论研究的重点为非合作博弈。4.按照参与人支付的情况,博弈可以分为零和博弈(下棋、打兵乓球)和非零和博弈(囚徒困境)。博弈论作为一门学科,是在20世纪50—60年代发展起来的,到20世纪70年代,博弈论正式成为主流经济学研究的主要方法之一。近年来,博弈论的理论与应用迅速发展,在生物学、管理学、国际关系、计算机科学、政治学、军事战略及其他很多学科都有广泛的应用,也已经成为社会科学研究的一个重要的方法。有人说,如果未来社会还有纯理论的话,那就是博弈论。博弈论也为公安领域的许多问题的研究和解决提供了方法论的指导,并进一步拓宽了公安研究的领域。一、博弈论与囚徒困境囚徒困境模型是非合作博弈的经典模型,它精辟地诠释了一种广泛的决策是如何在相互独立的个体之间达成的。仅从语义字面理解,囚徒困境是与侦查审讯关联最密切的博弈模型。1.囚徒困境模型定义。一位富翁在家中被杀,财物被盗。警方在侦破过程中抓到两个犯罪嫌疑人(简设为A和B),但他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。2于是警方将两人隔离审讯,说:“你们的偷盗罪确凿,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”用一个支付矩阵来表示囚徒困境:囚徒A囚徒B坦白不坦白坦白不坦白-5,-5-0.25,-10-10,-0.25-1,-1在这个矩阵中,囚徒A、囚徒B是博弈的参与人,判刑多少即二人的支付(收益),坦白与否与判刑的关系是博弈的战略规则,博弈将达到怎样的均衡是分析的结果。一个貌似合理的结果是二人均不坦白,各判刑一年。但博弈分析给出了的结果是:坦白—坦白。这是因为给定A的任何一个战略,B的最优战略是坦白;同理给定B的任何一个战略,A的最优战略也是坦白。于是“坦白-坦白”成为博弈的结果,A和B各判刑5年,这在博弈论中称为纳什均衡(非合作均衡)。它反映了个人理性与集体理性的悖反,但对于侦查讯问则是可供利用的武器。2.囚徒困境与侦查讯问的类比。囚徒困境表面上是纯粹犯罪嫌疑人之间的博弈,不涉及侦查员的权威干涉。但通过对博弈论研究范式的分解,可以看到在侦查讯问中,侦查员和嫌疑人之间也存在激烈冲突的利益,双方有不同的行为抉择;各自的最后决策都依赖于对方的行为和理性假设。而且即使犯罪嫌疑人之间的单纯博弈,也需要外在权力维持或促成博弈环境,需要侦查员公布博弈规则。在侦查讯问中,事实上存在侦查员与嫌疑人、嫌疑人与嫌疑人之间的双重博弈,贯彻其间的是各自对预期利益的判断,博弈规则总是自觉或不自觉地适用于讯问对抗。囚徒困境为一两人博弈,对于只有一个嫌疑人、多人犯罪、团伙犯罪、有组织犯罪的案件,博弈分析仍然可以适用于侦查讯问,只不过模型中需要考虑的参量繁简有异。二、博弈论与社会治安预防公安部门、人民群众与犯罪分子三者之间即为三方博弈的过程。根据公安学理论可知,公安部门即为公安主体,犯罪分子为公安第一客体,人民群众为公安第二客体,在这个博弈3中,公安主体与公安第二客体进行合作博弈.然后完成与第一客体的非合作博弈。1.公安主体I与公安第二客体K之间的博弈在公安主体I与公安第二客体K之间的合作博弈中,K有积极的和消极的两种策略:积极的方式为“专群结合”;消极的方式为“配合不力”。具体如图一所示。图一公安主体I与公安第二客体K合作博弈过程图在执法中如何调动群众积极性的问题,是社会治安防范的重要问题。进一步增强人民群众对公安工作的信心,这对打黑除恶具有非常重要的作用。2.公安主体I与公安第一客体J之间的博弈公安主体I与公安第一客体J之间为非合作博弈,而所得到的该博弈的纳什均衡,是不实施,不打击。那么,占据主动地位的I和占据被动地位的J如何完成这一博弈呢?具体过程如图二所示。图二公安主体I与公安第一客体J之间的非合作博弈过程图在这个博弈过程,治安规定及处罚措施是在对犯罪分子的犯罪行为实施打击或预防的过程中逐步完善的。只有根据实际的情况不断调整规定及出台新的法律规定,才能有效防范犯4罪行为的发生,减少案件的发生率,促进社会治安的稳定。基于以上各方之间的博弈过程的分析,可以预测和解释博弈双方在各阶段可能的策略选择、以及选择策略的原因,从而可以很好地从理性模型的深度,分析治安部门、罪犯和群众之间的对抗和合作行为。在众多的社会治安防范现代化工具当中,博弈论非常值得治安管理部门深入研究并广泛应用。三、博弈论与职务犯罪预防在警察权委托代理机制的条件下,警察腐败行为发生在寻租人—警察—委托人三方的博弈行为之间,而委托人行使职权则是间接依赖于警务督察部门。分别建立寻租人—警察博弈模型和警察—督察部门博弈模型进行讨论。1.寻租人—警察博弈模型寻租人的策略空间={行贿;不行贿},警察的策略空间={腐败;廉洁}。假定寻租人依照正常的事情办理程序即不行贿时,所能获得利益为1a,采用行贿手段所获得的利益为2a,行贿额度为1c,显然211aca,这是行贿行为发生的必要条件。再假定按现行法律规定,受贿行为一旦被发现,处罚额一般为采用两种不同手段所获得利益差额的e倍,这里0e。警察的正常收益为其工资与福利待遇之和w,同时因为选择廉洁而在精神道德上获得满足1m,在警察接受行贿时在道德上的付出代价2m,如果行贿行为被发现,警察要被处以罚款f,这里1fc,且满足112cmm。受贿行为未被发现时其博弈矩阵为:寻租人警察腐败廉洁行贿不行贿21ac,12wcm1a,1wm1a,2wm1a,1wm5受贿行为被发现时其博弈矩阵为:寻租人警察腐败廉洁行贿不行贿2121()aceaa,12wcmf1a,1wm1a,2wm1a,1wm由上可知,在行贿—受贿行为不容易被发现时,寻租人的策略是大肆行贿,警察的策略是腐败;在行贿—受贿行为容易被发现时,寻租人的策略是不行贿,警察的策略是廉洁。假定委托方通过督察部门发现行贿—腐败行为的概率为p,警察腐败的概率为q。则寻租人采用行贿策略的期望支付为:1212121[()](1)()Epaceaapac212121()(1)()acpeacpeac寻租人采用不行贿策略的期望支付为:21Ea由此可知,只有12EE时,行贿的腐败活动才能发生,即21121()acapeac。对于警察个体而言,选择腐败的期望支付为:31212()(1)()Epwcmfpwcm12wcmpf选择廉洁的期望支付为:41Ewm。因此,只有34EE时,警察才有可能接受贿赂,即112cmmpf。如何增加发现行贿—腐败行为的概率p是一个值得进一步深入研究的问题。2.警察—督察部门博弈模型督察部门的策略空间={检查;不检查},其检查成本为2c。被查出有受贿行为者不仅要没收其所收受的财物,而且要处以一定的罚款f,显然12fcc。假设道德的代价与收益为0,警察—督察部门博弈矩阵为:6督查部门警察腐败q廉洁检查p不检查12fcc,wf2c,w0,1wc0,w由此看出,上述博弈模型不存在纯策略的均衡,是一个混合战略博弈。根据纳什均衡存在定理,该博弈存在混合战略纳什均衡。在前述假定的条件下,督察部门和警察个体的期望支付分别为:512212[()(1)][()]Epqfccqcpqfcc61[()(1)](1)[()(1)]Epqwfqwpqwcqw11[()]qcpfcw若50Ep,则21cqfc。60Eq,则11cpfc。因此,混合战略纳什均衡是:1211(,)(,)ccpqfcfc。即警察以21cqfc概率受贿,督察部门以11cpfc的概率严格检查。由此可知,为防止警察腐败现象蔓延,可以采取如下措施:(1)当pp时,警察的最优选择是不受贿。因此,降低p门槛值是有利于防止警察腐败的。由11cpfc知,增加f值和减小1c值均可以实现降低p。(2)当减小q值,有助于降低督察部门的检查成本。四、博弈论与信息安全信息安全的攻击方与防守方之间存在显著的博弈关系,防守方的信息安全投资策略与攻击方的攻击策略相互依存,互相影响,构成了信息安全的攻防博弈。1.信息安全的攻防博弈模型首先我们做如下假定:组织的信息安全资产价值为E,防守方投资信息安全的成本为C,防守方投资信息安全产生的商誉无形资产为I,组织遭受的信息安全损失为L,信息7安全攻击方进行安全攻击所需的成本为K,则信息安全防守方与攻击方的得益矩阵如下:防守方攻击方攻击不攻击投资不投资ECI,KECI,0EL,LKE,0上面的博弈模型的理想策略组合是(投资,不攻击),若想使之成为上述博弈的均衡解,则必有不论攻击方的策略为何,投资信息安全策略较不投资策略而言都是最优策略。并且不论防守方的策略为何,不攻击策略较攻击策略而言都是最优策略。因此有ECIE,0LK,即,CILK。也就是说,为了实现信息安全防守方投资信息安全,而攻击方放弃攻击的均衡策略,必须使得信息安全投资的成本低于信息安全投资所带来的商誉无形资产,同时通过各种措施增大攻击方的攻击成本。五、博弈论与交通政策制定城市交通问题是世界各国在城市化进程中都不得不面对的现实问题。缓解城市道路交通拥挤,除了通过新建和扩建道路直接改善交通外,鼓励公交出行、进行交通需求管理也是重要的办法,这个问题引起了许多经济学家、交通运筹学家的关注。在城市交通体系里,道路扮演着“公共草地”的角色。与博弈论中“公地博弈”类似,在交通个体自由选择交通方式模式下,理性个体偏好于从私利出发消费道路资源,最终结果是个体完全出于私利地使用公共资源的获利远远低于整体最优的获利,使得城市交通体系难以持续发展下去。建立博弈模型来分析上述现象,假设:①全理性人假设;②人均收入达到一定水平,并不再成为相当部分家庭汽车消费的主要障碍;③政府不进行管制。设有一公共道路资源,为N个人共同享有。这N个个体都可以选择公交或私车出行。不妨将这N个人分为2个行为群体A和B,假定选择小汽车出行获得收益为K,选择公交出行获得收益为J。若①双方成员均选择公交出行,则双方各自收益为J;②一方选择小汽车出行,另一方选择公交出行,则选择小汽车出行的一方将获得超额收益I,而乘坐公交出行的一方则遭受损失,获极低的收益L;③双方成员均选择小汽车出行,两者均获得收益K,令IJKL。这时A和B构成完全信息静态博弈。其博弈矩阵为:8群体B群体A公交私车公交私车J,JL,II,LK,K由于,IJKL,在选择出行战略时,群体A和B中的理性人均会选择私车出行战略,即该战略是他们的占优战略,其均衡得益组合为(,)KK。由此可知,在共享道路

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功