更新时间:2024-06-20 21:21
非合作博弈论,专业词语。
你在一个屋子里,屋里有很多人。这时候,屋里突然失火,火势很大,无法扑灭。此时你的目的就是逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?——这就是博弈论!
你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果(博弈论称之为支付pay off),不仅取决于你的行动选择(博弈论称之为策略选择),同时取决于他人的策略选择。你和这群人构成一个博弈(game)。
博弈论对人的基本假定是:人是理性的(rational)。所谓理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。
中国人对博弈论有天生的了解。正如中国人常说的“事事洞明皆学问,人情练达即文章”,即是说人与人之间的关系、社会交往均是学问。而中国很多“做人”的道理,道出了如何在人与人的博弈中获取成功。罗贯中的《三国演义》在今天看来就是一部博弈论教材!无论是兵书如《孙子兵法》、《三十六计》,还是现代流行的所谓 “厚黑学”,都是关于如何赢得与人交往的胜利的,或者说如何获取成功的.
博弈论中流传最广的是一个叫做“囚徒困境”的故事。说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放。而他的同伙就会被判10年。如果双方都与警方合作共同招认,则各被判5年。如果双方均不承认有罪,因警察找不到其他证据来证明他们以前的违法证据,则各判3个月。这两个小偷将如何选择。
乙\u7532 抵赖 坦白
抵赖 判3个月 乙:10年
甲:释放
坦白 甲:10年 各5年
乙:释放
他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。但是由于两人处于隔离的情况下无法串供。这样两人都选择坦白的策略以及因此被判5年的结局就被称为“纳什均衡”,也叫非合作均衡。也就是说一策略组合中,所有的参与者面临这样的一种情况,当其他人改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。
“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。
从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下规律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。