第3章博弈心理学的七个模型 - 博弈心理学 - 沧海满月 - 都市言情小说 - 30读书
当前位置: 30读书 > 都市言情 > 博弈心理学 >

第3章博弈心理学的七个模型

第3章博弈心理学的七个模型

作为“理性人”,我们都希望实现利益的最大化,而这个目的不可避免地受到环境、制度和他人的制约,因此我们必须作出选择(也就是策略)。而我们策略的相互作用(这正是博弈研究的课题)又可能导致更多的、更高层次(群体、国家乃至人类)的问题的选择。对于这些问题,我们可能不会找到最佳答案,但是思考这些问题,无疑将大大提高我们的理解能力和决策能力。

囚徒困境,选择决定胜败

1950年,就职于兰德公司的梅里尔·弗勒德(merrillflood)和梅尔文·德雷希尔(melvindresher)拟定出一种相关困境的理论,后来由顾问艾伯特·塔克(alberttucker)以囚徒方式阐述,并命名为“囚徒困境”。这也是关于博弈论流传最广的一个故事,在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中,获得了极为广泛的应用。

故事有很多版本,大意是这样的:

有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。检察官说:“你的偷盗罪确凿,所以可以判你1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”

显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况下无法串供。那么,囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方的选择;而即使他们能交谈,还是未必能够尽信对方不会反水。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择?

若对方沉默,背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

两人面对的情况一样,所以两人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的平衡,就是双方参与者都背叛对方,结果两人同样服刑5年。

这样两人都选择坦白的策略以及因此被判5年的结局,被称为“纳什均衡”,也叫非合作均衡。从这里可以引出一个悖论:从利己的目的出发,结果却损人不利己。两个囚徒的命运就是如此。从这个意义上说,我们还可以悟出一条真理:合作是有利的“利己策略”。

但它必须符合以下黄金律:也就是我们常说的“己所不欲,勿施于人”,且前提是“人所不欲,勿施于我”。

现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子:

在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛)或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成损害等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。

在经济学中,表现为关税战。两个国家,在关税上可以有两个选择:

提高关税,以保护自己的商品。(背叛)

与对方达成关税协定,降低关税以利各自商品流通。(合作)

当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果),然后两国又重新达成关税协定(重复博弈的结果是将发现共同合作利益最大)。

在商业中,以广告战为例:两个公司互相竞争,它们的广告互相影响,即一个公司的广告若被顾客接受,则会夺取对方的部分收入。若两者同时期发出质量类似的广告,则收入增加很少,但成本增加;若不提高广告质量,生意又会被对方夺走。

这两个公司可以有两个选择:

互相达成协议,减少广告的开支。(合作)

增加广告开支,设法提升广告的质量,压倒对方。(背叛)

若两公司不信任对方,无法合作,背叛成为支配性策略时,两公司将陷入广告战,而广告成本的增加损害了两公司的收益,这就是陷入囚徒困境。在现实中,要两个互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。

除了上述领域,在生活中,往往也有很多囚徒博弈的例子,有这样一个故事:

两个旅行者麦克和约翰从一个以出产瓷器的著名旅游胜地回来时,他们各买了一个瓷花瓶。提取行李时,发现花瓶被碰破了。他们向航空公司索赔。

航空公司估计花瓶的价格在80~90元,但不知道这两位旅客购买的准确价格。航空公司要求两位旅客在100元以内,自己写下花瓶价格。若两人写的相同,说明他们说了真话,就照他们写的数额赔偿;如果两人写得不一样,那就认定写得低的旅客讲的是真话,按这个低的价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。

如果两人都写100元,他们都会获得100元。但是,假定约翰写100元,麦克改写99元,则他会获得101元。约翰又想,若麦克写99元,他自己写98元,比写100元好,因为这样他获100元,而自己写100元当麦克写99元时自己却只获97元。而给定约翰写98元,麦克又会写97元……这样,最后落得两个人只写1元的境地。

字体大小
主题切换