博弈论已成为整个社会科学的一个方法
我们可以看出,在上述博弈论及其应用中,没有“美丽的心灵”式的先验的道德的余地。博弈论强调用互惠策略(一报还一报),促进行为人之间的合作,形成基于个体理性(利己动机)的集体理性结局(正的外部性或者利他行为),形成社会的道德共识。简单说就是:你对我好,我就对你好;你对我不好,我也对你不好。我对你好,是为了你能继续对我好。我对你不好,不是睚眦必报的互相损害,而是要将对方重新拉回合作的轨道。实现的机制是,通过对恶劣行为的惩罚,驱使行为人合作。因为从多次博弈和演进的角度看,合作比不合作的收益大于成本,不合作比合作的收益小于成本。这就是博弈论应用于经济制度设计的原理之一,也可以看做是可供选择的人类社会道德共识演进的机制。
在分析改革过程中各阶层或者群体利益消长和继续改革的态度时,博弈论为我们提供了一个简洁深刻的工具。改革必须有人付出成本(包括风险),而改革结果的收益是大家共享。有人认识到这一点,就不愿努力改革,生怕别人搭便车。这样的人多了,就会出现人人希望改革,很少人投身改革的局面,都维持在旧体制下度日。如此,怕别人搭便车,结果人人没有车搭,大家都步行。这種思考方式,也可以用来分析公共物品的供给中的机会主义問題。
我们还可以将这里的思想引申到商品(包括股票)定价过程和制度。市场的功能是缩小人与人之间的距离,使得个人很容易在议价过程中转向众多的潜在交易伙伴。价格的制定,以非人格定价为好。非人格定价,是指市场价格对任何人都一样。明码标价就是一種非人格定价。这表面看起来像是卖方定价,但是在法治较好的竞争性市场中,买者可以选择多个卖方,以用脚投票的方式间接定价。股票市场的合法投机套利活动,可能促进非人格定价的形成,减少因人而异的人格定价行为,从而使机会主义行为减少,降低内生交易成本。这符合我们大多数股民的共同利益,揭明了我们为什么要在股市交易中戒除腐败和违法活动的基本道理。
博弈论在过去二三十年中,是经济学理论中发展得最为成功的一部分,博弈论已成为整个社会科学的一个方法。有人说,如果未来社会科学还有纯理论的话,那就是博弈论。
博弈论提供了一種系统的方法,使人们在其命运取决于他人的行为时制定出相应的战
略。特别是当许多相互依赖的因素共存,没有任何决策能独立于其它许多决策之外时,博弈论更是有用。
当然,博弈论毕竟是数学,更确切地说是运筹学的一个贩NВ妇鄣雷匀簧俨涣耸в镅裕庑腥丝蠢粗皇且淮蠖咽Ч健:迷诓┺穆酃匦牡氖侨粘>蒙顔栴},所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的問題中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会問題犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。
学习管理学或经济学的人一定都了解一些博弈论方面的知识。在博弈论中有一个经典案例——囚徒困境,非常耐人回味。
----“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这種情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
----那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这種想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
----当然,在现实世界里,信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这種真实的一面。让我们看看冷战时期两个超级大國将自己锁定在一场40年的军备竞赛中,其结果对双方都毫无益处。还有各國的贸易保护主义的永恒倾向。
----但是,无论在自然界还是在人类社会,“合作”都是一種随处可见的现象。那么,問題就出现了:到底是何種机制促使生物体或者人类进行相互合作呢?
----这个問題的答案大部分归功于美國密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家,对合作的問題久有研究兴趣。为了进行关于合作的研究,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。
----但这里与“囚徒困境”案例中有个不同之处:他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”,它更逼真地反映了具有经常而长期性的人际关系。而且,这種重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。实际上,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何種举动都采取合作的态度吗?或者,它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢?