推荐文章
罗伯特·奥曼的博弈论及其经济理论述评
- 作者:郭其友/张晖萍 来源: 日期:2006-09-15 点击:0
三、重复博弈论:理论系统性的发展
重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于对理论系统性的发展起了一定的促进作用。
首先是对完全信息的重复博弈研究的促进。完全信息博弈的最早结果出现在50年代,被称为“佚名定理”。该定理认为,重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致。这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。然而,虽然所有可行的个体理性结局确实代表了合作博弈的解观点,但是它相当模糊,并且不提供信息。而奥曼认为,完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关。它的目的是解释诸如合作、利他主义、报复、威胁(自我破坏或其他)等现象。博弈论和新古典经济学模式的现象,可能一开始看起来是非理性的。
奥曼还考察了许多具体的合作行为,定义了“强均衡”概念,即没有任何参与者团体可以通过单方面改变它们的决策来获益的情形。他指出,重复博弈的“强均衡”与一次性博弈的核(更精确的是“6核心”)相一致。为此,奥曼定义和研究了经济理论中极为重要的“一般”合作博弈,即非转移效用(non-transferableutility)博弈,这开拓了该领域的研究空间,因为在此之前,仅有“单边支付”博弈被研究,即每个联盟可以任意在其成员中分享一定数额的赢得。
其次是对不完全信息的重复博弈研究的促进。从20世纪60年代中期开始,奥曼和其他合作者一起,在其学生的辅助下,发展了不完全信息的重复博弈论。1966年,奥曼和m.马希勒(michaelmaschler)在给美國武器控制和裁军机构的开创性报告中,建立了不完全信息的重复博弈模型。他们指出,信息使用的复杂性实际上可以以一種出色的、简练的、明确的方式来解决。在最简单的一个重复的2人零(zero-sum)和博弈中,其中一个参与者比另一个拥有更多的信息(这就是所谓的单边的不完全信息),拥有更多信息的参与者所使用(并揭露)的信息数量是被精确地决定的;有时是完全揭露或根本没有揭露;有时是部分揭露。这種分析被扩展至更一般的模型,即2人零和博弈与非零和博弈。许多新的精深的观点和概念由此产生。例如,奥曼、马希勒和斯特恩斯在1968年引入了一个“联合控制的彩票”(jointlycontrolledlottery)的概念,即没有参与者可以单方面地改变彩票不同结果的可能性,这个概念与非零和博弈密切相关。之后,奥曼在重复博弈上的研究获得了丰硕成果。事实上,他的有关不完全信息博弈的许多重要观点已被应用于许多经济学科,诸如寡头垄断、委托人与代理人、保险等等。
四、合作与非合作博弈论:非转移效用与理性的假设
博弈论还可以划分为合作博弈与非合作博弈。在20世纪50年代,既是合作博弈发展的鼎盛期,又是非合作博弈的开创期。奥曼在该方面的贡献在于,一方面把“可转移效用”理论扩展为一般的非转移效用理论;另一方面发展并提炼了“什么是理性”,使之形成统一的观点。
合作博弈理论不讨论理性的个人如何达成合作的过程,而是直接讨论合作的结果与利益的分配。合作博弈的基本形式是联盟型博弈,它隐含的假设是存在一个在参与者之间可以自由转移的交换媒介(“货币”),每个参与者的效用在其中是线性的。这些博弈被称为“单边支付”博弈,或“可转移效用”博弈(tu-games)。奥曼把“可转移效用”理论扩展到一般的非转移效用理论,发展并加强了可转移效用和非转移效用的合作博弈论。他先是界定了非转移效用联盟形式的博弈概念,然后提出了相应的合作解的概念。他研究了不同模型中的合作解,同时,将非转移效用值公理化,这是奥曼对合作博弈论基本原理所作的贡献之一。在1985年,奥曼还成功地制定了描述非转移效用值的一个简单公理集,这不仅拓展了这一领域的研究,而且产生了许多新的研究方向。
非合作博弈论的重点是对个体的战略选择,即每个参与者如何博弈,或者说选择什么策略达到他的目标。与之不同,合作博弈理论的重点则是对群体,并仅从更一般的意义上阐述了每个联盟的赢得,而没有说明如何赢得。奥曼通过多年的努力,发展并提炼了“什么是理性”。他认为:“如果一个参与者在既定的信息下最大化其效用,他就是理性的。”因此,一个理性人选择他最偏好的行动,当然“最”是相对于他所掌握的(关于环境和其他参与者的)知识而言的。令人惊讶的是,这个看上去简单清晰的表述可以以不同的方式理解,当然,也有些是互相矛盾的。什么是“参与者的信息”?他知道其他人的什么情况?是他们的理性吗?奥曼在他的许多影响深远的研究工作中解决了这些問題,并为这些模型制订了标准。