线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

博弈论的基本原理8篇

时间:2023-08-31 09:20:59

博弈论的基本原理

博弈论的基本原理篇1

【关键词】语言交际 博弈论 关联论 关联博弈

【中图分类号】G【文献标识码】A

【文章编号】0450-9889(2015)02C-0052-03

当前,博弈论思想已被国内外学者运用到语用学领域来探讨人类的语言交际,例如Hintikka (1973)吸取博弈论和维特根斯坦的“语言游戏论”的思想精华提出了“语言博弈论”;Parikh(1991) 把博弈论引入语用学,构建Parikh模式,探讨与解释实际话语;Kibble(2003) 视语篇回指(discourse anaphora)视为一种博弈现象;国内学者钱冠连(2005)从博弈论的思想推衍出程式性语言行为的语用机制――“语用博弈论”。然而,博弈论的理论假设是每个参与者都是理性者,强调如何选择最优策略通向交际的纳什均衡,而最优策略无法完全体现交际的复杂性与多样性,亦无法保证交际者都做出理性选择。因此,博弈论对语言现象的解释存在着一定的局限性,其解释力需要待进一步探索。Allott(2001)、许宁云(2005)认为博弈论必然融合关联论的相关思想,最大程度地减少其博弈模型中的一些理想化成分才能拓展其解释力。基于此,本文试图在博弈论与关联论的基础上提出语言交际的关联博弈,以期待解决博弈论与关联论存在并需要解决的问题。

关联论是一个有关语言交际的理论,它关注的核心问题是交际与认知,包括两条原则:一是认知原则:人类的认知倾向于同最大程度的关联性相吻合;二是交际原则:话语会产生对关联的期待。交际的成功取决于两个基本条件:一是交际双方的互明(mutual manifestness),二是话语的关联性。按照关联论,关联性成为成功交际的核心,最佳关联期待成为理解话语的标准。关联期待可以说始终存在于交际中,因为关联性是制约人类交际的基本因素,它可看作交际的一个常量,而且“一旦关联期待得到满足或放弃,语用推导即时停止”。

博弈论是研究人们在诸种环境中做出决策(decision making)的方法。一个博弈包含三个重要的特征:其一,博弈中的参与者各自追求的利益具有冲突性;其二,博弈是一种过程集合,它不是一个孤立的事件,而是人们在对抗过程中有关的各方面的集合;其三,博弈的一个本质特征就是策略的相互依存性。一个最基本的博弈至少包括三个要素:参与者(player)、策略组合(strategy space)和收益函数(payoff structure)。参与者是博弈的决策主体,他们以实现自身利益最大化为目标;策略组合是博弈各方可供选择的策略或行为的集合;收益函数是在可能的每一个结果上,参与者的所得与所失。

关联博弈这一概念是整合了Sperber & Wilson的关联论与博弈论的思想而成的,它包含三个观点:其一,博弈是面向关联的博弈,是关联期待下的博弈;其二,关联期待是以策略为手段,是博弈过程中体现出来的关联期待;其三,博弈的每一阶段,都是以关联期待的满足为取向而进行的博弈;关联期待是博弈的每一阶段中以策略为手段来满足期待关联。以关联与策略为视角来看语言交际博弈,关联博弈具有一种内在性,又具有一种外在性。内在性体现于交际者对话语关联的期待,它推动交际博弈的发展,是交际博弈的内在机制;外在性体现于交际者对策略的选择与应用,它管辖语言交际博弈如何达到纳什均衡,是语言交际博弈的外在机制。策略与关联之间是一种张力关系,体现了它们寄生于博弈之中并以寻求交际博弈的纳什均衡为其栖居处。内在机制(即关联)促使交际者选择相应关联的话语作为策略进行博弈,外在机制(即策略)促使交际者选择相关策略去获取话语的最佳关联进行博弈。内在机制与外在机制的互动,构成语言交际的关联博弈过程中参与者寻求纳什均衡的语用机制。

一、语言交际的博弈树

语言交际的博弈是依据发话者与受话者的话语选择与应用一步一步地展开的,同时发话者与受话者的策略空间与交际语境等所体现出来的信息都在变化。博弈的每一个阶段进行,都体现了交际者的“心智路径”,刻画了交际者在可能期待的基础上对关联期待的放弃的动态性展现,也凸现了交际博弈中出现一种或一种以上的纳什均衡。对此我们可以用博弈论中的博弈树给予描述。博弈树能直观、有效地展示博弈中参与者以语言为媒介的行动顺序,轮到某一参与者行动时他可选择的行动以及他拥有的信息,在树的顶部还可以展示各种行动组合产生的各参与者的认知效果即博弈的收益。

(1)张:你的名字叫李四。(1)

李:什么意思?(2)

张:昨天的会怎么没去开?(3)

图1

博弈树是由关联结(relevant nodes)和关联枝(relevant branches)组成的图。博弈树上的枝是关联结与关联结之间的连线,如发话者S(张)的结与受话者H(李)的结之间的连线构成了博弈树的枝。博弈树上的关联结是动态博弈依顺序一步一步进行过程中的时点,例如,发话者S先选择话语1作为策略进行博弈,受话者H根据S的策略选择话语2作为策略进行博弈,S根据博弈语境选择话语3,使话语1到3之间取得了关联性,博弈获得了均衡,即交际意图得到实现。关联结是由决策关联结和终点关联结。决策关联结是博弈进行到某个时点上参与者(S或H)的决策点。决策关联结体现了参与者选择语言的顺序,如先由发话者S开始行动,然后到受话者H,最后又到S,即直到交际意图实现为止。终点关联结表示博弈进行到某一时点,博弈终止,如到发话者S选择话语3这一点,博弈终止。因此,在各个终止结处每一个参与者都可以根据博弈进行的过程计算各自的收益,如图1博弈树中的收益{1,1}或{-1,-1}。当然,从上面的博弈树可以看出,发话者S与受话者H选择语言作为策略进行博弈不是唯一的,如S、H双方除了分别选择1、3与2进行博弈外,也可以分别选择1'、3'与2'进行博弈,只要能使话语具有关联性就可以。

关联期待可以从上面博弈树的收益效用可以看出,当H选择2作为策略时,在决策关联点H处有两种情况:一是表面看起来话语无关联,如果没有动态的信息集的启动或者说受话者没有通过策略激活新的博弈空间,那么收益效用为{-1,-1},即H没有推理出S的交际意图,H的关联期待没有产生;二是在某个阶段的博弈上表面上似乎没有关联,但信息集弈语境是动态的,在另一个阶段的博弈上却是有关联的,即S通过扩展博弈的语境来明示自己的交际意图,H的认知语境得到改变,产生了语境隐含(即李四应该参加昨天的会议的交际意图),那么收益效用为{1,1},即交际意图得到实现,关联期待随着信息集弈语境的延伸与博弈的扩展而产生。博弈就会产生这样的结果:一是博弈参与者直接推导出对方的交际意图,即博弈成功;二是博弈参与者在某一阶段的博弈不能得到博弈的认知效果时,就可以启动另一个博弈阶段,经过博弈参与者双方的策略互动推导出交际意图,即博弈成功,如图1博弈树上收益为{1,1}的博弈空间;三是放弃对博弈信息的处理,导致关联期待得不到满足,交际意图落空,即博弈失败,如图1博弈树上收益为{-1,-1}的博弈空间。

二、语言交际的纳什均衡

关联博弈是一种以关联为取向的博弈现象,那么关联博弈就预设了这样的命题:语言交际的关联博弈一定存在纳什均衡,而且可能存在多个纳什均衡。所谓纳什均衡,就是参与者将如何博弈的“一致性”(consistent)预测:如果所有参与者预测一个特定的纳什均衡将会出现,那么,没有人有兴趣做不同的选择。换言之,每一个参与者要选择的战略必须是针对其他选择战略的最优反应,这种理论推测结果可以叫做“战略稳定”或“自动实施”,因为没有参与者愿意独自离弃他所选定的战略,我们把这一状态称为纳什均衡。纳什均衡其实就是博弈双方都想获得的交际均衡,它表现为话语是关联的,策略是互动的,信息意图是互明的以及交际意图最终得到实现。它不仅是参与者选择策略的过程,而且是参与者不断修正对先行参与者策略类型的推断过程。当某个阶段的博弈因某种原因找不到纳什均衡或没能实现纳什均衡的解,参与者会自动地重新依靠其认知系统的信息集以及对刚刚进行的博弈所形成的交际语境,重新评估博弈的话语关联性与策略选择的合适度,然后转移到另一个阶段的博弈中去寻求纳什均衡的解。那么看似无关联的话语或没有纳什均衡的博弈在另一个阶段的博弈就有了话语的关联性与纳什均衡的解。例如:

(2)Two flies are copulating in front of a boy and his mother.

Child: Do you know what these two flies are doing? A1

Mother: No. B1

Child: Ils font l’amour. [French for ‘they are making love’] A2

Mother: OK, OK. B2

Child: You know, if l’d said this in Arabic, you would have left the room immediately. A3

当小孩选择话语A1时,其母亲拒绝了他的请求,语用失误产生了,那么如何挽回语用失误产生带来的交际后果呢?博弈的纳什均衡在哪里?我们上面讨论过,只要是博弈就会存在着一个或多个纳什均衡。当小孩与母亲的博弈在第一阶段失败时,小孩意识到自己的博弈“出错”,对博弈语境进行重新评估后选择A2(即以语码转换回避社会禁忌的方法)作为补救策略,启动另一个层面的博弈空间,将原先的博弈镶嵌到新的博弈空间中去,改变了博弈的不利局面;而母亲则根据自己小孩的策略选择评估博弈的效益,最终选拔B2作为容忍策略,小孩通过原先的博弈镶嵌到新的博弈空间支持了自己的博弈结果。从例2可以看出,它的策略组合是{补救策略,容忍策略},从而使博弈产生了纳什均衡,即交际继续进行,双方的交际意图在博弈过程中得到显现。交际中我们经常遇到语用失误,但语用失误之所以得以容忍,归根结底在于交际博弈中总是存在纳什均衡,其策略组合是{补救策略,容忍策略}。纳什均衡的存在使人们在博弈过程中对关联期待不容易放弃。对关联期待的放弃只能是实现不了纳什均衡的基础上的期待才是对关联期待的放弃。因为语言交际的博弈是面向关联的博弈,总是存在着一个或多个的纳什均衡,所以,语言交际不存在着对关联期待的放弃,只是对信息处理的放弃。

三、相应关联与相关策略

以关联博弈为视角,人们在交际博弈中主要是以关联与策略这两个维度来掌握与刻画语言交际的博弈。博弈是面向关联的博弈,关联是以策略为手段来取得的话语关联。关联与策略之间的优化组合是语言交际博弈的驱动器,关联越大,策略的选择越优,交际博弈的纳什均衡就越容易实现它的解。博弈中的策略选择是为了追求博弈的相应关联,而关联是为了相关策略提供可能性。因此,要取得纳什均衡的解,关联与策略在交际博弈中不只是限于“最佳关联”与“最优策略”的需求,而是通向纳什均衡的相应关联与相关策略。原因何在呢?在关联博弈中,一个策略的选择总是内在地蕴涵着另一个策略选择的存在,一个话语的关联选择也总是内在地蕴藏着另一个话语关联的存在,从而有可能使不同程度的关联、不同程度的策略之间成为一个连续体,联成一个可以由参与者进行多样性选择的、可互存的、可预测的最终通向一个或一个以上的纳什均衡的网络,这个网络促使博弈的每一阶段都是有关联的。因此,关联与策略在语言交际博弈过程中是相对的,它们只是一个程度的问题,只是一个适合与否的问题,只是一个能否促使博弈通向纳什均衡的解的问题。这表明了,对于交际双方的一个博弈不可能要求每一个参与者都采取最大程度的最优策略,也不可能总是发话者产出最佳关联的话语。这就是关联博弈框架下的“相应关联”与“相关策略”。正因为关联与策略的相对性,不同程度的关联与不同程度的策略之间处于一个连续体,参与者通常是按交际语境的需要与可能在这连续体中选择恰当的或能推进博弈发展的具有关联的话语作为策略。如果把关联与策略理解为“相应关联”与“相关策略”,而不是最佳与最优问题,那么,即使是一个表面无关联的话语,在特定的博弈语境下也是有关联的,那么博弈论的“最优策略”与关联论的“最佳关联”过于绝对化与主观化的症结就在关联博弈的过程中得到消解。例如:

(3)(Situation: coffee shop in Berkeley, California, in 1981)

Customer [ just coming in ] to waitress: Is this non-smoking? A1

Waitress: You can use it as non-smoking. B1

Customer [sitting down]: Thanks. A2

(Verschueren 1999: 160)

顾客以A1作为博弈的策略,就表明了自己是非吸烟人士团体中的成员这一身份,同时也宣称了她想使用不受吸烟人士干扰这一既定权利。正是由于这个原因,女招待做出回答是基于这样的一个假定;作为一位吸烟人士,此顾客是通过她所提之问题来表白自己身份的,于是以B1作为策略默认了顾客原来的问题被女招待的回答转化成为的请求,表面上不关联的话语在双方的认知语境下取得了关联:女招待的回答使得顾客对她原本不是真正意义上的请求得到了满足而表示感谢,博弈的纳什均衡的解得到实现。其实,女招待所选择的策略并不是最优,话语的关联也并不是最佳,因为女招待可以以表面上最佳关联来回答,如干脆以“不,不是”来使顾客的问句得到作为问题应得的待遇,也可以以“很抱歉,我们还没有设立非吸烟区”或“很抱歉,我们还没有决定将非吸烟区设在哪里”来表示店主就尚未使用非吸烟人士的权利制度化表示歉意。然而,女招待并非如此。可见,在语言交际的博弈过程中,参与者由于博弈的需要并不是选择最优策略或最佳关联的话语进行博弈,而是从众多的策略或话语中选择能通向纳什均衡的相关策略或相应关联的话语。

综上所述,交际策略不只是就策略而论策略,而是在交际者对关联期待的驱动下而发挥作用的相关策略。关联也不只是就关联而论关联,而是在交际者的策略的驱动下而寻求的相应关联。在交际博弈过程中,参与者不但要有一个策略作为驱动器,还要有一个对关联的期待,两者的互动促使纳什均衡的解得到实现。参与者的策略与关联就像一个人的两只手,相互协调实现博弈的共同目标。

【参考文献】

[1]Allott, N. Game theory and communication[A]. http://phon.ucl.ac.uk/home /PUB/WPL/03papers/ allott.pdf, 2001

[2]Hintikka, Logic, Language-game, and Information[M]. Oxford University Press, 1973

[3]Kibble, Rodger. Towards the elimination of centering theory[A]. Proceedings of the Seventh Workshop on the Semantics and Pragmatics of Dialogue[C]. University of Saarlandes, Germany, 2003

[4]Parikh, P. Communication and strategic inference. Linguistics and Philosophy, 1991(14)

[5]Parikh, P. The Use of Language[M]. Stanford, California: CSLI Publications, 2001

[6]Sperber, D,Wilson, D. Relevance: Communication and Cognition[M]. Cambridge, Mass.: Harvard University Press, 1995

[7]Verschueren, J. Understanding Pragmatics[M]. London: Edward Arnold(Publishers)Limited,1999

[8]王雪玲.语言哲学视阈下的语言交际博弈论[J]. 当代外语研究,2010(4)

[9]许宁云.语篇回指博弈论[J].外国语,2005(6)

[10]张维迎.博弈论与信息经济学[M].上海: 上海人民出版社,2004

【基金项目】2013年度广西高校人文社科研究项目(SK13LX604)

博弈论的基本原理篇2

[关键词] 进化博弈 进化稳定策略 模仿者动态

进化博弈理论是生态学家Maynard Smith and Price (1973) 在结合生物进化论与传统博弈理论的基础上提出的,以进化博弈理论的最基本均衡概念――进化稳定策略的提出为诞生的标志。进化博弈理论创立之初是生物学家用来研究生物进化的。近些年来,由于它在生物学上的巨大成就而被引入经济学,成为经济学常用的博弈论的一个热点领域。传统的博弈论由于对参与者完全理性的假定,得出的结果往往与实际相差很远。这也要求博弈论学者有时必须假定参与者的理性是有限的才能更好的应用和发展博弈论。也正是在这种情况下,进化博弈的出现无疑给博弈论注入了新的活力,也克服了传统博弈论在理论和应用上遇到的尴尬局面。

一、进化博弈的均衡概念

传统的博弈论中有许多均衡概念,例如,Nash均衡、子博弈精练纳什均衡、贝叶斯纳什均衡、精练贝叶斯均衡、恰当纳什均衡、完美纳什均衡等等,对这些均衡的研究一直是博弈论的核心内容。

同样作为进化博弈论均衡概念的进化稳定策略在进化博弈的研究中也是至关重要的。不过,两者之间却存在着很大的差别。经典博弈论的各种均衡都是建立在参与人是理性的基础上,而进化稳定策略则是进化博弈考虑参与者为有限理性的基础上的均衡结果。进化稳定策略都是完全理性博弈的纳什均衡,是纳什均衡中对有限理性有稳健性的一部分。因此,进化稳定策略可以看作是对纳什均衡的一种选择精练。

1.进化稳定策略的定义

进化稳定策略是Maynard Smith and Price(1973)以及Maynard Smith(1974)在考察种群个体适应性由各个个体行为共同决定的环境下,个体对成功策略选择效果时提出的。进化稳定策略的基本思想:假设存在一个全部选择某一特定策略的大群体和一个选择不同策略y的突变小群体,这个突变小群体进入到该大群体而形成一个混合群体,如果突变小群体在混合群体弈所得到的支付大于原群体中个体所得到的支付,即:,那么小群体就能侵入到大群体,反之就不能侵入到大群体。其中,ε是突变小群体在整个大群体中的比例。是收益函数。

通常把Maynard Smith and Price(1973)定义的进化稳定策略称为原初进化稳定策略,定义1:一个策略是进化稳定策略,如果对任意的满足且当时,有成立。其中,A是进化博弈的策略集;E是群体中个体博弈时的收益函数。

2.进化稳定策略的拓展

原初进化稳定策略为以后的研究者提供了理论基础,但是它是建立在许多理想化假定之上的,存在着许多不够完善的地方。因此博弈论理论家们对进化稳定策略的概念在不同的条件下做了改进和拓展。

1982年,Maynard Smith对把定义1的条件做了适当的放松给出了如下定义,定义:一个策略是不确定性稳定策略,如果对所有的备择策略满足如下条件之一且当,则有。

针对原初进化稳定策略只适用于对称博弈的缺点,Selten (1980)通过引入角色限制行为提出了适用于非对称博弈的进化稳定策略概念,后来Swinkels (1992)给出了考虑突变策略组合的进化稳定标准,定义了适用于非对称博弈的策略稳健性概念。

二、进化博弈的动态概念

进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入地研究。

1.确定性模仿者动态

显然上述模仿者动态仅仅考虑到纯策略的继承性,而没有考虑到混合策略的可继承性。Bomze 证明了如果允许混合策略也可被继承,那么在模仿者动态下,进化稳定策略等价于渐进稳定性。另外,Hines、Zeeman、Hofbauer等提出并证明了如下的重要结论,

定理: 在模仿者动态下,对称博弈中每一个进化稳定策略都是渐进稳定的。

这个定理表明:对于任意的一个进化稳定策略,都存在它的一个领域使得始于该领域的模仿者动态的轨迹都收敛于该进化稳定策略。然而,这个命题的逆命题不成立。模仿者动态可能收敛于一个非进化稳定策略的策略点。

2.多群体模仿者动态

把进化博弈理论应用到实际的经济问题时,经常会遇到单一对称群体和随机配对不能解决的问题。在很多经济问题中经常需要处理多个体相互作用或来自多个群体的个体之间相互作用的问题。正如Friedman 所说:进化博弈理论能够很容易地构建适用于满足这些特征的模型。

Selten 通过引入角色限制行为而把群体分为单群体与多群体。多群体时,不同群体中的个体有不同纯策略集、不同群体支付及不同群体演化速度。多群体模仿者动态方程:

在生物学上,拥有一块领土的生物种群抵抗外来入侵种群的斗争。在经济学上,先占领市场的一方阻止可能进入市场的潜在竞争者的博弈,也就是熟知的市场阻入博弈。另外,在市场中顾客和商家之间的博弈。这些例子在进化博弈的框架之下,都可以通过区分为代表不同角色的群体,用多群体模仿者动态来解决。

三、进化博弈的发展前景

进化博弈的早期研究在生物学领域可以追溯到Fisher(1930)关于性别比例的研究,在经济学领域则可以追溯到Cournot(1838) 对寡头市场产量调整过程的研究,也就是所谓的“古诺调整”。Nash(1950) 对纳什均衡的“群体行为解释”则是包含较完整的进化博弈思想的最早理论成果。进化博弈真正受到重视和获得迅速发展,则是在Maynard Smith and Price引进“进化稳定策略”概念之后。

进化博弈在应用方面也是非常广泛的。例如,可以研究国际政治、军事中关于战争与和平的选择,研究世界政治经济的格局和稳定性问题,研究不同军事策略的价值和意义,研究人类社会制度、组织和规范的发展演变规律,也可以研究股市中的投机者行为和股市均衡,解释企业家选择的机制和企业文化的发展演进等。

正是由于进化博弈论有非常重要的作用和价值,给人们带来了克服理性局限给完全理性博弈分析造成困难的希望,而且拓展了非常广阔的理论研究和应用领域。因此自从1970开始许多经济学家,包括1994年诺贝尔经济学奖得主Reinhard Selten等大经济学家,也都积极投入到对进化博弈论的研究。1980年以来以完全理性为基础的博弈论遇到的理论困难,更进一步加强了学者对进化博弈论的研究热情。目前这种趋势仍在进一步发展,在未来相当长的时期中进化博弈论仍然将是博弈论和经济学最重要的前沿研究领域。

参考文献:

[1]Maynard Smith , J. , And Price , B.R.,1973. The Logic of Animal Conflict , Nature ,246, 15~18

[2]Maynard Smith , J. , 1982 , Evolution and the Theory of Games(combridge university press)

[3]Selten R. A note on evolutionarily stable stratifies in asymmetric animal conflicts[J]. J Theoret Biol , 1980,84: 93~101

[4]Swinkels , J . , 1992 . Evolution and Strategic Stability: From Maynard Smith to Kohlberg andmertens . Journal of Economic Theory, 57, 333~342

[5]I. Bomze, Non-cooperative two-person games in biology: A classification, International Journal of Game Theory 15 (1986) 31~57

[6]D. Friedman, On economic applications of evolutionary games, Mimeo, Economics Department, University of Clifornia,1995

[7]Cournot, A. 1838. Recherches sur les Principes Mathematiques de la theorie des Richesses. English edition : Researches into the Mathematical Principles of the Theory of wealth . Edited by N . Bacon . New York : Macmillan , 1897

博弈论的基本原理篇3

所谓“博弈”(Game),是指某些个人或组织作出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包含现实生活中大量的合作和冲突现象。博弈论又称“对策论”,研究的核心是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论的原始思想萌芽于2000多年前,中国春秋战国时代的典籍如《孙子兵法》、《孙膑兵法》中都充满了博弈的案例。“田忌与齐王赛马”就是我国耳熟能详的博弈实例之一,但这不过是博弈思想的雏形,现代意义上的博弈论则是20世纪的贡献了。一般认为,1944年同冯·诺伊曼(VonNeumann)和摩根斯坦恩(Morgenstern)合作发表的《博弈论与经济行为》(TheTheoryofGamesandEconomicBehavior)提出合作博弈的基本模型,标志着现代博弈论的开始。50年代,博弈论巨匠辈出,纳什(Nash)提出了非合作博弈论,塔科尔(Tucker)定义了“囚徒困境”,从而奠定了现代非合作博弈的理论基石。60后代,泽尔腾(Selten)将纳什均衡引入动态分析,创立了“精炼纳什均衡”的概念;海萨尼(Harsanyi)则把不完全信息引入博弈论研究,随后出现了不完全信息博弈论。至此,博弈论的理论构架基本完成。

博弈论可以划分为合作博弈(cooperativegame)和非合作博弈(non-cooperativegame)。二者的区别主要在于参与人能否在行为时达成有约束力的协议,达成则是合作博弈;反之,不能强制他方遵守协议,各参与人只能选择自己的最优战略,则是非合作博弈。合作博弈强调团体理性、效率、公平和公正;非合作博弈则强调个人理性、个人最优决策。我们谈到的博弈多指非合作博弈。

博弈有两种划分:从参与人出场的先后顺序来看,博弈分为静态博弈(staticgame)和动态博弈(dynamicgame)。静态博弈指博弈参与人同时选择行动或非同时行动但对前者行动一无所知;动态博弈指参与人行动有先后顺序,且后行动者能够观察到先行动者的选择。从参与人对其他参与人的知识来分析,博弈分为完全信息博弈和不完全信息博弈,前者指每一个参与人对其他参与人的特征、战略和支付函数有确切的了解;后者则恰好相反。将两种分析结合起来,我们就有四种类型的博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。

1.完全信息静态博弈:纳什均衡

完全信息静态博弈讲的是,假设博弈中所有参与人事先达成一项协议,规定每个人的行为规则,那么,在没有外在强制性约束时,参与人是否会自觉遵守协议。如果参与人自觉遵守该协议,则构成一个纳什均衡:给定其他参与人遵守协议的情况下,没有人积极偏离协议规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。“囚徒困境”(Prisoner''''sDilemma)和“性别战”(BattleoftheSexes)是任何一本博弈论著作都会提到的纳什均衡特例。

2.完全信息动态博弈:子博弈精炼纳什均衡

动态是世间万物的基本特征。完全信息静态博弈只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。

3.不完全信息静态博弈:贝叶斯纳什均衡

不完全信息静态博弈指的是,参与人共同行动,没有机会观察他人的选择。每个参与人的最优战略只能是在给定自己的类型和他人类型依从战略的情况下,最大化自己的期望效用。在项目投标中各承包者的标价高低之争就是一个应用例证。

4.不完全信息动态博弈:精炼贝叶斯纳什均衡

在不完全信息动态博弈中,后行动者观察前者的选择并获得其偏好、战略空间等信息,修正自己的判断;而先行为者也知道自己行为的效用,会有意识地选择某种行动掩盖或揭示自己的真实目的。“黔驴技穷”就是一个不完全信息动态博弈的例证。

国际机制理论的理性主义流派概述

当前,国际机制的研究在理论与实践层面都对国际关系理论学者形成冲击,引起他们持续的浓厚兴趣,并表现出非凡的整合能力,对国际机制研究的不同思路和方法加以整理和批评已经成为学者们重视的工作。德国著名国际机制理论家沃科尔·利特伯格认为,国际机制理论有两种理性主义流派:新现实主义国际机制理论和新自由主义国际机制理论。(注:AndreasHasenclever,PeterMayerandVolkerRittberger,TheoriesofInternational

Regimes(London:CambridgeUniversityPress,1997),pp.1-2.)

新现实主义国际机制理论的基本出发点是行为体之间的权力资源分配极大地影响着机制的出现、某问题领域机制的存在及其性质,特别是合作中的利益分配;国家会考虑无政府状态下的相对权力,对国际机制的效率形成制约。这些观点都体现在霸权稳定理论中。利特伯格认为,霸权稳定理论是“基于权力的国际机制理论的经典理论模式”,(注:AndreasHasenclever,PeterMayerandVolkerRittberger,TheoriesofInternational

Regimes(London:CambridgeUniversityPress,1997),pp.86.)而克劳福德认为,霸权稳定理论是新现实主义对机制产生最权威、最普遍认同的解释。(注:RobertCrawford,RegimeTheoryinthePost-Cold WarWorld:RethingkingNeoliberalApproachestoInternationalRelations(Dartmouth:DarmouthPublishingCompany,1996),p.57.)霸权稳定理论的基本机制理论主张是:霸权国家建立了自己的霸权体系,并制定该体系的基本原则、规则、规范和决策程序,霸权国的实力与威望是其他国家接受这些国际机制的重要前提;霸权国利用这些机制维持霸权体系,最大限度地获得自己的利益;同时,为了维持该体系,它愿意向体系内的其他国家提供“公共商品”(PublicGoods),容忍“搭便车行为”(Free-rider);霸权国的衰落或急剧变化,则该体系的国际机制发生相应变化。

新自由主义机制理论在过去10多年影响巨大,成为分析国际机制的主流理论。其基本机制理论主张是:国家是追求绝对收益的理性自我主义者,只关心自己的得失;承认权力在国际机制中的作用,但认为国际机制是国际关系中的独立变量(independentvariable),强调国际机制在帮助国家实现共同利益中的重大作用;活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益;不确定性是国际机制形成理论的核心,世界政治存在广泛的不确定性。国际机制帮助达成政府之间意愿的契合。行为体相信这种安排会帮助达成互利的安排。换言之,没有国际机制,则协议无法达成。国际机制正是通过降低不确定性来促进国际合作的。新自由主义机制理论是国际机制理论的主流学派,其影响也最大。该派理论用相互依赖的概念将现实主义和自由主义结合起来,具有重要的理论整合意义。

博弈论与国际机制理论

在过去十多年里,国际机制理论在国际合作的分析中独占翘楚,而博弈论在分析社会、经济和政治现象中应用最为广泛。两种理论都以探讨无政府状态下的竞争与合作问题为核心命题。这种平行并非巧合,因为机制理论从博弈论中借取了许多知识能量。理解促进合作的战略逻辑是解释无政府状态下国际机制起作用的关键。在讨论霸权、问题联系、相对收益和相互依赖时,博弈论的解释力有目共睹。这些恰恰是国际机制理论讨论的重心问题。(注:AndrewKyddandDuncanSnidal,"ProgressinGame-TheoriticalAnalysisofInternationalRegimes",inRegimeTheoryandInternational

Relations,ed.VolkerRittberger(Oxford:ClarendonPress,1993),pp.112.)

早期的博弈论分析国际合作的总体问题,其目标在于探究国际合作在无政府状态下如何发生,但对国际机制的特殊作用关注不够,国际机制在合作中的作用没有得到突出和明确的分析。克拉斯纳、基欧汉等使用博弈论分析国际机制的作用,促使现实主义和自由制度主义的国际机制理论逐步成熟。

克拉斯纳用“性别战”博弈模型来描述基于权力的国际机制理论,既现实主义的国际机制理论。所谓“性别战”是指热恋中的一对男女安排业余活动的博弈:或者去看足球,或者去看芭蕾舞。

这里有两个纳什均衡,男女二人期望在一起,但到哪儿却是需要选择的。这里有一种先动优势(first-moveadvantage),即谁先采取行动。该博弈模型用以解释国际合作问题具有重要的启示意义。在该模式中,追求一致的努力使欺骗不再存在,实际上偏离协议的行为被视为非理性的。克拉斯纳指出,智力在解决合作问题上的作用下降了。而在机制形成与变迁中权力的决定性地位突出了。(注:StephenKrasner,"GlobalCommunicationsandNationalPower:LifeonthePareto

Frontier",WorldPolitics,1991,Vol.43,pp.336.)在这里,合作不是相互协调,而是一方对另一方的协调。在这方面,国际机制并未展示多少自主和弹性,但却常常是权力分配和伴随利益的关键性中介。克拉斯纳强调说,机制本身也可以成为权力的源泉。(注:StephenKrasner,StructuralConflict:TheThirdWorldAgainstGlobalLiberalism(Berkelay:UniversityofCaliforniaPress,1985),pp.7-9.)因此,即使非常弱小的国家也会对某一问题领域的集体政策施加相应的影响。例如,在国际电讯联盟中,由于实行基于平等原则的一国一票制,小国可以参与集体决策并拥有相当的影响。如果国际机制没有重要的作用,行为体也就不必为确定国际机制的内容而激烈地讨价还价,在国际机制建立之后也不会继续进行“战斗”。(注:StephenKrasner,"GlobalCommunicationsandNationalPower:LifeonthePareto

Frontier",WorldPolitics,1991,Vol.43,pp.351-353.)

而基欧汉则使用囚徒困境来分析基于利益的国际机制理论,即自由制度主义的国际机制理论。所谓“囚徒困境”,指的是两个犯罪嫌疑人作案被抓住,分别关在不同的房间里审讯。警察告诉他们,如果两个人都坦白(合作),则各判刑3年;如果都抵赖(合作),则各判1年;如果一人坦白而另一个抵赖(不合作),则坦白者释放,而抵赖者判4年。

在孤立的囚徒困境中,合作是几乎不可能的,因为行为者发现不合作是理性的。在国际合作的单一博弈中,每一方都有不合作的主导战略即背弃。如果双方放弃了自我理性的战略则结果更好,但这只能在一方期望未来合作可能性的情况下发生。机制的部分作用正是产生和促进这种期望。(注:AndreasHasenclever,PeterMayerandVolkerRittberger,TheoriesofInternational

Regimes(London:CambridgeUniversityPress,1997),

【编者按】.46.)

基欧汉明确指出,国际机制的功能理论建立在独特的环境前提下:活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益。该前提不可忽视,而正统的现实主义在批评基欧汉时往往忽略了这一点。国家之间确实存在共同利益,而国际政治并不完全是零和游戏,例如在国际政治经济学领域和七大工业国之间就存在这种情况。当然,国家之间拥有共同利益并不一定合作,共同利益的存在是合作的必要而非充分条件。合作意味着既有利益冲突又有互补利益。当行为体调整他们的行为以适应对方的实际或期望的倾向时,就会出现合作。(注:Keohane,"InternationalInstitutions:TwoApproaches",InternationalStudiesQuarterly,

1988,Vol.32,p.380.)合作是互相协调作为政治协调过程的结果出现的。(注:RobertKeohane,AfterHegemony:CooperationandDiscordintheworldPolitical

Economy(Princeton:PrincetonUniversityPress,1984),pp.52.)基欧汉认为,国家为追求共同利益而创立了国际机制。国家发现自己困在囚徒困境中,但由于机制为协议的达成提供了谈判的规则、原则、规范和决策程序的框架,即使自我中心主义者之间也可以相互合作。基欧汉用囚徒困境理论解释机制的作用,其出发点是不确定性(uncertainty)。一国对他国的选择是不确定的,因而错过了许多达成共同获益的机会或从已经达成的协议中抽身。而机制则向国家提供信息或降低信息成本,从而促进合作。(注:RobertKeohane,AfterHegemony:CooperationandDiscordintheworldPoliticalEconomy(Princeton:PrincetonUniversityPress,1984),pp.245.)在囚徒困境中,监督安排的机制降低了双方的恐惧,使得合作更为顺利。机制多是在大的国际原则和规范框架中形成的,从而在问题之间建立“联系”,违背某种协定会有影响其他目标的可能。而且,机制促使政治关系的存续时间更长。所以,机制增加了环境的“反复出现”,从而使未来的期望挫败了背弃行为的发生。在囚徒困境中进行多重博弈,则合作增加。(注:RobertKeohane,AfterHegemony:CooperationandDiscordintheworldPoliticalEconomy(Princeton:PrincetonUniversityPress,1984),pp.76.)

基欧汉利用博弈论分析机制试图克服的集体行为问题,认为囚徒困境抓住了国际政治中许多问题的核心方面。(注:AndreasHasenclever,PeterMayerandVolkerRittberger,TheoriesofInternational

Regimes(London:CambridgeUniversityPress,1997),

【编者按】.44.)但是,许多学者如斯泰恩(ArthurStein)、奥伊(KennethOye)等则强调,博弈论的囚徒困境模式只代表了集体行动问题的一种,而机制与所有合作问题有关,博弈论的应用是有限度的。

博弈论对我们认识国际机制具有重要的启示意义,但也确实存在某些问题。例如,博弈论把国家作为统一的理体,而忽略了国家内部的因素。而国内政治是在某些特定问题领域如贸易、环境、国际安全等影响国际机制的重要因素。(注:AndrewKyddandDuncanSnidal,"ProgressinGame-TheoriticalAnalysisofInternationalRegimes",inRegimeTheoryandInternational

Relations,ed.VolkerRittberger(Oxford:ClarendonPress,1993),pp.113.)实际上,应用到具体机制分析的博弈模型太少、太理想化。博弈论有四种基本的理论模型,对博弈过程的认识也是逐步深入的,但用于国际机制分析的主要是完全信息静态博弈,它关于单一行为体、完整信息、没有错误或错觉的论述被批评家认为是错误分析了国际政治的核心方面。例如,关于完美信息的论述忽视了传播和信息,而这正是自由制度主义机制理论的核心方面。(注:AndrewKyddandDuncanSnidal,"Progress;inGame-TheoriticalAnalysisofInternationalRegimes",inRegimeTheoryandInternational

Relations,ed.VolkerRittberger(Oxford:ClarendonPress,1993),pp.134-135.)

从国际机制理论的角度而言,对完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈的应用还没有挖掘出来。博弈论也有自身理论的突破,双重博弈论重视不确定性,这与国际机制理论不谋而合。国际机制理论强调机制如何通过改变对他者的信念和期望来影响国家行为,认为信息和信念是国际机制的根本。博弈论也对信息与信念的影响越来越关注。机制促进共享的信念指出适合的协调点,从而便利纳什均衡的选择。而且,机制通过培养国家之间变化的信念而创造新的均衡。反之,如果不能发展和维持适当的信念,将导致机制的败落和博弈的失败。(注:AndrewKyddandDuncanSnidal,"ProgressinGame-TheoriticalAnalysisofInternationalRegimes",inRegimeTheoryandInternational

博弈论的基本原理篇4

【摘要】本文将博弈论引入到会计信息失真问题的探讨中,通过利用博弈论的原理构建完全信息动态博弈模型:即企业与政府监管部门的博弈模型、企业与投资者的博弈模型,并对博弈主体行为选择作出分析,从而形成会计信息披露的纳什均衡。

【关键词】博弈论会计信息失真纳什均衡

一、博弈的基本理论

博弈论又称对策论、竞赛论,用于分析竞争的形势。在博弈论的研究中,一个核心问题就是均衡,即纳什均衡。在经济学中,均衡意即一些相关量处于稳定值。

所谓博弈论(GameTheory),是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的一种方法。博弈论把现实世界中不同参与者之间的各种行为抽象概括为不同参与人之间利益的冲突与一致,进而通过构建博弈模型来研究不同参与人的策略选择问题,使分析更加准确。同时,博弈论把信息的不完全性作为基本前提之一,这就使得博弈论所研究的问题和所提出的结论与现实非常接近,具有现实性。

二、会计信息失真的博弈分析

1.博弈分析的基本要素

博弈分析的基本组成要素有三个:一是博弈主体,即指参与博弈的各方,包括企业、投资者、政府监管部门和其他有关的个体等。二是博弈规则,即一切规范会计行为的会计法规、准则和制度。三是社会监督者,即会计理论界、社会公众、政府审计以及其他经济监督人员。

2.博弈分析的基本假设

会计信息失真博弈的基本假设主要有六个:一是各主体之间存在信息的不对称性。二是强调个人理性和有限理性。三是企业和政府监督部门、投资者都完全了解自己和对方在各种情况下的利益。四是非合作原则,即企业与政府监督部门、投资者不能“串通”以谋取双方利益的最大化。五是不存在会计做账技术上的障碍或政府监管部门检查技术上的缺陷。六是会计准则留有灵活性和“真空地带”。

3.博弈分析

(1)企业与政府监管部门的博弈

随着我国会计法规的不断完善,政府加强了对企业的监管力度和措施,但也不乏疏漏之处。有些企业仍抱着侥幸心理,偷偷做假。下面,构造企业和政府监管部门两个参与人的对策模型。企业有两种选择策略:做假账和做真账。政府监管部门也有两种选择:检查与不检查。两者博弈过程可用图1表示。

第一个数字表示企业的得益;第二个数字表示政府监管部门的得益。R表示监管部门查出假账后所得的奖励;L表示政府监管部门的检查成本;R-L表示政府监管部门查出假账后的净得益;C表示企业做假账被查出后的损失;d表示政府监管部门没有查出假账的损失;e表示企业做假账没被查出所得好处.

一给定企业做假账的概率P,政府监管部门选择检查和不检查的期望收益分别为∏查=(R-L)×P+(-L)×(1-P)=RP-L和∏不查=(-d)×P+0×(1-P)=-dP.

要达到纳什均衡,政府监管部门检查和不检查的期望收益一定要相等,否则政府监管部门将改变现在的策略获得更大的收益。因此,政府部门预期收益最化的一阶条件是∏查=∏不查,即RP-L=-dP.解得P=L/(R+d).

也就是,如果企业做假账的概率小于L/(R+d),则政府监管部门的最优选择是不查;如果企业做假账的概率大于L/(R+d),政府监管部门的最优选择是检查;如果概率等于L/(R+d),政府监管部门随机选择检查或不检查。

二给定政府监管部门检查的概率q,企业选择做假账和做真账的期望收益分别为∏假=(-C)×q+e×(1-q)=e-q×(e+c)和∏真=0×(1-q)+0×q=0.同理可得∏假=∏真,即e-q×(e+c)=0,解得q=e/(e+c).

若政府监管部门检查的概率小于e/(e+c),则企业的最优选择是做假账;若政府监管部门检查的概率大于e/(e+c),则企业的最优选择是做真账;若政府监管部门检查的概率等于e/(e+c),则企业随机选择做假账或做真账。(2)企业与投资者的博弈

企业作为独立的经济人,追求的是企业利益最大化。所以,企业作为会计信息的提供者有时会少披露、不披露甚至歪曲披露企业的某些会计信息。投资者对企业进行投资是为了取得投资收益,为使投资效用最大化,投资者也并非完全需要企业提供真实的信息。因而,在企业与投资者之间博弈的最后均衡很可能是企业做假账,提供虚假的会计报表。

为了进一步说明导致会计信息失真的原因,将企业与投资者之间的相互影响、相互制约的过程引入一个博弈模型。在该博弈模型中,博弈双方为企业(即会计信息提供者)和投资者(会计信息的使用者)。在相关假定的基础上,企业与投资者战略对策模型构成如(表2)所示(表中的数字分别代表了企业和投资者选择相应战略的效用水平)。由(表2)可知如果企业提供真实的会计信息,投资的效用比不投资的效用大,则理性的投资者必然倾向于选择投资,即有MX组合而不存在MY组合;当企业选择提供虚假的会计信息时,此情况下不投资的效用比投资的效用大,投资者更倾向于放弃投资,即有NY组合而不存在NX组合;而无论投资者是否选择投资,对于企业来说,提供虚假信息的效用比提供真实信息的效用要大,因此有XN和YN组合,无XM和YM组合。综上所述,只有Y与N的组合是唯一能在给定对方决策的条件下,双方都能对自己的战略选择满意的战略组合,这个组合达成了纳什均衡。

博弈论的基本原理篇5

【关键词】邮政储蓄银行市场博弈

邮政储蓄资金的增长速度超出了所有人的想象。从1986年,中国人民银行批准同意在邮政系统经营邮政储蓄业务,短短十几年,邮政储蓄就成为仅次于四大国有商业银行的第五吸储大户。到2006年3月末,邮政储蓄存款余额突破1.48万亿元。邮政存款膨胀最根本的原因在于利率倾斜政策导致的强劲利益驱动机制。这种经营模式导致了业界对邮政储蓄“两宗罪”的批判:一宗罪是它加重了财政负担,中国人民银行和中央财政每年需要支付300亿利息给邮政储蓄;另一宗罪则是造成农村资金倒流回城市,影响了农村经济的正常发展。因此,2005年7月,国务院常务会通过了《邮政体制改革方案》,确定成立邮政储蓄银行。在邮政储蓄银行全面进入金融市场的变化下,运用新的经济学理论,对金融市场进行深入的思考,高屋建领,审时度势,从而着眼现实、把握未来,对于我国金融市场的长远和健康发展无疑具有重要意义。笔者认为,从经济学弈论的视角看,金融市场的发展和变化实质上是利益主体各方竞争与合作的结果,竞争各方在遵循一定游戏规则的基础上,运用策略以达到己方利益的最大化,从而在客观上促进市场的成熟和演进。

一、关于理论框架

“博弈理论”(GameTheory)是现代经济学的基础理论之一也是运筹学的一个分支,是研究两个以上决策主体的相互性决策以及这种决策的均衡性问题的理论与方法。博弈论发端于20世纪20年代其中非合作博弈的均衡理论由纳什、海萨尼、泽尔腾等共同创立。作为一种关于决策和策略的理论。博弈论试图描绘在一个被极大的简化设置下的复杂策略情况。因此适用于一切通过策略进行对抗或合作的人类活动和行为。

博弈论以理性人的假设为基础。其基木架构是:(1)有博弈方和一定的规则。(2)博弈各方的策略选择至关重要。(3)博弈方的策略有相互依存性并发生互动影响。任何一方都不能脱离可能的决策进行封闭式决策。(4)有博弈的结果或称博弈方得益,或赢或输或平。各有所得。

由此可见,博弈论必然包括二个基本要素:即博弈方(player)、策略(strategies)和得益(payoffs)。其中,独立和理性决策并独立承担结果的组织和群体,构成博弈方(player);在系统中的理性行动,即为策略(strategies)的选择;不同的选择必然在相互作用后带给各博弈方不同的得益(payoffs)。任何运用博弈理论进行的分析和研究,都不可能离开上述二要素。

二、金融市场的博弈分析

以博弈理论的视点观察,金融市场是一个资本控制与开放、集约与分化彼此牵连互动的竞争格局,博弈方包括银监会、国家邮政总局、邮政储蓄银行与商业银行等四个方面,围绕的核心问题是:按照相关制度和规则,谋求自身利益最大化。

有关各博弈方、策略和得益可概括为下表:

鉴于邮政银行进入中国市场后的综合影响,及在未来市场发展,中我国银行业市场上各竞争主体间相互影响与相互作用的关系。下面用动态博弈模型对其进行分析。

在一个基本成熟的市场上,市场的进入与退出是正常的,考虑到我国现行银行业市场上正逐渐放开,邮政储蓄银行作为一个潜在的投资者即将进入市场,那么这种“先来后到”博弈情形将是怎样的?

分析:对于欲进入市场者而言,有两种策略可供选择:(进入,不进入);而对于先行动者(市场在位者)亦有两种策略(打击,不打击)。如果博弈方A(潜在进入者)不进入市场,则博弈结束,博弈方B(在位者)独享市场的利润:如果博弈方A选择进入市场则双方最后的得益要看博弈方B的反应。博弈方B在博弈方A选择进入时有打击和不打击两种选择,选择打击则双方得益为(-C1,P-C2)即博弈方B为打击对方要付出C2的成本,而博弈方A要有-C1的亏损,而不打击时双方得益为(P1,P2)。从单个博弈方的自我利益出发,对于双方而言,有两个均衡:(进入,不打击)和(不进入,打击),至于哪一个为稳定的均衡结果,则取决于以下比较:

如果P-C2>P2,则博弈方B的必然选择是打击;如果P-C2结果表明:在一个具有潜在发展机会的市场中,所有市场在位者与进入者之间并非总是水火不相容的,如果新的竞争对手出现有利于市场容量的扩大,那么对少进入者还是在位者都是有好处的市场容量的扩大无论是对提高市场效率还是考虑原有在位者的利益二者是可以兼得的。就目前还有相当市场开发能量的中国银行业市场而言,邮政银行的进入所带来的发展机遇对于中国商业银行的进步是有益的。为此,我国商业银行应采取合理调整网点布局的竞争策略,对市场进行细分,找准自己的市场定位,学会运用主动放弃策略,来取得自己最有利的市场。具体来说,邮政银行在现有的农村金融服务中,具有网点多、安全性好的优势。将邮政储蓄银行业务范围放开,如投资基金、国债销售、农民小额信贷的网点,其网点还可能会成为外资零售银行或是信用卡发行公司投资的目标。从而达到有效合理的配置资源。

三、基于博弈论的建议

基于上述博弈方背景和策略的分析,以下试提出若干建议,以期在博弈格局中把握先机。

1、发展中间业务。邮政储蓄银行应参与银行间市场债券买卖;办理中资银行、农村信用社大额协议存款;与政策性银行合作,开展部分中间业务;开办农村地区小额质押贷款业务试点;在原有业务基础上,逐步开展基金投资、个人质押贷款、同业拆借、外汇存款、票据、对公结算等业务。

2、重返农村。邮政储蓄50%以上的资金来源于农村,其2/3的网点分布在县及县以下地区。缘于此,今年两会上要求邮政储蓄资金回流农村,支持“三农”建设成为人大代表提案中引人关注的一点。成立邮储银行最大的意义在于让邮政储蓄资金流动起来,名列全国第五的储蓄量,使得巨大的资金必须要找到一个出口才能使之流动起来。总之邮储银行的市场定位问题应结合城市商业银行和农信社的改革综合考虑,“既避免和已有的商业、政策性银行业务重叠,又能够与农信社形成良好的合作与竞争关系,为社区和广大农村提供优质的金融服务。”

博弈论的基本原理篇6

Lan Xiaosheng

(China Communication Construction Company Limited,Chongqing 401147,China)

摘要: 文章引用博弈理论来分析投标行为,针对当前建筑市场上主要采用的最低标价中标评标办法,进行理论分析,建立了基于博弈理论为基础的投标报价模型,并对其结论进行了分析和讨论。

Abstract: This article explains the activity of bidding by quoting the game theory, and discusses the lowest Price Bidding evaluation method in construction market. Then it establishes the model of tender bid evaluation methods based on the game theory. Finally the article analyses and discusses the conclusion further.

关键词: 投标 博弈 模型

Key words: tender;game theory;model

中图分类号:TU723.2 文献标识码:A文章编号:1006-4311(2011)15-0075-02

0引言

招投标是建筑市场中广泛采用的工程承包方式,随着投标市场的不断规范,逐步完善,评标方法也开始多元化。由于市场竞争的日趋激烈,越来越多的国家和地区采用了最低价中标的评标原则(以下简称最低价法)。文章以此评标标准为基础,用博弈论分析投标者之间报价行为,针对最低价中标的评标办法进行理论分析,建立了基于博弈理论的最低价法的投标报价模型,为投标企业报价提供理论上的指导。

1投标报价的博弈类型、分析

博弈论,也称对策论,是研究决策主体的行为发生直接相互作用时候的决策,以及这种决策的均衡问题的理论方法。

招投标整个过程实际上是个博弈行为,这是投标人与投标人之间、投标人与招标人之间的博弈。

投标报价决策所面临的问题纷繁复杂,因为投标人在决定投标前和决定投标后都有很多不确定性的因素,每一个竞争者为了达到自己的目的,必须考虑其他对手的各种可能行动方案对自己决策行为的直接影响,并力图选取对自己最为有利与合理的对策,也就是通常所言的投标对策论。

1.1 博弈类型的划分博弈类型的划分可以从两个角度进行。一是参与人行动的先后次序,从这个角度博弈可以划分为静态博弈和动态博弈。静态博弈是指参与人同时选择行动或虽非同时,但后行动者并不知道先行者采取什么行动;动态博弈是指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动[1]。

另外一个角度是参与人对有关其他参与人的特征、战略空间及支付函数的知识。从这个角度来看,博弈可以划分为完全信息博弈和不完全信息博弈,前者指的是每一个参与人对所有其他参与人的特征、战略空间及支付函数有准确的知识;后者指的是参与人对其他参与人的知识是不完全的。

1.2招标投标博弈分析不完全信息静态博弈也称静态贝叶斯博弈,其中“不完全”信息是指博弈中至少有一个博弈方不完全清楚其他博弈方的得益或者得益函数。不完全信息并不是完全没有信息,实际上不完全信息的博弈方,至少必须有关于其他博弈方得益分布的可能范围和分布概率的知识,否则,博弈方的决策就会完全失去依据,博弈分析也就没有意义。

任何博弈分析的核心问题都是博弈方之间策略的均衡,静态贝叶斯博弈的研究成果也就是投标报价各博弈方的策略对其他博弈方策略的最佳反应。投标报价问题是静态贝叶斯博弈,招投标期间,投标人在各自的投标报价中,独立地做出决定,等价与同时选择行动,在招投标结束时,局中人彼此不知道其他投标人采取什么具体的行动,因此,投标报价问题是典型的不完全信息静态博弈。

投标报价是投标过程的中心环节,各个博弈方的策略就是他们各自提出的报价。由于各投标人信息互相保密,标书是密封递交的且同时开标,各博弈方在选择自己的策略之前都无法知道其他博弈方的策略,只能根据以往的经验作大致的判断,各博弈方的估算成本和报价属于自己私人信息,招标人根据招标文件中的评标办法,确定中标人,投标人的目标就是为了中标获取最大利益,这显然是一个不完全信息静态博弈问题,是静态贝叶斯博弈[2]。

2投标报价的博弈模型

根据博弈分析,我们首先要确定参与投标者、投标价、项目成本估价、投标人收益函数等博弈模型的基本要素:

设定有n个投标人,设为i=1,2,…,n。参加某工程项目招标投标,第i个投标人测定该工程成本估价为ci。ci只有i自己知道,并且相互独立,假设投标人均为理性的,并有着一定的投标报价经验,即ci在[0,1]均匀分布。

第i个投标人的报价设为bi,若他中标则其净效益为bi-ci,否则效益为0。假定局中人都是风险中性的,即效用期望值等价于确定值。

在招标博弈中,假定所有有效投标人的项目方案均符合招标要求,最终结果是报价最低者获得工程承建权。因此对i个投标人的收益函数ui为:

u■b■,b■,c■=b■-c■ b■b■(1)

上述收益函数:

第一种情况是博弈方i标价低于另一博弈方,中标得益;

第二种情况是同时有几个博弈方报价相同,中标概率相等;

第三种情况是博弈i的报价高于另一方,不中标,此时得益为0[3]。

3最低标价法的决策模型的理论推导

3.1 投标报价博弈的基本要素最低价中标投标报价博弈的基本要素包括:参与人、企业竞争信息情报、战略、效用和均衡。投标报价博弈分析的目的就是使用博弈规则决定投标报价的均衡。

①虚拟参与人用N来代表“自然”,参与工程竞标的所有建筑企业,设为i=1,2,…,n;

②企业能够收集到的参与工程竞标的竞争对手的历史投标报价资料数据;

③对于静态博弈而一言,战略也即行动,各竞标参与人的投标报价为a1,a2,…,an,其中ai∈Ai={ai},对于不同的建筑企业的报价有各自的浮动范围,ai min?燮ai?燮ai max,i=1,2,…,n;

④由于工程竞标具有排他性,通常只能有一家中标,因而对于各投标企业而言,设各个企业对于招标工程成本的认定为Ai,则效用为:

u■a■,…a■,…a■=0a■-A■(中标或未中标时的收益) (2)

⑤均衡:各参与竞标的建筑企业最优战略(即报价)的组合。即一组报价为:s■=a■■,…,a■■,…,a■■,其中i=1,2,…,n。

3.2 投标报价的博弈特征工程投标报价的博弈特征主要有:

①参与工程竞标的博弈参与人不具备(也不可能完全具备)关于博弈的全部信息。

②在公开招标投标活动中,只有到开标后各参与人才能得知对手报价情报的详细信息,虽然递交的标书有先后,但是可以认为是同时采取行动的。

在报价博弈中,每个投标人只知道自己对招标工程的个别成本,并不通晓其他人对该工程的个别成本,只是对别人可能的个别成本有一个主观概率,所以是不完全信息静态博弈。给定投标人i的个别成本c和投标报价b,则得益函数期望值为:

Eu■=(b-c)■Pb■

这里Pb■

投标人1面临的问题是使自己的效用最大化,即:

maxEu■=(b-c)■Pb■

当投标人选择b时,他的个人价值为(b),均衡条件下Φ(b)=c,理性的投标人之间相互博弈的结果是投标报价趋近于项目成本价,投标人越多,投标价格越接近项目成本。这种决定了投标报价的原则实际上反映了博弈方所面临的矛盾,那就是标价越小中标机会就越大,但中标的得益较小;而标价越大中标机会就越小,但中标的得益就较大。因此,采取兼顾中标机会和得益大小的折中原则,也就是确定为成本价加上自己估计其他博弈方利润加价的一个比例来进行报价,这是报价的最佳选择[4]。

3.3 投标报价博弈模型的最优解

3.3.1 模型均衡解的存在性参加公开招标投标的工程承包商竞标活动的典型博弈特征使得我们可以运用不完全信息静态博弈理论,对工程项目的竞争进行诊释。博弈理论均衡解存在性定理―纳什定理,认为建设项目投标报价博弈作为一个有限博弈至少存在一个纳什均衡解。这条定理以及工程项目的投标竞标的特征,奠定了工程项目投标报价的博弈均衡解的存在性的理论基础。

3.3.2 两个投标人的投标报价模型求解如果考虑到只有两个人投标人(即n=2)的情况,投标人的得益函数即为:

u■b■,b■,c■=b■-c■ b■b■(5)

投标人得益函数的期望值Eu■为:

Eu■=b■-c■Pb■

其中Pb■

Eu■=b■-c■Pb■

■=gb■+b■-c■g′b■(8)

由此可解得局中人i对对手采用f的最优反应函数,由于对称的贝叶斯均衡中每个人的策略都相同,因此b■取函数f应该处处满足以上一阶条件,也就是等于:

gfc■+fc■-c■g′fc■=0(9)

由于f和g互为反函数,所以我们有gfc■=c■,以及gfc■=1/fc■,因此就得:

-c■+■=0(10)

解此微分方程得到:

fc■=■(11)

即对称的贝叶斯均衡策略为b=■时,为最优解。

3.3.3 n个投标人的投标报价模型求解根据n个投标人投标报价得益函数公式和投标人的期望值为公式,则一阶条件得:

■ =-g■(b)+(b-c)(n-1)g■(b)g'(b)=0(12)

求解微分方程得:

b=■c(13)

当n=2时,上式即为公式fc■=■;

当n=∞时,b趋近于c。也就是说投标人的报价等于工程发包最合理的价值和价格[5]。

4投标报价模型的诊释

4.1 从模型中可以看出,如果成本降低,最优策略报价也要相应的降低;根据以上公式可知,随着报价的降低,中标的概率将增大。

4.2 通过对模型的求解,我们也可以得出随着参与竞标的承包商的数量增多,贝叶斯纳什均衡的最优战略报价将会越来越接近各自完成该项工程的成本,即:

4.2.1 当一个投标者把自己的标价压低在成本的边缘或以低于成本的价格中标时,从瞬时效果来看,首先降低了自己的获利空间,其他投标者则因此无法中标;

4.2.2 从长期效果来看,投标者1的行为向其他投标者传递了一条信息,即在类似竞标环境中,如果要战胜投标者1这类投标者而中标,需要把报价降低到低于投标者1的报价水平上,才有较大的把握中标,于是投标者们纷纷降低报价,可以想象本次的中标价格水平将再次降低。

4.3 如果长期如此,每个投标者都会为自身的生存发展而担忧,为了给自己留下生存的空间,各个投标者将达成一种默契,共同将报价维持在一个能够获得合理利润的水平上。在这一点上,竞标报价行为虽然属于非合作的博弈行为,但也体现了一定的合作博弈的思想[6,7]。

5结论

依据博弈论的思想以及以上模型的分析,我们还可以看出,中标的必然是对该工程项目价格预期最小的投标人,投标企业要最大限度的降低成本,并选择低报价的投标策略,争取更大的中标机会。从理论上讲,让更多的承包商参与投标会降低中标价格,这样既方便业主更好的选择优秀的承包商,也为业主更好的节省了资金,因此国际、国内工程招标一般都采用合理的最低中标评标办法。

实施合理最低评标价法是一项系统工程,需要项目法人责任制、建设监理、合同管理、工程风险管理(如:工程保险和工程保证担保)、资质管理、工程质量监督管理等制度的配套,才能更好地实施合理最低评标价法。

参考文献:

[1]Avinash Dixit, Susan Skeath,(蒲勇健译).策略博弈(Games of Strategy)[M].中国人民大学出版社,2007.

[2]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,1996.

[3]郝丽萍.基于博弈模型和模糊预测的投标报价策略研究[J].管理工程学报,2002(16):94~96.

[4]何增勤.工程项目投标策略[M].天津大学出版社,2004.5.

[5]胡静,王世良.几种基于博弈论的施工企业投标报价模型[J].技术经济与管理研究,2004(2):65~67.

博弈论的基本原理篇7

引言

一、两个简单的例子

1.1 老鹰(Hawk)与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发,以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用,在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处,并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词:沉默互动;社会互动;进化稳定策略;模仿者动态;均衡分析法;局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用?为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现?为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率?诸如此类的问题,新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人(仅研究单个生产者或消费者的行为),不能把其所考察的问题放在一定的环境中去,该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响,单纯考察某个条件与结果之间的一一对应关系。因而,无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中,但依然没能跳出新古典均衡分析法的基本框架,并且由于其对理性赋予更强的假定,使得该理论更加脱离现实。进化博弈理论则一反常规,从一种全新的视角来考察经济及社会问题,它所提供的局部动态研究方法是从更现实的社会人出发,把其所考察的问题都置于一定的环境中进行更全面的分析,因而,其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论,该理论从其理论框架建立到现在仅仅只有近三十年的历史,但其在经济学、社会学、生态学等领域却得到了广泛的应用,近年来已经成为主流经济的研究方法之一。在我国由于历史原因,对经济学的研究起步较晚,特别对进化博弈这样的前沿理论更是知者甚少,本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用,让读者对该理论有一个全面的了解。

本文的结构如下:第一部分给出进化博弈理论的两个典型的例子;第二部分对进化博弈理论的产生及其发展进行阐述;第三部分对进化博弈理论的基本内容进行简要的介绍;第四部分概述进化博弈理论的有关应用;第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性;第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便,本文先给出进化博弈理论中两个具有代表性的例子,在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰(Hawk)与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物,它们为了生存需要争夺有限的资源(如食物或生存空间等)而竞争。老鹰一般比较凶悍,必要时在斗争中直到重伤。鸽子一般比较温驯,竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代,重伤者则不利于其后代生长,即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源,那么老鹰就会轻而易举地获得全部资源,而鸽子由于害怕强敌退出争夺,从而不能获得任何资源(当然不会受伤);如果群体中两个鸽子相遇并竞争生存资源,由于它们均胆小怕事不愿意战斗,结果平分资源;如果群体中两个老鹰相遇并竞争有限的生存资源,由于它们都非常勇猛而相互残杀,直到双方受到重伤而精疲力竭,结果虽然双方都获得部分生存资源但损失惨重,入不敷出。假定竞争中得到全部资源为50个单位(该数字也可以表示为生物的适应度、繁殖成活率或后代数量);得不到资源则表示其适应度为零;双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述,博弈的支付矩阵如下:

操作依赖于该群体的初始状态。如果初始时,该宿舍有多于4人使用操作系统,那么该宿舍所有学生最终都会使用该操作系统;否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新,该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架,它结合了生态学、社会学、心理学及经济学的最新发展成果,从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问,是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少,他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版,标志着新古典经济学的成形,马歇尔之后,新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与,也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题,强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的,为了更好地从微观个体行为来解释资源配置问题,新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而,理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力,当代伟大的哲学家康德在其著作《纯理性批判》一书中指出,人类理性即认知能力并不是万能的,而是有限的。经济学中的理性则是指一种行为方式,具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息,并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的,人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后,就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题,传统经济学家们从偏好,信念及理性三个方面来界定经济主体的特征,其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念,个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象,经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观,认为经济系统常常处于均衡状态,非均衡只是一种暂时的现象,当受到外生因素扰动而使系统偏离均衡状态时,系统会以线性的方式回归均衡,这种机械式线性反应的均衡观来源于牛顿力学,由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观,认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的,认为时间是可逆的,即经济变量与物理学的变量一样,只要条件相同系统的均衡也就相同,市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上,传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响,或者当一个因素的影响消除之后,下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的,各种因素之间不可能相互独立,系统中任何一个因素的变动都会引起其他因素的变动,这些因素之间相互作用的时间可能很短也可能很长,各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体,企图通过比较不同均衡来找出系统达到均衡的条件,因此得不出符合现实的结论,其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入,特别近来实验经济学的迅速发展,主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法,其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上,斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始,一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响,心理分析在经济学中的地位慢慢地被降低了;另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始,许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象,宏观经济学也把经验法则和适应性预期纳入到其模型之中,正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分,经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮,心理的研究方法在经济学界几乎无立足之地,严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期,随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章,如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases,1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk,慢慢消除了经济学界中存在的对心理学分析方法的偏见,此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中,心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s,随着经典博弈理论、生态理论及心理学理论研究的深入发展,特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖,极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动,并形成分散的非同质的知识,其中“感知秩序”是指人的理解力、知识和人类行动之间的关系;其次表现为个体通过学习所达到的理性程度的有限性,组织学习个体学习行为的整合而形成的多层次“理性结构”,个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用,在这个过程中,个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的,因为人类认知能力有着心理的临界极限,人类进行推理活动需要消耗大量的能量,推理也是一种相对稀缺的资源,另外决策者决策时需要大量的信息,而这些信息是不可能免费获得的,获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力,经济主体的决策行为并非总是最大化的结果,其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下,由于参与人无法免费获得决策所需要的全部信息,并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此,参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响,不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果,即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年,他与有着深厚数学及哲学背景的心理学家特韦尔斯基(Tversky)提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学,使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定,更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”,经济学直面现实。如何从有限理性出发来研究参与人的行为,许多经济学家对之进行了广泛而深入的研究并提出了许多理论,在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释,1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现,动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而,博弈论是研究完全理性的人类互动行为时提出来的,为什么能够解释根本无理性可言的动植物的进化现象呢?我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论,生态演化的结果却能够利用博弈理论来给予合理的解释,这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外,1960年代生态学理论研究取得突破性的进展,非合作博弈理论研究成果也不断涌现并日趋成熟,进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议,争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的,而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为,因此,借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出,越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功,利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此,利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件,那么参与人是如何作出决策的呢?进化博弈理论在处理有限理性参与人决策问题时,常常假定参与人遵循某种比贝叶斯法则更简单的行为规则,这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择,这样参与人只要知道什么会发生,而不必知道为什么会发生。

1970年代,生态学家Maynard Smith and Price(1973)结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略(Evolutionarily stable stragegy ESS),目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后,生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态(Replicator Dynamics)。至此,进化博弈理论有了明确的研究目标。

1980年代以后,随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识,有限理性概念得到了学术界的普遍认可,加之进化博弈理论在解释生态现象时获得的巨大成功,特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议,正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展,并使之逐渐转化为描述经济行为的理论。目前,进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此,它仍然处于不断发展和完善的阶段,但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法,从而得到了越来越多的经济学家、社会学家、生态学家的重视,我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史,初看起来使人觉得奇怪,因为博弈论常常假定参与人是完全理性的,而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人,用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略,那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一,但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈,他们没有特定的博弈对手 ④。在这种情况下,参与人既可以通过自己的经验直接获得决策信息,也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息,还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说,观察群体行为的历史即估算群体分布是非常重要的,首先,群体分布包含了对手如何选择策略的信息。其次,通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰,模仿是学习过程中的一个重要组成部分,成功的行为不仅以说教的形式传递下来,而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的(Naive),其决策不是通过迅速的最优化计算得到,而是需要经历一个适应性的调整过程,在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此,系统均衡是达到均衡过程的函数,要更准确地描述参与人行为就必须考察经济系统的动态调整过程,动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究,在研究生态现象时,生态学家常常把同一个生态环境中所有种群看作一个大群体,由于生物的行为是由其基因唯一确定的,因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后,整个群体就相当于一个选择不同纯策略(纯策略集的数目就相当于群体中的种群数)的个体。群体中随机抽取的个体两两进行的都是对称博弈,有些文献中称这类模型为对称模型(Symmetry model)。严格地说,单群体时个体进行的并不是真正意义上的博弈,博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈,该生态环境中有两个种群老鹰与鸽子,它们代表两个不同的纯策略,用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略,此时的博弈并不是在随机抽取的两个个体之间进行,而是每个个体都观察群体状态(选择老鹰策略与鸽子策略个体数在群体中所占的比例),给定此状态它就可以计算自己选择不同策略所得的期望支付(严格地说这并不是期望支付,但为了说明的方便本文仍然借用该概念)进而确定选择哪一个策略不选择哪一个策略,对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的,他在传统单群体生态进化模型中通过引入角色限制行为(Role Conditioned Behavior)而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分,此时可以从大群体中区分出不同的小群体,群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈,有时又称之为非对称模型(Asymmetry model)。如果我们把系统选择博弈中的宿舍变成学校(整个学校相当于一个大群体)而把十个人变成十个班(每一个班看成是一个小群体,且同一班的同学无角色区分即与单群体情形一样),每个班的学生都有多种选择,此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进,由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论,这就说明在多群体博弈中,传统的进化稳定均衡概念就显示出其局限性了。同时,在模仿者动态下,同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的,进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势,因而,理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响,一般比较复杂,但该类模型却能够更准确地描述系统的行为,近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生态演化问题时提出来的,其直观思想是:如果一个群体(原群体)的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体高的支付,随着时间的演化突变者群体最后会从原群体中消失,原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态,此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price(1973)对进化稳定策略的定义(此后本文称之为原初定义),用符号表示如下:

说是进化稳定策略,如果,存在一个<,不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵;y表示突变策略;是一个与突变策略y有关的常数,称之为侵入边界(Invasion Barriers);表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径,也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质,而落于吸引域范围之外是不考虑的,所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中,当该生态环境中只有老鹰(或只有鸽子)时,这时系统已经处于均衡状态,但它们都是不稳定的均衡,因为这两个均衡都可以被突变者侵入。开始时,假定该生态环境处于老鹰均衡,如果由于某种原因而进入鸽子时,那么随着时间的演化,整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态,即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为,当系统处于纯策略所表示的状态时,只要存在突变者系统就会离开这种状态,所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样,即当系统处于一半是老鹰一半是鸽子时,如果由于某种因素使得系统偏离该状态,那么系统会自动恢复到原来状态。另外,在系统选择博弈中突变者、侵入边界就更为明显,所谓突变者即是指选择进化稳定策略以外的策略者,且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡(),前一个均衡所对应的侵入边界就是,也就是说如果选择操作系统的学生数占群体总数的比例大于(即学生数大于4),那么选择操作系统的突变者就不可能侵入到该群体中,如果选择操作系统的学生数占群体总的比例小于(即学生数小于4),那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制,如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用,随着学术界对进化博弈理论研究的深入,许多理论家们从不同的角度对最初定义进行了拓展,如Selten 1980首次给出了适应于描述多群体均衡的定义;Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义;Foster and Young(1990)首次给出了适应于描述连续随机系统的均衡定义等等(有关对进化稳定策略进行拓展的讨论见文献[5])。最初定义是在解释生态现象时提出来的,如果进行经济分析,时需要进行相应的改变。在分析生态现象时,把每一个种群的行为都程式化为一个策略,因此进化的结果将会是突变种群的消失(消失的原因在于生物的行为是由其遗传基因唯一确定的)。如果用于经济分析,那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略(因为人类可以通过学习、模仿等来改变自己所选择的策略)。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合,在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念,不能描述系统的动态性质,用数学语言来说它是动态系统的不动点,纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略,它是纳什均衡的精练,文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中,按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡,但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件,在某种程度上,较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究,该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。选择机制是指本期中能够获得较高支付的策略,在下期被更多参与者选择;突变是指参与者以随机(无目的性)的方式选择策略,因此突变策略可能获得较高支付也可能获得较低支付,突变一般很少发生。新的突变也必须经过选择,并且只有获得较高支付的策略才能生存(Survive)下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究,由于他们考虑问题的角度不同,对群体行为调整过程的研究重点也就不同,因而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型,认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为;Börgers and Sarin(1995,1997)等提出并应用强化动态(Reinforcement Dynamics)来研究现实中参与人的学习过程;Skyrms (1986) 引入了意向动态(Deliberational Dynamics)模型对哲学中的理性问题进行了讨论;Swinkels(1993)提出了近似调整动态(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反应动态(Stimulus-Response Dynamics)等等。到目前为止,在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态(Replicator Dynamics)。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker(1978)提出的模仿者动态的微分形式:

化的而且因素之间的互动作用也是需要时间的。因此,均衡只是一种暂时现象或者在多数情况下,系统根本不可能达到的现象,要更准确地考察参与人的行为就必须运用系统论的观点,把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中,经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国,对人类互动行为的研究至少可以追溯到三国时期田赛马的故事,但作为一种正式理论提出来,一般认为是始于冯·诺意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈论与经济行为》一书,直到纳什(Nash 1950)在研究非合作博弈的基础上提出著名的纳什均衡(Nash Equilibrium)概念才使得博弈论成为一门完整的理论。经过近五十年的发展,终于在1994年,三位杰出的博弈论大师:纳什(John F. Nash)、泽尔藤(Rechard Selten)和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖,在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角,使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具,其应用相当广泛。在信息经济学中得到了充分的应用,1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下,每一个人单独偏离均衡都不会变得比不偏离好,显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中,并认为现实中参与人不是孤立地作出自己的决策,每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息,而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先,博弈论中的互动是一种“沉默互动⑨ ”,这种互动不允许参与人之间存在任何形式的交流,即假定参与人都是一个个只会理性计算的孤立经济人而非社会人,一旦引入社会互动,许多博弈都无法进行分析,也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次,博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的,并且理性是共同知识,博弈时如果某一方选择了非理,那么博弈就无法进行下去。特别地该理论在利用后向归纳法(Backward Induction)对纳什均衡进行精练时,不但要求参与人完全理性,而且还要求参与人的行为满足序贯理性(Sequential Rationality)要求。这一比理性更强的要求使得博弈论更加远离现实人。再次,在处理参与人所面临的不确定性时,不仅要求各参与人知道世界的各种状态,而且要求参与人知道每一种状态所出现的概率,并且给定一个先念信念,当出现任何新信息时,每个参与人都能够应用贝叶斯法则修正自己的先念信念,也就是说参与人不但具有很强的计算、推理能力,而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下,参与人并不都具有这种计算、推理能力。最后,博弈论碰到了其最棘手的问题就是多重均衡的处理,当博弈出现多重均衡特别是多重严格纳什均衡时,尽管许多理论家提出了一些方法(Selten(1965)提出的子博弈精炼纳什均衡概念,Selten(1975)提出的颤抖手精练纳什均衡,Kerps—wilson(1982)提出的序贯均衡,Schelling(1960)提出的聚点均衡等)来处理多重均衡问题,但始终没能获得一致认可的结论。

与新古典经济学相比,经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系,但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架,这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素,依然认为影响因素与决策结果是一一对应的关系,依然没能把参与人所处社会环境等因素纳入到其模型之中,因而不能准确地描述现实中人的决策行为,其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果,从西蒙提出有限理性(Bounded Rationality)的参与人群体出发,通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟,实现了经济学研究方法革命性的突破。与传统均衡分析法相比,进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应,因而,经济系统是常常处于均衡状态的,分析参与人的行为只需要研究均衡结果,并以此来预测经济人的行为,通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响,使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定,直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中,认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程,也就是说任何一个结果都是路径依赖的,它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的,所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程,并认为经济系统由于受到各种互动行为及互动因素的影响,有些系统达到均衡可能只需要很短的时间,有些系统达到均衡可能需要很长的时间,有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义,如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素,如果不考虑时间因素有些政策可能很有效率,但纳入时间因素,一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径,这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡,然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件,即比较静态法,最后结合条件找出希望达到的均衡,因此,该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题,在老鹰与鸽子博弈中,尽管全是老鹰(全是鸽子)都是均衡的,但这两个均衡都极不稳定即都不是进化稳定均衡,一旦有鸽子(老鹰)突变者进入该系统就会使系统偏离,随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰(该均衡是一个全局吸引子);在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡,局部动态法引入了突变因素就能够很好地解决了均衡选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时,系统就会对其他的突变策略具有一定程度(即在突变边界内)的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为,并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难,因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈,在该博弈中两个囚徒都从个体理性出发,但得到了集体非理性均衡的结论。也就是说,均衡分析法根本无法实现从个体行为向集体行为的过渡,在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发,利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点,在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系,很巧妙地避开由个体行为向集体行为转化问题,因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论,它来源于对生态现象的研究,虽然该理论应用于经济分析的时间不长,但它为经济学研究提供了一个全新的分析方法,较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且,应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果,能够更加现实地解释经济现象,因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释: ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖,这样假定的意思就是说后代继承其母体的策略,并且永远不改变,当然用于研究人类的行为时,需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样,只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象,并且,在重复动态博弈中,后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念,然后,在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下,每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上,这与Selten提出的颤抖手均衡概念具有相似性,所谓颤抖手均衡是指一个战略组合,只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡,其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义,但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换,可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出,募捐者要求每一个人都自愿捐款,最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者,为了使得博弈能够分析下去,募捐者要求自愿捐款时每个人都不得与其他人讨论,否则该博弈就无法进行下去,因此,本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性,即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯(1999):《博弈论平话》,中国经济出版社。

[2] 张维迎(1999):《博弈论与信息经济学》,上海三联出版社。

[3] 张良桥,冯从文(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。

[4] 张良桥(2001):《理性与有限理性:论经典博弈理论与进化博弈理论之关系》,《世界经济》,8,74-78。

[5] 张良桥(2003):《论进化稳定策略》,《经济评论》,2,70-74。

[6] 张良桥,郭立国(2003):《论模仿者动态》,《中山大学学报自然科学版》,3。

[7] 杨小凯(2000):《新兴古典经济学和超边际分析》,中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

博弈论的基本原理篇8

关键词:博弈论;田忌赛马;一般扩展式

一、什么是“博弈”

博弈论的思想最早可以追溯到18世纪,但真正作为一种理论研究则始于20世纪20年代,公认的开山之作是1944年出版的由科学家冯诺依曼和经济学家奥斯卡摩根斯坦恩合著的《博弈论与经济行为的理论》一书。此时,“博弈论”才作为一个完整的新名词被提了出来。此后,国内外对博弈论有了广泛的研究,博弈论取得了长足的发展。国内方面,关于博弈论的文章、专著不胜枚举,各位学者对“博弈”一词的认识或定义也存在偏差。

按照《现代汉语词典》的解释,“博”是丰富多彩的意思,而“弈”则指下棋、打牌等对抗性游戏,因而“博弈”就是指丰富多彩的对抗性游戏。①在英文中,“博弈”一词是“game”的复数,表示各种各样的游戏。因此,汉语中的“博弈”与英语中的“game”意思完全一致。“博弈”与“游戏”有这密不可分的联系。

学者王俊冰对“博弈”一词有着不同的理解。他指出:博弈的“博”字是竞争的意思,“弈”是对弈,是一种关于在竞争中选择策略,争取最好结果的技艺。②概括来讲,博弈是一种技艺。学者郭磊认为:博弈的基本意思是弈棋,博弈本身是一种游戏,但博弈更强调谋略……博弈则可能是一系列策略与行动的组合体,并且是一个由始而终并产生结果的完整过程。③可以理解为博弈是一个过程。还有学者认为:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。④

二、“田忌赛马”概述

忌数与齐诸公子驰逐重射。孙子见其马足不甚相远,马有上、中、下辈。于是孙子谓田忌曰:“君弟重射,臣能令君胜。”田忌信然之,与王及诸公子逐射千金。及临质,孙子曰:“今以君之下驷彼上驷,取君上驷与彼中驷,取君中驷与彼下驷。”既驰三辈,而田忌一不胜而再胜,卒得王千金。于是忌进孙子于威王。威王问兵法,遂以为师。”⑤这是我国“田忌赛马”故事的原型。这个故事可谓是众所周知了,该故事发生在战国时期,齐威王和大将田忌赛马,根据马跑的速度双方各有上、中、下三种等级马各一匹,其中田忌的马比同一等级齐王的马跑得慢,但比齐王低一级的马跑得快。比赛规则为三局两胜制,每局比赛各出一匹马,负者向胜者支付黄金⑥一千,显然相比之下齐王的马占优势。在第一次比赛中,田忌以上等马对齐王的上等马,以中等马对齐王的中等马,以下等马对齐王的下等马,结果连负三局。在第二次比赛中,田忌采纳孙膑的建议,以下马对齐王的上马,以中马对齐王的下马,以上马对齐王的中马,结果胜两局负一局,赢齐王一千金,而自以为胜券在握的齐王反而输掉一千金。

首先要从语言上分析一下这个典故。“孙子见其马足不甚相远”这一句是前提,否则这个故事就不会发生。我们可以这样理解这句话,即“齐威王和田忌的马根据速度划分各有上、中、下三种等级各一匹,其中田忌的马比同一等级齐王的马跑得慢,但比齐王低一级的马跑得快”。假如齐威王的马按速度由快到慢分为A1、A2、A3,田忌的马由快到慢分为B1、B2、B3,那么这六匹马由快到慢依次是A1、B1、A2、B2、A3、B3。另外,还有一处是学者研究中普遍遗漏的,即“及临质”三个字,这一句起到了至关重要的作用。这句话在这个故事中应该翻译为“等到将要开始比赛的时候”,那么这句话告诉我们一个什么讯息呢?我认为是说孙膑献计田忌改变马的出场顺序这一情况并不为齐威王所知,这也成就了田忌在第二轮赛马中能够胜出的重要因素。“威王问兵法,遂以为师。”这一句也是关键所在,通过这一句话得知,齐威王并不知道自己是怎么输的,所以请教孙膑。假设如果齐威王知道其中玄机的话,那么田忌将必输无疑。以上三点是“田忌赛马”故事得以出现的基本前提。

而我国关于“田忌赛马”博弈论研究的相关论著可谓不少,但鲜有人认真透彻地分析这个故事的原型,殊不知这关系到“田忌赛马”是不是博弈、是怎样的博弈等问题。在以往的文献中,王俊冰在《白话博弈论》一文中指出“田忌赛马”是一个非合作博弈;詹国枢在《博弈处处有,几人能识之》中指出“田忌赛马”是博弈论的实际运用,是典型的博弈案例;周瀚光认为“田忌赛马”是一个“二人有限零和博弈”,⑦但他并没有首先从语言学的角度分析这个故事的前提;此外学者袁国强、和蔚、逯彦彦、郭鹏等等均指出“田忌赛马”是一个博弈,但没有深入分析它到底属于什么类型的博弈,是怎样博弈的等问题。

三“田忌赛马”的博弈论分析

前文分析了该故事的三个前提,一、田忌的每等级的马均次于齐威王同等级的马,但强于齐威王下个等级的马;二、齐威王事先不知道田忌临阵改变了马的出场顺序;三、齐威王不知道改变马出场顺序其中的玄机。本文以下的分析均基于此三前提。

首先要从博弈论定义上理解“田忌赛马”。很明显,“田忌赛马”确实符合“博弈”的定义,但现在言“田忌赛马”就是博弈还为时尚早。

其次需要分析“田忌赛马”是否具备博弈理论的基本要素。国内学术界对博弈论基本构成要素有分歧,基本分为两派。一派认为博弈论要素有四方面,即博弈的参加者、策略、进行博弈的次序、博弈的信息。但是主张博弈理论四要素这一派内部也有分歧,学者胡静认为博弈理论的第四个构成要素是“博弈方的得益”,⑧而不是博弈的信息;另一派认为博弈理论具有五方面的要素,即博弈的参加者、策略、进行博弈的次序、博弈的信息、博弈方的得益。可以清晰地看出后者对博弈理论的要素有了一个完整的归纳。那么“田忌赛马”是否具备五个要素呢?齐威王和田忌是博弈的参加者;策略选择按照排列组合来计算共有六种(这里不详细叙述);博弈的次序是双方非同时决策,齐威王是先手;博弈的信息是不完全的,齐威王不知道田忌策略的变化;得益是每胜一局有一千金的奖励。通过分析这些要素,我们得出一个结论,即“田忌赛马”是一个完整的博弈。

最后要弄清楚“田忌赛马”到底属于什么类型的博弈。首先要了解一下博弈论的分类情况。(1)合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。(2)零和博弈、常和博弈与变和博弈。这是按得益情况划分的,一方得益必来自一方损失,这种博弈是零和博弈。常和博弈又叫非零和博弈,指博弈各方得益之和不为零。变和博弈中各方得益之和不确定,这是最一般的博弈,常和博弈和零和博弈是它的特例。(3)静态博弈与动态博弈。根据博弈的次序,即参加者策略选择并行动的先后次序博弈可以分为静态博弈和动态博弈。静态博弈指参加者可同时决策并行动的博弈,并不考虑决策的次序问题。动态博弈指参加者先后、依次决策并且后行动者能够观察到先动者所选择的策略和行动。⑨(4)完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。⑩博弈理论按照不同的标准基本可分为以上四种情况。

“田忌赛马”这个典故是非合作博弈,也是零和博弈,这在上文中已经提到。同时,依据上文的三个前提,它同时也是一种不完全信息状态下的动态博弈。

四“田忌赛马”博弈的一般扩展式及其序列均衡

上文我们提到“田忌赛马”博弈是非完全信息动态博弈,而这种博弈则是博弈论中最为复杂的模型,也称动态贝叶斯博弈。序列均衡是非完全信息动态博弈的核心概念。

一个动态贝叶斯博弈的扩展式为=﹛N,H,P,I,p,u﹜,其中N为参与者集合,N=﹛0,1,2,…,n﹜,0代表自然。B11H为全历史集合,即从博弈开始到博弈结束所有可能的行动序列﹛a0,a1,…,am﹜,m为任一自然数,表示一个全历史包含的行动次数。P为参与者函数即对于每一个子历史h,P(h)将其映射成自然或是其他参与者。I为信息空间。p为自然的概率分布函数,其表示当自然行动时,自然以多大概率选择某个行动。u表示参与者的偏好,其定义是在全历史结果上的收益函数。B12

在“田忌赛马”博弈中,参与者集合N=﹛0,1,2﹜,0代表自然。H是全历史集合,表示所有可能的行动序列﹛上中下,上下中,中上下,下上中,下中上,中下上﹜,即共有六个可能的行动。在此博弈中,由于是齐威王先行动,所以无论马出场顺序如何,作为自然的孙膑总是可以帮助田忌,以下等马对上等马,以中等马对下等马,以上等马对中等马(顺序无先后),这样如果把三场全胜看做“1”的话,那么田忌总有“2/3”的收益。也就是说田忌有100%的可能获得2/3的收益。齐威王由于过分自信或者智商不高,未能识破此中玄机,所以败下阵来。但在现实生活中,一方的决策是严格保密的,作为自然的“孙膑”并不可能事先知道“齐威王”的决策,而齐威王有六种行动序列,相对应,“田忌”也有六种,我们说过,只有一种情况可以助“田忌”胜出,所以“田忌”获胜的概率仅为1/6。P为参与者函数即对于每一个子历史h,P(h)将其映射成自然或是其他参与者。在此博弈中,假设一个子历史“上中下”,那么P(h)作为一个映射将有六种;一共有六个子历史,所以P(h)应该有36种。I是信息空间。假设I1 是齐威王的信息空间,I1=﹛上中下,上下中,中上下,下上中,下中上,中下上﹜,I2同I1,因为他同样不知道对方的策略。

在“田忌赛马”这个非完全信息动态博弈中,还有一个很重要的因素需要我们注意,即参与者可能临时改变策略,这也更带来了决策的复杂性和不稳定性。因为一场赛马是由三局比赛构成的(非同时进行),假设第一局结束后,参与者肯定要根据这一局得结果变换策略,同时也能观察到一部分对方的策略,这么说来,双方获胜的概率就不是齐威王5/6,而田忌1/6的概率了,需要更复杂的计算。

客观而言,直到今天理论界也没有找到能适用所有非完全信息动态博弈的均衡概念,也缺乏一个普遍的方法来求解动态博弈的序列均衡。B13

结论

“田忌赛马”博弈不是人们想象中的那么简单的一个博弈,反而是博弈类型中最复杂的非完全信息动态博弈,应该对这个博弈有一个全新的认识。并且,在这个博弈中,至少包含着两个子博弈,这更加剧了此博弈的复杂性。博弈论思想虽然在实际生活中适用性差,但它教会我们一种思考问题的方法,对合理规避风险,获取最大收益还是有指导意义的。(作者单位:四川大学)

注解

①姚国庆:《博弈论》,北京:高等教育出版社,2007年,第1页。

②王俊冰:“白话博弈论”,《理论学习》,2006年第6期,第63页。

③郭磊:“博弈论简论”,《山东经济》,1999年第6期,第17页。

④胡静:“博弈论在数学中的应用”,《商情》,2006年第4期,第213页。

⑤《孙子吴起列传第五》,《史记》卷六十五,中华书局,2007年4月。

⑥“黄金”在古代是一种货币,不同于现代意义上的黄金;“黄金一千”只一千两黄金的意思。

⑦周翰光:“论孙膑的对策论和辩证法”,《齐鲁学刊》,1984年第3期,第36页。

⑧胡静:“博弈论在数学中的应用”,《商情》,2008年第5期,第213页。

⑨逯彦彦:“博弈论前瞻探讨”,《商丘职业技术学院学报》,2009年第1期,第33页。

⑩胡静:“博弈论在数学中的应用”,《商情》,2008年第5期,第213页。

11“自然”指在动态贝叶斯博弈中参与博弈,无收益,但可以决定不同历史发生概率的参与者。

推荐期刊