- 107.00 KB
- 2022-08-19 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
聂辉华《博弈论导论》讲义第1章导论聂辉华教授中国人民大学经济学院www.ChinaES.org.cnniehuihua(at)vip.163.com1.1背景1.1.1目的与局限为什么要学习博弈论?第一,博弈论是关于规则的理论,而规则很重要。《资治通鉴》卷第一、周纪一:天子之职莫大于礼,礼莫大于分,分莫大于名。何谓礼?纪纲是也;何谓分?君臣是也;何谓名?公、侯、卿、大夫是也。夫以四海之广,兆民之众,受制于一人,虽有绝伦之力,高世之智,莫敢不奔走而服役者,岂非以礼为之纲纪哉!张五常认为,人类社会的体制只有三种:私有产权、社会等级、(贪腐)权力。或者是两种:价格机制vs.制度(Schotter,1981)(图1-1)。新古典微观经济学的核心是价格机制,但这张图说明有规则的制度比自由放任的市场经济(拍卖)要好。EDBCA图1-1交通博弈第二,改变行为或解决问题要先改变规则。唯有改变规则(或制度)才能“标本兼治”。纳什均衡是社会科学的DNA(Myerson,1999)。经济学家拒绝道德批判。案例:2015年6月,贵州省毕节市七星关区田坎乡茨竹村一户人家的4名儿童集体喝农药自杀;北大学生帮农民工在网上抢票。第三,有利于分析行为主体之间的冲突与合作,是微观分析的基本工具。价格理论和博弈的差别。1.1.2测试测试1:以下格局是纳什均衡吗?图1-2来自电影《美丽心灵》(ABeautifulMind),酒吧博弈(第19分钟)。6白鲨在线niehuihua.com\n聂辉华《博弈论导论》讲义俊男女1齐威王孙膑俊男女a上马下马俊男女b中马上马丑男女c下马中马图1-2泡妞博弈图1-3田忌赛马测试2:假设一个销售团队中有两个成员,一个负责找到客户名单,一个负责联系客户,两人必须合作才能完成任务。请指出下列博弈中的囚徒困境。22偷懒勤奋偷懒勤奋10,20120,100,50100,4010,2040,1015,50100,40偷懒偷懒11勤奋勤奋图1-4A图1-4B22偷懒勤奋偷懒勤奋10,1840,2015,1520,1010,2040,106,2515,22偷懒偷懒11勤奋勤奋图1-4C图1-4D答案:B和/或D。囚徒困境需要满足两个条件:一是“自私”成为双方的优势策略(即对双方而言,“偷懒”都比“勤奋”要有利);二是“自私”使得个体利益(“偷懒”)之和严格小于整体利益(双方都选“勤奋”)。图A中,1和2的优势策略分别是“勤奋”和“偷懒”,因此纳什均衡是(勤奋,偷懒)。图C中,两人都没有优势策略,纯策略均衡为(勤奋,偷懒)和(偷懒,勤奋),是一个典型的“搭便车”博弈。B和D的差别在于,D是“广义囚徒困境”,此时一方“勤奋”而另一方“偷懒”的结果是最好的,因此在重复博弈中可以通过轮流“偷懒”来谋取双方利益。根据Rasmusen(2009),设有如图1-5博弈矩阵,则严格来讲只有满足条件2R>T+S>2P的博弈才是“囚徒困境”(Prisoner’sDilemma),而满足条件T+S>2R>2P的博弈属于“囚徒之战”或广义的囚徒困境。图1-5广义囚徒困境6白鲨在线niehuihua.com\n聂辉华《博弈论导论》讲义1.2基本概念1.2.1测试市面上有大量的关于“博弈论”的书,例如《伟大的博弈》、《房地产博弈的经济后果》、《生活要懂点博弈学》、《大国博弈——中国之危与机》。但是,这些真属于“博弈”吗?请问以下哪种情况是博弈?(1)面对强盗,或者被砍掉左手,或者被砍掉右手?(2)中国工商银行决定在人民大学招聘10名新员工。(3)2008年,人大校内十几家文印社决定联合提价。(4)你表弟参加今年高考后填报志愿。1.2.2定义博弈(game):一种存在策略互动的游戏。博弈论(gametheory):研究存在互动策略时最佳决策的理论。决策问题:(1)所有可能的行动;(2)所有可能的结果;(3)个人对结果的偏好。表现形式:案例、模型和文字描述(如ThomasShelling)。作用:为所有的经济理论提供微观决策基础,特别是广泛用于产业组织理论、契约理论、信息经济学、企业理论、制度经济学和新政治经济学等领域。“对今天的经济学家来说,不懂得博弈论显然是不行了”(张维迎,1996)。“道”与“术”的关系。参与人players:人或自然(虚拟参与人),或行动actions:参与人的选择,,可以是有限的或无限的信息information:以信息集定义,即参与人在特定时点对变量取值的了解,博弈策略strategies:参与人行动的规则或全部计划,收益payoffs:行动结束后参与人获得的效用或期望效用,均衡equilibria:参与人的最佳策略的组合,,理论预测的结果结果outcome:博弈结束后事实上的行动、策略或收益的集合[注1]行动与策略的区别:前者是物质上的、可观测的,后者是意识上的,不可观测的;前者几乎不可能预测,而后者通常能够预测。[注2]结果只有一个,均衡可以作为一种结果之一。[注3]博弈论中的“均衡”是一种策略组合或规则,不是均衡结果;而价格理论中的“均衡”是一种均衡结果(价格)。[注4]最主要的是参与人、行动和均衡。6白鲨在线niehuihua.com\n聂辉华《博弈论导论》讲义博弈论的缺陷:第一,它要求参与人具有完备的、封闭的心智模式(mentalmodel)或者说关于博弈规则的共同知识(commonknowledge),这实际上要求参与人是超级理性的。第二,它存在多重均衡,这使得它的结论是不稳健的(non-robust),从而给经验检验带来了困难。Greif(2002)对于博弈论在制度分析中适用性提供了辩护(精炼、限制参数范围、显性建模)。1.3基本框架1.3.1合作vs.非合作如果参与人之间能够达成有约束力的协议,那么该博弈就称为合作博弈(cooperativegame),否则就叫非合作博弈(non-cooperativegame)。前者强调公正、帕累托最优、集体利益最大化;后者强调个人理性和个人利益最大化。两者都发端于1950年代,并且Nash都为此做出了杰出贡献(详见“博弈论的历史纲要”<)。[注]不能以是否存在利益冲突来区分合作博弈和非合作博弈,囚徒困境同样可以模型化为合作博弈。根据Rasmusen(2009),存在以下几种情形:a.没有冲突的合作博弈:一个工厂的工人选择最佳的协作方式;b.有冲突的合作博弈:两人分饼;c.有冲突的非合作博弈:两人分饼;d.没有冲突的非合作博弈:两家上下游企业独立地决定技术标准。合作博弈的进展:Maskin(2003)。教科书:奥斯本和鲁宾斯坦,2000:《博弈论教程》,中国社会科学出版社。2012年,LloydShapley和AlvinRoth因合作博弈获诺贝尔奖。除了标准博弈论之外,还有演化博弈论(evolutionarygametheory)和行为博弈论(behavioralgametheory),参考Sugden(1986)、Aoki(2001)等,或威布尔,《演化博弈论》,上海三联出版社,2006年;Bowles,《微观经济学:行为、制度和演化》,人大出版社,2006年。1.3.2非合作博弈分类静态:参与人独立地、同时地选择“一劳永逸”(once-and-for-all)的行动,并导致结果的实现。“同时”是逻辑上的时间,不一定是物理上的时间。完全信息:所有参与人了解博弈的环境,包括所有可能的行动、行动的结果和每个人对结果的偏好。或者技术地说,“自然”不首先行动。这些通常是共同知识。解的概念(solutionconcept):通过限制各种可能的结果以便得到更合理结果的方法。一个好的解要符合三个条件:存在性(existence)、唯一性(uniqueness)和稳定性(invariance)。存在性指解存在于大部分博弈中,唯一性指解的范围要缩小到一个以至于可以准确预测。因此,在提炼解的概念时,我们往往要在存在性和唯一性之间权衡取舍。稳定性意味着收益函数的稍微变化不会导致结果发生根本性改变。6白鲨在线niehuihua.com\n聂辉华《博弈论导论》讲义图1-6非合作博弈分类1.3.3更深层次的讨论(1)博弈论对人性的假设理性=偏好的完备性+传递性。理性+智能=超级理性(hyperrationality)。加总后的个人理性也不等于集体理性,例如囚徒困境和“孔多塞悖论”。而且,理性并不意味着选择就是最好的。【问:聪明人做的决策通常是正确的吗?】“结论的价值完全取决于假设的敏感性”(Tadelis,2012)。因此,我们采取的假设要尽可能接近现实,或者假设的轻易改变不应该导致结论的本质变化。然而,行为经济学们发现,人们在选择时存在“框架效应”(framing),即提问的方式本身会影响选择的结果,导致“偏好逆转”(Tversky-Kahneman,1981),这违背了理性人假设。但也有经济学家认为,长期的学习会导致人们更加理性。在本门课程中,我们将一直假设当事人是理性的。(2)对理性的要求竞争和自然选择的过程决定了理性(例如,利润最大化)假设的合理性(Alchian,1950)。(3)博弈论的理论基础贝叶斯决策理论(Bayesiandecisiontheory)。两大基石是效用函数和主观概率分布。满足完备性、传递性、相关性、单调性、连续性、客观替代性、主观替代性等公理后,存在一个期望效用最大化定理。然而,该定理在预测上的准确性不能代替其在方法论上的缺陷,假如行为人不是按照这一模式决策的话。例如,Allais悖论就表明效用函数不适用。更详细的说明,参考Myerson(1991)。(4)模型的价值“我们使用模型不仅能够理解我们观察到的道理,还可以预测我们观察不到的道理”(Tadelis,2012,p.xi)。例如,囚徒困境。(5)收益数字的问题根据收益函数反映的偏好关系,数字本身没有意义,有意义的是它代表的排序。以囚徒困境为例。当然,混合策略(含随机变量)是依赖于基数效用的,一方的混合概率依赖于对方的效用。此时,不仅偏好本身是重要的,而且“偏好的权重”也是重要的。当我们考虑风险态度时,这一改变尤其明显。6白鲨在线niehuihua.com\n聂辉华《博弈论导论》讲义在以利润为目标的决策问题中,基数效用论还是序数效用论都是一样的。22坦白抵赖坦白抵赖10,20120,100,50100,40-8,-80,-10-10,0-1,-1坦白坦白11抵赖抵赖图1-7A图1-7B(6)对数学的要求必须具备基本的数学知识(微积分和概率论),它有“进入门槛”和“信息甄别”的功能。高深的博弈论涉及的数学知识包括泛函、随机过程、高等概率等等,可以说没有上限。比数学重要的是思想。参考文献Alchian,Armen,1950,“Uncertainty,Evolution,andEconomicTheory”,JournalofPoliticalEconomy,58(3):211-221.Greif,Avner,2002,“EconomicHistoryandGameTheory”,intheHandbookofGameTheory,Vol.III,editedbyRobertAumannSerguiHart,Amsterdam:North-Holland.Maskin,Eric,2003,“Bargaining,Coalitions,andExternalities”,PrincetonUniversity,workingpaperMyerson,RogerB.,1999,“NashEquilibriumandtheHistoryofEconomicTheory”,JournalofEconomicLiterature,37(3):1067-1082.Myerson,Roger,1991,Gametheory:AnalysisofConflict,HarvardUniversityPress.Schotter,Andrew,1981,TheEconomicTheoryofSocialInstitutions,Cambridge:CambridgeUniversityPress.肖特:《社会制度的经济理论》,陆铭、陈钊译,上海:上海财经大学2003年中文版。Tadelis,Steven,2012,GameTheory:AnIntroduction,PrincetonUniversityPress.Tversky,Amos,andDanielKahneman,1981,“TheFramingofDecisionsandthePsychologyofChoice”,Science,211(4481):453-8.艾里克·拉斯缪森(EricRasmusen),2009:《博弈与信息》(第四版),中国人民大学出版社。张维迎,1996,《博弈论与信息经济学》,上海人民出版社。张维迎,2013,《博弈与社会》,北京大学出版社。6白鲨在线niehuihua.com