《博弈论与信息经济学导论》讲义-中国经济学堂 6页

107.00 KB
2022-08-19 发布

《博弈论与信息经济学导论》讲义-中国经济学堂

关闭预览

6页
当前文档由用户上传发布，收益归属用户

1、本文档由用户上传，淘文库整理发布，可阅读全部内容。
2、本文档内容版权归属内容提供方，所产生的收益全部归内容提供方所有。如果您对本文有版权争议，请立即联系网站客服。
3、本文档由用户上传，本站不保证质量和数量令人满意，可能有诸多瑕疵，付费之前，请仔细阅读内容确认后进行付费下载。
网站客服QQ：403074932

聂辉华《博弈论导论》讲义第1章导论聂辉华教授中国人民大学经济学院www.ChinaES.org.cnniehuihua(at)vip.163.com1.1背景1.1.1目的与局限为什么要学习博弈论？第一，博弈论是关于规则的理论，而规则很重要。《资治通鉴》卷第一、周纪一：天子之职莫大于礼，礼莫大于分，分莫大于名。何谓礼？纪纲是也；何谓分？君臣是也；何谓名？公、侯、卿、大夫是也。夫以四海之广，兆民之众，受制于一人，虽有绝伦之力，高世之智，莫敢不奔走而服役者，岂非以礼为之纲纪哉！张五常认为，人类社会的体制只有三种：私有产权、社会等级、（贪腐）权力。或者是两种：价格机制vs.制度（Schotter，1981）（图1－1）。新古典微观经济学的核心是价格机制，但这张图说明有规则的制度比自由放任的市场经济（拍卖）要好。EDBCA图1－1交通博弈第二，改变行为或解决问题要先改变规则。唯有改变规则（或制度）才能“标本兼治”。纳什均衡是社会科学的DNA（Myerson，1999）。经济学家拒绝道德批判。案例：2015年6月，贵州省毕节市七星关区田坎乡茨竹村一户人家的4名儿童集体喝农药自杀；北大学生帮农民工在网上抢票。第三，有利于分析行为主体之间的冲突与合作，是微观分析的基本工具。价格理论和博弈的差别。1.1.2测试测试1：以下格局是纳什均衡吗？图1－2来自电影《美丽心灵》（ABeautifulMind），酒吧博弈（第19分钟）。6白鲨在线niehuihua.com\n聂辉华《博弈论导论》讲义俊男女1齐威王孙膑俊男女a上马下马俊男女b中马上马丑男女c下马中马图1－2泡妞博弈图1－3田忌赛马测试2：假设一个销售团队中有两个成员，一个负责找到客户名单，一个负责联系客户，两人必须合作才能完成任务。请指出下列博弈中的囚徒困境。22偷懒勤奋偷懒勤奋10，20120，100，50100，4010，2040，1015，50100，40偷懒偷懒11勤奋勤奋图1－4A图1－4B22偷懒勤奋偷懒勤奋10，1840，2015，1520，1010，2040，106，2515，22偷懒偷懒11勤奋勤奋图1－4C图1－4D答案：B和/或D。囚徒困境需要满足两个条件：一是“自私”成为双方的优势策略（即对双方而言，“偷懒”都比“勤奋”要有利）；二是“自私”使得个体利益（“偷懒”）之和严格小于整体利益（双方都选“勤奋”）。图A中，1和2的优势策略分别是“勤奋”和“偷懒”，因此纳什均衡是（勤奋，偷懒）。图C中，两人都没有优势策略，纯策略均衡为（勤奋，偷懒）和（偷懒，勤奋），是一个典型的“搭便车”博弈。B和D的差别在于，D是“广义囚徒困境”，此时一方“勤奋”而另一方“偷懒”的结果是最好的，因此在重复博弈中可以通过轮流“偷懒”来谋取双方利益。根据Rasmusen（2009），设有如图1－5博弈矩阵，则严格来讲只有满足条件2R>T+S>2P的博弈才是“囚徒困境”（Prisoner’sDilemma），而满足条件T+S>2R>2P的博弈属于“囚徒之战”或广义的囚徒困境。图1－5广义囚徒困境6白鲨在线niehuihua.com\n聂辉华《博弈论导论》讲义1.2基本概念1.2.1测试市面上有大量的关于“博弈论”的书，例如《伟大的博弈》、《房地产博弈的经济后果》、《生活要懂点博弈学》、《大国博弈——中国之危与机》。但是，这些真属于“博弈”吗？请问以下哪种情况是博弈？（1）面对强盗，或者被砍掉左手，或者被砍掉右手？（2）中国工商银行决定在人民大学招聘10名新员工。（3）2008年，人大校内十几家文印社决定联合提价。（4）你表弟参加今年高考后填报志愿。1.2.2定义博弈（game）：一种存在策略互动的游戏。博弈论（gametheory）：研究存在互动策略时最佳决策的理论。决策问题：（1）所有可能的行动；（2）所有可能的结果；（3）个人对结果的偏好。表现形式：案例、模型和文字描述（如ThomasShelling）。作用：为所有的经济理论提供微观决策基础，特别是广泛用于产业组织理论、契约理论、信息经济学、企业理论、制度经济学和新政治经济学等领域。“对今天的经济学家来说，不懂得博弈论显然是不行了”（张维迎，1996）。“道”与“术”的关系。参与人players：人或自然（虚拟参与人），或行动actions：参与人的选择，，可以是有限的或无限的信息information：以信息集定义，即参与人在特定时点对变量取值的了解，博弈策略strategies：参与人行动的规则或全部计划，收益payoffs：行动结束后参与人获得的效用或期望效用，均衡equilibria：参与人的最佳策略的组合，，理论预测的结果结果outcome：博弈结束后事实上的行动、策略或收益的集合[注1]行动与策略的区别：前者是物质上的、可观测的，后者是意识上的，不可观测的；前者几乎不可能预测，而后者通常能够预测。[注2]结果只有一个，均衡可以作为一种结果之一。[注3]博弈论中的“均衡”是一种策略组合或规则，不是均衡结果；而价格理论中的“均衡”是一种均衡结果（价格）。[注4]最主要的是参与人、行动和均衡。6白鲨在线niehuihua.com\n聂辉华《博弈论导论》讲义博弈论的缺陷：第一，它要求参与人具有完备的、封闭的心智模式（mentalmodel）或者说关于博弈规则的共同知识（commonknowledge），这实际上要求参与人是超级理性的。第二，它存在多重均衡，这使得它的结论是不稳健的（non-robust），从而给经验检验带来了困难。Greif（2002）对于博弈论在制度分析中适用性提供了辩护（精炼、限制参数范围、显性建模）。1.3基本框架1.3.1合作vs.非合作如果参与人之间能够达成有约束力的协议，那么该博弈就称为合作博弈（cooperativegame），否则就叫非合作博弈（non-cooperativegame）。前者强调公正、帕累托最优、集体利益最大化；后者强调个人理性和个人利益最大化。两者都发端于1950年代，并且Nash都为此做出了杰出贡献（详见“博弈论的历史纲要”<）。[注]不能以是否存在利益冲突来区分合作博弈和非合作博弈，囚徒困境同样可以模型化为合作博弈。根据Rasmusen（2009），存在以下几种情形：a.没有冲突的合作博弈：一个工厂的工人选择最佳的协作方式；b.有冲突的合作博弈：两人分饼；c.有冲突的非合作博弈：两人分饼；d.没有冲突的非合作博弈：两家上下游企业独立地决定技术标准。合作博弈的进展：Maskin（2003）。教科书：奥斯本和鲁宾斯坦，2000：《博弈论教程》，中国社会科学出版社。2012年，LloydShapley和AlvinRoth因合作博弈获诺贝尔奖。除了标准博弈论之外，还有演化博弈论（evolutionarygametheory）和行为博弈论（behavioralgametheory），参考Sugden（1986）、Aoki（2001）等，或威布尔，《演化博弈论》，上海三联出版社，2006年；Bowles，《微观经济学：行为、制度和演化》，人大出版社，2006年。1.3.2非合作博弈分类静态：参与人独立地、同时地选择“一劳永逸”（once-and-for-all）的行动，并导致结果的实现。“同时”是逻辑上的时间，不一定是物理上的时间。完全信息：所有参与人了解博弈的环境，包括所有可能的行动、行动的结果和每个人对结果的偏好。或者技术地说，“自然”不首先行动。这些通常是共同知识。解的概念（solutionconcept）：通过限制各种可能的结果以便得到更合理结果的方法。一个好的解要符合三个条件：存在性（existence）、唯一性（uniqueness）和稳定性（invariance）。存在性指解存在于大部分博弈中，唯一性指解的范围要缩小到一个以至于可以准确预测。因此，在提炼解的概念时，我们往往要在存在性和唯一性之间权衡取舍。稳定性意味着收益函数的稍微变化不会导致结果发生根本性改变。6白鲨在线niehuihua.com\n聂辉华《博弈论导论》讲义图1－6非合作博弈分类1.3.3更深层次的讨论（1）博弈论对人性的假设理性＝偏好的完备性+传递性。理性＋智能＝超级理性（hyperrationality）。加总后的个人理性也不等于集体理性，例如囚徒困境和“孔多塞悖论”。而且，理性并不意味着选择就是最好的。【问：聪明人做的决策通常是正确的吗？】“结论的价值完全取决于假设的敏感性”（Tadelis，2012）。因此，我们采取的假设要尽可能接近现实，或者假设的轻易改变不应该导致结论的本质变化。然而，行为经济学们发现，人们在选择时存在“框架效应”（framing），即提问的方式本身会影响选择的结果，导致“偏好逆转”（Tversky-Kahneman，1981），这违背了理性人假设。但也有经济学家认为，长期的学习会导致人们更加理性。在本门课程中，我们将一直假设当事人是理性的。（2）对理性的要求竞争和自然选择的过程决定了理性（例如，利润最大化）假设的合理性（Alchian，1950）。（3）博弈论的理论基础贝叶斯决策理论（Bayesiandecisiontheory）。两大基石是效用函数和主观概率分布。满足完备性、传递性、相关性、单调性、连续性、客观替代性、主观替代性等公理后，存在一个期望效用最大化定理。然而，该定理在预测上的准确性不能代替其在方法论上的缺陷，假如行为人不是按照这一模式决策的话。例如，Allais悖论就表明效用函数不适用。更详细的说明，参考Myerson（1991）。（4）模型的价值“我们使用模型不仅能够理解我们观察到的道理，还可以预测我们观察不到的道理”（Tadelis，2012，p.xi）。例如，囚徒困境。（5）收益数字的问题根据收益函数反映的偏好关系，数字本身没有意义，有意义的是它代表的排序。以囚徒困境为例。当然，混合策略（含随机变量）是依赖于基数效用的，一方的混合概率依赖于对方的效用。此时，不仅偏好本身是重要的，而且“偏好的权重”也是重要的。当我们考虑风险态度时，这一改变尤其明显。6白鲨在线niehuihua.com\n聂辉华《博弈论导论》讲义在以利润为目标的决策问题中，基数效用论还是序数效用论都是一样的。22坦白抵赖坦白抵赖10，20120，100，50100，40－8，－80，－10－10，0－1，－1坦白坦白11抵赖抵赖图1－7A图1－7B（6）对数学的要求必须具备基本的数学知识（微积分和概率论），它有“进入门槛”和“信息甄别”的功能。高深的博弈论涉及的数学知识包括泛函、随机过程、高等概率等等，可以说没有上限。比数学重要的是思想。参考文献Alchian,Armen,1950,“Uncertainty,Evolution,andEconomicTheory”,JournalofPoliticalEconomy,58(3):211-221.Greif,Avner,2002,“EconomicHistoryandGameTheory”,intheHandbookofGameTheory,Vol.III,editedbyRobertAumannSerguiHart,Amsterdam:North-Holland.Maskin,Eric,2003,“Bargaining,Coalitions,andExternalities”,PrincetonUniversity,workingpaperMyerson,RogerB.,1999,“NashEquilibriumandtheHistoryofEconomicTheory”,JournalofEconomicLiterature,37(3):1067-1082.Myerson,Roger,1991,Gametheory:AnalysisofConflict,HarvardUniversityPress.Schotter,Andrew,1981,TheEconomicTheoryofSocialInstitutions,Cambridge:CambridgeUniversityPress.肖特：《社会制度的经济理论》，陆铭、陈钊译，上海：上海财经大学2003年中文版。Tadelis,Steven,2012,GameTheory:AnIntroduction，PrincetonUniversityPress.Tversky,Amos,andDanielKahneman,1981,“TheFramingofDecisionsandthePsychologyofChoice”,Science,211(4481):453-8.艾里克·拉斯缪森（EricRasmusen），2009：《博弈与信息》（第四版），中国人民大学出版社。张维迎，1996，《博弈论与信息经济学》，上海人民出版社。张维迎，2013，《博弈与社会》，北京大学出版社。6白鲨在线niehuihua.com

《博弈论与信息经济学导论》讲义-中国经济学堂 6页

《博弈论与信息经济学导论》讲义-中国经济学堂

您可能关注的文档

相关文档

最近下载