- 459.86 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计学复习资料第一章 绪论第一节统计的产生和发展一、统计的产生:源于人类的计数与统计实践活动。二、统计的发展1、英国的政治算术学派(17世纪)【“有实无名”的统计学】创始人:英国的威廉·配第(政治经济学之父)代表作:《政治算术》——统计学诞生的标志;文中针对英、法、荷兰的国情,利用数字、重量、尺度的方法,并配以朴素的图表(现代统计学广为采用的方法和内容)进行三国国力的比较,但没有使用“统计学”一词。2、德国的国势学派(又称记述学派)(18世纪)【“有名无实”的统计学】代表人物:康令、阿亨瓦尔康令在大学开设“国势学”课程,以文字技术和比较为主,反映各国的国情国力;阿亨瓦尔继承和发展了康令的思想,并于1749年首次使用“统计学”代替“国势学”,认为统计学是关于各国基本制度的学问,但缺乏数字和内容。3、数理统计学派(19世纪)代表人物:凯特勒(比利时)(古典统计学的完成者,近代统计学的先驱者)代表作:《社会物理学》——他将概率论引进统计学,完成了统计学和概率论的结合。第二节统计学的性质和特点一、统计的三个含义:统计工作(过程)、统计资料(成果)和统计学(理论)。二、统计学的研究对象:大量社会现象(主要是经济现象)的总体数量方面的方法论科学。三、统计学的特点:数量性、总体性、具体性、社会性、广泛性。第四节统计学中的几个基本概念一、统计总体与总体单位1、统计总体:是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。统计总体可以分为有限总体和无限总体,总体所包含的单位数有限的比如人口数、企业数,反之比如大海里的鱼资源数。2、总体单位:是指构成总体的个别单位。注:总体和总体单位的划分是相对的,它们随着统计研究对象和研究目的变化而相互转化。二、统计标志与统计指标1、统计标志:用来说明总体单位所具有的属性或特征的名称。可分为品质标志和数量标志。品质标志是说明总体单位质的特征,不能用数字来表示的,如性别、籍贯、工种等;数量标志是说明总体单位量的特征,是可用数字来表示的,如年龄、身高、收入等。2、统计指标:综合反映统计总体数量特征的名称,包括指标名称和指标数值两部分。可分为数量指标和质量指标。数量指标是说明总体规模、总数量的指标,一般用绝对数表示;质量指标是说明总体结构、比例、强度等质方面的指标,一般用相对数或平均数表示。又按其作用和表现形式分为总量指标(绝对数)、相对指标(相对数)、平均指标(平均数)。指标与标志的联系和区别:区别:标志是说明总体单位特征的,而指标是说明统计总体特征的;指标都能用数字表示,而标志中的品质标志是用文字来描述的,不能用数值表示。指标一般是经过一定的汇总取得,而标志值一般是经过测量、观察直接取得的。标志一般不需要说明时间、地点、条件,但完整的指标必须说明时间、地点、条件等。联系\n统计学复习资料:大多数指标的数值是从总体单位的数量标志值综合而来;例如,某企业的工资总额是由该企业全部职工的工资汇总而来;两者之间存在着一定的变换关系。三、变异与变量1、变异:是指品质标志在总体单位上的不同表现。2、变量:是指数量标志在总体单位上的不同表现。变量可分为离散变量和连续变量,离散变量是指只能取整数的变量,如人数、企业数等;而连续变量是指可以在整数间插入小数的变量,如身高、资金等。变量又可根据其所受因素影响分为确定性变量和随机性变量。四、流量与存量1、流量:是指在一定时期内测算的量。如一定时期的产值、产量、销售额、收入、支出等;2、存量:是指在一定时点上测算的量或状态。如一定时点的人口数、资产、负债、面积等。第二章统计调查与整理第一节统计调查方案一、确定调查目的:为什么要进行调查(why)二、确定调查对象和调查单位:向谁进行调查(who)调查对象=总体;调查单位=总体单位(项目的承担者);三、确定调查项目,拟定调查表:调查什么(what)四、确定调查时间和调查期限:何时调查和调查何时数据(when)五、制定调查组织实施计划:如何开展(how)调查组织分工、调查员选择(年龄、性别、经验)与培训、费用预算与宣传;六、选择调查方法:什么方法(which)直接观察法、报告法、采访法和网络调查法等。第二节统计调查的组织形式一、统计调查的五种组织形式1、普查:是专门组织的一次性的全面调查。作用:可以用来搜集不宜用经常调查的全面准确的资料。具体方式:自上而下的登记和自下而上的填报。2、统计报表制度:是按照国家或上级部门统一规定的表式、统一的指标项目、统一的报送程序和统一的报送时间,自下而上逐级提供基本统计资料的调查方式,比如日报、旬报、月报、季报、半年报和年报等。3、重点调查:选择部分重点单位搜集统计资料的非全面调查。4、典型调查:有意识地选取若干典型单位进行的非全面调查。5、抽样调查:按照随机原则从总体中抽取部分单位进行调查,并根据结果推断总体的非全面调查方法。第三节统计分组一、概念:根据统计研究的目的和要求以及总体的内在差异,按照某一标志将社会经济现象总体区分为若干部分或不同的类型组。二、类别:1、按照分组标志的性质不同分为:品质分组和数量分组【数量分组又分为单项式分组(适合于离散变量)和组距式分组(适合于连续变量)】;2、按照分组标志的个数不同分为:简单分组、复合分组和分组体系。第四节分配数列\n统计学复习资料一、组距数列的编制例:按百分制计分,某班40位学生统计学考试成绩分别如下:89887699746082608986939994827779977895928784796598675972848556817773656683637970(一)先按照数值大小排列56596060636565666770727374767777787979798182828384848586878889899293949597989999(二)计算全距(R)R=最大值—最小值=99-56=43(三)确定组距(i)和组数(K)1、组数:一般应依据总体内部情况的定性分析来确定组数(K=5)2、组距:每个组上限和下限之间的距离。3、上限和下限:在组距数列中是用变量的一定范围代表一个组的,每个组的最大值称为组的上限,每个组的最小值称为组的下限。4、组距和组数之间的关系:组数多,组距小;组数少,组距大。(四)确定组限组限:组距两端的数值称为组限。组距的上限、下限都齐全的叫闭口组;有上限缺下限,或有下限缺上限的叫开口组。原则:“上组限不在内”(五)形成分配数列并绘制曲线图(图略)考分人数(人)比重(%)50-6025.060-70717.570-801127.580-901230.090-100820.0合计40100.0(六)组中值的计算1、闭口组:2、开口组:(七)计算累计次数:表示总体在某一标志水平以上或者以下的次数或者比率总和。成绩次数向上累计向下累计50-60224060-707938\n统计学复习资料70-8011203180-9012322090-1008408合计40——累计次数分布的一个应用——洛伦兹曲线。二、次数分布主要类型(一)钟型分布(二)U型分布(三)J型分布xf(b)反J型xf(a)正J型xf第三章 综合指标第一节总量指标一、概念:是指反映社会经济现象一定时间、地点、条件下的总规模、总水平的统计指标。一般用绝对数表示;如国内生产总值、产品产量、职工人数、工资总额等。按反映内容分xf(a)对称分布xf(b)左偏分布xf(c)右偏分布为:总体标志总量(某数量标志的总和)和总体单位总量(总体中个体的数量);按时间状态分为:时期指标(流量):特点连续性、累加性、与时间长度直接相关;时点指标(存量):特点间断性、不可累加性、与时间长度无直接相关性。第二节相对指标一、概念:相对指标是两个有联系的指标对比的比值,反映事物的数量特征和数量关系。可以是绝对数之比,也可以是相对数或平均数之比。二.相对指标的种类及计算1、计划完成相对数:用来检查、监督计划执行情况的相对指标。一般用%表示。\n统计学复习资料2、结构相对数3、比例相对数4、比较相对数(类比相对数)5、动态相对数6、强度相对数第三节平均指标一、概念:是对同质总体内各单位某数量标志的差异进行抽象化,用以反映总体具体条件下的一般水平。是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。二、算术平均数总体标志总量1、基本公式平均指标=总体单位总量2、简单算术平均数:应用于未分组资料3、加权算术平均数:应用于分组资料三、调和平均数(倒数平均数)1、简单调和平均数:(应用于未分组资料)\n统计学复习资料注:先将各变量值的倒数计算出来,再计算各倒数的算术平均数,再计算出这个算术平均数的倒数,即得到调和平均数。2、加权调和平均数:(应用于分组资料)()四、几何平均数(对数平均数)适用于变量的连乘积等于总比率或总速度的变量数列。1、简单几何平均数:(应用于未分组资料)2、加权几何平均数:(应用于分组资料)五、众数运用插值法推算众数的近似值下限公式:上限公式:六、中位数计算向上累计次数或向下累计次数(推荐使用向上累计)找到相应数组,插值法计算中位数近似值:下限公式:上限公式:备注:第四节标志变动度\n统计学复习资料一、概念:说明总体各单位标志差异程度的指标,又称标志变异度、离散程度或离中程度。二、种类:全距、四分位差、平均差、标准差和离散系数。1、全距:又称“极差”,它是总体各单位标志的最大值和最小值之差。2、四分位差:将一个变量数列分为四等分,形成三个分割点(Q1,Q2,Q3),这三个分割点的数值就称为四分位数。(以Q.D.表示)3、平均差:各单位标志值与平均数的离差绝对值的平均数,以A.D.表示。(应用于未分组资料)(应用于分组资料)4、标准差标准差是各单位标志值与算术平均数的离差平方和的算术平均数的开方,又称“均方差”,以σ表示。标准差的平方即为方差,用σ2表示。(应用于未分组资料)(应用于分组资料)5、离散系数也称为标志变动系数,用以反映各单位标志值的离散程度;离散系数的形式:最常用的标准差系数:第四章动态数列第一节动态数列的编制一、概念:动态数列(时间数列)是指标数值按时间顺序排列而形成的数列。二、分类:\n统计学复习资料1、绝对数动态数列(基本):可分为时期数列和时点数列。2、相对数动态数列:反映比例关系、速度、结构等变化发展关系。3、平均数动态数列:反映一般水平的发展趋势。三、编制动态数列的原则时间长短应该相等,总体范围要一致,经济内容要一致,计算方法要一致。第二节水平分析指标一、发展水平:数列中的具体指标数值为发展水平,可以是绝对数、相对数或平均数。可以分为最初水平、最末水平、中间水平、基期水平、报告期水平等。二、平均发展水平(序时平均数或动态平均数)对不同时期的发展水平加以平均。1、由绝对数动态数列计算序时平均数(1)由时期数列计算序时平均数(2)由时点数列计算序时平均数①由连续时点数列计算序时平均数连续变动时点数列非连续变动时点数列(中途招聘和裁员等)②由间断时点数列计算序时平均数由间隔相等的间断时点数列计算(首末折半法,分母减一)由间隔不等的间断时点数列计算2、由相对数或平均数动态数列计算序时平均数\n统计学复习资料①a、b都为时期数列②a、b都为时点数列(首末折半制)③a为时期数列,b为时点数列当a未知时:当b未知时:三、增长量一定时期内增长的绝对数量,基本公式:增长量=报告期水平-基期水平逐期增长量:以上一期为基期。累计增长量:以固定期为基期。年距增长量=报告期发展水平—上年同期发展水平四、平均增长量平均每期增长的数量,是逐期增长量的序时平均数。第三节速度分析指标一、发展速度定基发展速度(总速度):以固定期为基期,\n统计学复习资料环比发展速度:以上一期为基期,两种发展速度之间的关系:1、定基发展速度是环比发展速度的连乘积,如:2、相邻定基发展速度之比等于环比发展速度,如:实际中,常用年距发展速度:二、增长速度定基增长速度=定基发展速度—1(100%)环比增长速度=环比发展速度—1(100%)三、平均发展速度几何平均法原理:按照平均发展速度,最后一年达到的水平,即:整理可得到:四、平均增长速度:平均增长速度=平均发展速度—1(100%)第四节长期趋势的测定与预测一、时间数列的构成与分解1、社会经济指标的时间数列包含以下四种变动因素:加法模型:Y=T+S+C+I长期趋势(T)、季节变动(S)、循环变动(C)、随机变动(I)二、长期趋势(T)的测定1、间隔扩大法2、移动平均法(MA)3、最小平方法(1)直线趋势当逐期增长量大致相等时,则可考虑配合直线趋势方程:\n统计学复习资料令:为了计算更简便,可以对时间t进行假设,令当时间项数为奇数时t设置为:∙∙∙,-3,-2,-1,0,1,2,3,∙∙∙当时间项数为偶数时t设置为:∙∙∙,-5,-3,-1,1,3,5,∙∙∙此时:第五章统计指数第一节统计指数的概念一、概念:简称指数,其编制是从物价变动产生的,指数理论仍在发展,有广义和狭义之分。从广义上讲,凡是表明社会经济现象总体数量变动或差异程度的相对数,都是指数。如计划完成程度相对数、比较相对数等;从狭义上讲,指数是用来反映不能直接相加或不能直接对比的复杂经济现象(总体)综合变动的相对数,如全国的居民消费价格指数、工业产品产量指数、股票价格指数等。二、指数的种类按指数反映现象的范围分为个体指数和总指数;按指数表明指标的性质分为数量指标指数和质量指标指数;按指数表现形式的不同分为综合指数、平均指标(数)指数、平均指标对比指数;按指标说明的因素多少分为两因素指数和多因素指数;按指数数列中采用的基期不同分为定基指数和环比指数。三、指数的特点1、综合性:综合反映多种不同类事物发展变化情况或者空间变动情况。2、平均性:反映的变动情况不是个别的差异,而是平均意义上的变化。第二节综合指数一、概述:综合指数是总指数的基本形式,它是两个总量指标对比形成的指数。综合指数能从相对量和绝对量两方面最完善地显示所研究对象的经济内容。二、同度量因素:把不能直接相加的指标过渡为可以直接相加的因素。三、数量指标综合指数数量指标综合指数是根据数量指标编制的,如:物量指数(产量、销量)、职工数指数等。1、以物量指数为例说明数量指标指数的编制过程(1)以基期P0作为同度量因素:\n统计学复习资料【Q(quality)物量(指数化因素);P(Price)商品价格(同度量因素)】(2)以报告期P1作为同度量因素:(3)以固定时期作为同度量因素:编制质量指标指数时,采用报告期的数量指标作为同度量因素;反之,编制数量指标指数时,采用基期的质量指标作为同度量因素;第三节平均指标指数一、概念:平均指标(平均数)指数是总指数的另一种形式,是通过对个体指数进行加权平均而得到的总指数。二、采用加权算术平均形式1、数量指标指数:2、质量指标指数:三、加权调和平均数指数1、数量指标指数:2、质量指标指数:四、平均数指数的应用1、我国居民消费价格指数(CPI)的编制不宜直接使用,故改写成比重权数形式。将p0q1/∑p0q1固定为,即“消费结构”,并假定在一段时间内各种消费所占比重保持不变,单纯考虑价格的变动,故:2、农副产品收购价格指数、股票价格指数、房地产价格指数的编制。第四节平均指标对比指数\n统计学复习资料平均指标的决定因素:一是总体内部各部分(组)的水平;二是总体的结构,即各部分(组)在总体中所占的比重。以加权算术平均数形式表示即为:根据因素分析法,建立指数体系:可变构成指数=固定构成指数×结构变动影响指数可变固定结构第五节指数体系概念从广义上说,指数体系是指由若干个经济上具有一定联系的指数所构成的一个整体。从狭义上讲,指数体系则是指不仅经济上具有一定的联系,而且还具有一定的数量对等关系的三个或三个以上的指数所构成的一个整体。例如:商品销售额指数=商品销售量指数×商品价格指数第六章抽样调查第一节抽样调查的意义一、概念广义:抽取部分单位观察,并根据观察结果推断全体。狭义:按照随机原则抽取部分单位观察,并运用数理统计方法,由部分对总体做出数量上的推断分析。二、统计误差【登记误差(可避免)和代表性误差(部分推断总体,误差不可避免)】第二节基本概念及理论依据一、基本概念1、全及总体(总体):所要认识对象的全体。可分为变量总体和属性总体。变量总体:总体中总体单位的标志为数量标志。属性总体:总体中总体单位的标志为品质标志。2、抽样总体(样本):从全及总体随机抽取得部分单位的集合体。3、全及指标:根据全及总体中的各单位标志值或标志特征计算的、反映总体某种属性的综合指标。变量总体:属性总体:\n统计学复习资料N1具有某种属性,N0不具有某种属性4、抽样指标:根据抽样总体中的各单位标志值或标志特征计算的综合指标。变量总体:属性总体:n1具有某种属性,n0不具有某种属性二、抽样方法和样本可能数目1、抽样方法:从全及总体随机抽取得部分单位的集合体。抽样方式不同:重复抽样、不重复抽样样本要求不同:考虑顺序抽样、不考虑顺序抽样2、不同抽样方法的样本可能数目(1)考虑顺序的重复抽样(2)考虑顺序的不重复抽样(3)不考虑顺序的重复抽样(4)不考虑顺序的不重复抽样三、抽样调查的理论依据1、大数定律:该定律表明,当样本单位数n足够大时,抽样平均数趋近于总体平均数,抽样成数p趋近于总体成数P。这为抽样推断提供了重要依据。2、中心极限定律:该定律证明,不论总体服从何种分布,只要它的数学期望和方差存在,从中抽取容量为n的样本,当n足够大,则这个样本的平均数 及样本成数p均趋于正态分布。这为抽样误差的概率估计提供了依据。第三节抽样平均误差一、计算1、实际使用公式公式说明,抽样平均误差仅为全及总体标准差的(1)重复抽样:P为总体成数\n统计学复习资料(2)不重复抽样:属性总体:变量总体:第四节全及指标的推断一、抽样极限误差由于存在误差,而且抽样指标会随着样本的不同而变动。这样,可以在统计意义上,推断总体指标在一定范围内。样本指标与总体指标的离差绝对值就是抽样极限误差。由于离差可正可负,整个变动的范围区间称为置信区间。第五节抽样方案设计(一)简单随机抽样1、直接抽选法;2、抽签法;3、随机数码表法(二)类型抽样(分类抽样、分层抽样)(三)机械抽样(等距抽样、系统抽样)(四)整群抽样(五)多阶段抽样第七章相关分析1、积差法协方差:用来表示变量关联程度的绝对指标。显然受标志大小的影响。相关系数:用无量纲的系数形式表示变量之间的相关程度。1、简捷计算方法(三个简捷公式)\n统计学复习资料已知平均值时,可采用:已知平均值和标准差时,可采用: