补充统计学基础知识 37页

  • 510.51 KB
  • 2022-09-01 发布

补充统计学基础知识

  • 37页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
经济学类各专业核心课程计量经济学1\n第二章统计学基础知识第一节常用的统计量——平均数、方差第二节常用的概率分布2\n第一节常用的统计量——平均数、方差一、算术平均算术平均(arithmeticmean)就是我们日常生活中使用的普通的平均数,其定义如下式:3\n二、加权算术平均加权平均(weightedarithmeticmean)是将各数据先乘以反映其重要性的权数(w),再求平均的方法。其定义如下式:4\n三、变化率变化率的定义如下式:5\n四、几何平均几何平均(geometricmean)是n个数据连乘积的n次方根,其定义如下式:6\n五、移动平均所谓移动平均(movingaverage),就是对时间序列数据的前后数据求平均,将不必要的变动(循环变动、季节变动和不规则变动)平滑(smoothing),也即剔除这些变动,从而发现长期变化方向的一种方法。每隔3个月的季度数据(quarterlydata)、每个月的月度数据(moonthlydata)中存在着季度和月份中固有变化的影响,利用移动平均可以消除这些季节变动,有助于理解长期变化趋势。同样,循环变动和不规则变动也可以通过移动平均来消除,计算平滑的长期变动。7\n通常,移动平均大多用简单的奇数项来计算,下面是3项移动平均和5项移动平均的定义。3项移动平均:8\n5项移动平均:9\n六、方差与标准差为了了解数据的结构,有必要考察数据的集中趋势和分散的程度。对于集中的趋势,我们从前面学习过的算术平均中已经大体有所了解,而对于分散的程度,通过对方差(variance)与标准差(standarddeviation),以及下一节将要介绍的变动系数的计算,能够得到很多信息。10\n方差的计算方法是,先将每个数据与算术平均数之差(即离差)的平方相加求和,再除于样本数减一。而标准差是方差的正的平方跟。由于方差是通过平方计算的,它与原数据的次数有所不同,而标准差由于是方差的平方跟,因而又与原数据的次数相同。因此,标准差与原数据的单位相同,而方差则不附加单位。11\n样本方差S2的定义分别如下式:12\n标准差S的的定义分别如下式:13\n七、变动系数变动系数(coefficientofvariation)又称变异系数,它用标准差S除于算术平均数的商来表示。变动系数CV的定义如下式:14\n八、标准化变量标准差变量(standardizedvariable),又称基准化变量,它是用来测量某个数据的数值与算术平均数的偏离程度,是标准差s的多少倍。借此可以看出该数据在全体数据所处的位置。标准化变量z的定义如下式:15\n九、相关系数所谓相关系数(correlationcoefficient)是用来测量诸如收入与消费、气温和啤酒的消费量、汇率与牛肉的进口价格等两个变量X、Y之间的相互关系的大小和方向(正或负)的系数。通过计算相关系数,可以知道X与Y之间具有多大程度的线性(linear)关系。相关系数R的定义如下式:16\n17\n相关系数的R的取值范围为,R的取值具有以下的不同含义:(1)R=1完全正相关(perfectcorrelation)(2)R>0正相关(positivecorrelation)(3)R=0不相关(nocorrelation)(4)R<0负相关(negativecorrelation)(5)R=-1完全负相关(perfectcorrelation)18\n十、相关系数的检验计算出来的相关系数在多大程度上值得信赖,需要进行检验。相关系数表列出了显著性水平(levelofsignification)分别为10%、5%、1%和0.1%,与不同的自由度(样本数-2=n-2)相对应的相关系数的显著性检验值。显著性水平越小,检验越严格。所谓显著性水平,指的是很少会发生的概率,这里相当于相关系数为零(R=0),也即相当于不相关的概率。例如,计算出来的相关系数的绝对值,如果大于表1-17中显著性水平为1%的相关系数。那就意味着,该系数为零的概率,即不相关的概率,小于1%,因此存在显著相关性。19\n第二节常用的概率分布经济计量模型研究具有随机性特征的经济变量关系。本节将对数理统计中常用的随机变量分布及一些概念作一简单回顾。20\n第二节常用的概率分布一、概率分布二、总体与样本三、正态分布四、抽样分布21\n一、概率分布随机变量在各个可能值上出现的概率的大小的情况,叫概率分布。概率分布可用概率函数描述。离散性随机变量X的可能取值为xi,P为概率,则概率函数为P(X=xi)i=1,2,3,…n概率函数满足P(X=xi)≥0;22\n一、概率分布连续性的随机变量概率函数23\n二、总体与样本数理统计中把所研究对象的全部单位所组成的集合,叫做总体。从总体中抽出的部分单位所组成的集合,叫做样本。24\n三、正态分布当连续的随机变量的概率密度函数形式为时,称X的分布为正态分布,记为X~,密度函数中和是X的数学期望和方差。25\n三、正态分布当和时,称X服从标准正态分布,记为X~。对于非标准正态分布的X,总可以作如下变换,,使Z服从标准正态分布。26\n27\n某商店每月销售大米的数量服从正态分布,均值为4500公斤,标准差300公斤。试求当月大米销售量符合下面条件的概率是多少?(1)超过4800公斤,(2)少于4000公斤,(3)在3800公斤与5000公斤之间。28\n四、抽样分布Samplingdistribution1、分布2、t分布3、F分布29\n1、分布样本均值分布也是正态分布,其数学期望方差,即~~30\n样本方差服从自由度为n-1的分布。记为:统计量定义为分布的密度函数为:其数学期望其方差为,31\n统计量的条件,所以服从自由度为n-1的分布。样本方差符合32\n如果随机变量X服从标准正态分布N(0,1);随机变量服从自由度为n、方差为2n的分布。并且X和相互独立,则统计量:服从t分布。2、t分布33\nt分布的密度函数为其数学期望E(t)=0,方差t分布的特点是:左右对称;当n很大时,非常接近正态分布。34\n对于从正态分布的总体中抽的容量为n的简单随机样本,其样本均值与样本标准差S构成如下统计量服从自由度为n-1的t分布,记为t~t(n-1)。t分布在小样本(n<30)统计推断中占有重要的地位。35\n如果随机变量Xi(i=1,2,3,…n1),Yi(i=1,2,3,…n1)是相互独立的,而且服从相同的正态分布。令3、F分布36\n则统计量服从第一自由度、第二自由度的F分布。记为F~F(,)3、F分布F分布在方差分析中有着重要的作用。例如判断两个正态分布总体的方差是否有显著差异,需要利用F分布。37

相关文档