- 167.50 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
推断统计学原理抽样分布(samplingdistribution)参数估计(parameterestimation)假设检验(hypothesistesting)抽样分布是参数估计与假设检验的理论基础\n三种不同性质的分布总体分布(populationdistribution):总体内个体数值的次数分布。样本分布(sampledistribution):样本内个体数值的次数分布。抽样分布(samplingdistribution):根据所有可能的样本观察值计算出来的某一种统计量的观察值的概率分布。\n从总体分布到抽样分布总体X的概率分布这是一个均匀分布(uniformdistribution)总体住户第一户第二户第三户第四户第五户日支出(X)2025303540户数11111概率0.200.200.200.200.20\n总体平均数和总体方差\n样本(n=2)的所有可能结果第一户第二户第三户第四户第五户第一户(20,20)M=20(25,20)M=22.5(30,20)M=25(35,20)M=27.5(40,20)M=30第二户(20,25)M=22.5(25,25)M=25(30,25)M=27.5(35,25)M=30(40,25)M=32.5第三户(20,30)M=25(25,30)M=27.5(30,30)M=30(35,30)M=32.5(40,30)M=35第四户(20,35)M=27.5(25,35)M=30(30,35)M=32.5(35,35)M=35(40,35)M=37.5第五户(20,40)M=30(25,40)M=32.5(30,40)M=35(35,40)M=37.5(40,40)M=40\n样本(n=2)的平均数的抽样分布平均数2022.52527.53032.53537.540次数123454321概率.04.08.12.16.20.16.12.08.04\n样本(n=2)的平均数的抽样分布图\n不同总体情况下的抽样分布示意图\n抽样分布的定理设总体X服从分布F(x),(X1,X2,…,Xn)是抽自该总体的一个简单随机样本(simplerandomsample),总体均值与样本均值、总体方差与样本均值的方差有如下关系:\n抽样分布的定理从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数;从总体中随机抽出容量为n的一切可能样本的平均数的方差,等于总体方差除以n.\n样本(n=2)平均数的平均数和方差=(20+22.5×2+25×3+27.5×4+30×5+32.5×4+35×3+37.5×2+40)/25=30\n样本均值的抽样分布(σ2已知)若(X1,X2,…,Xn)是抽自总体X的一个容量为n的简单随机样本,则依据样本的所有可能观察值计算出的样本均值的分布,称为样本均值的抽样分布。\n样本均值的抽样分布定理设(X1,X2,…,Xn)是抽自正态分布总体X~N(μ,σ2)的一个容量为n的简单随机样本,则其样本均值也是一个正态分布随机变量,且有\n样本均值的抽样分布\n例题某类产品的强度服从正态分布,总体平均数为100,总体标准差为5。从该总体中抽取一个容量为25的简单随机样本,求这一样本的样本均值介于99~101的概率。如果容量为100呢?\n样本均值的抽样分布(σ2已知)非正态总体、σ2已知时设总体X的均值μ和σ2,当样本容量趋向无穷大时,样本均值的抽样分布趋于正态分布,且样本均值的数学期望和方差分别为\n例题某类产品的强度不服从正态分布,总体平均数为100,总体标准差为5。从该总体中抽取一个容量分别为25的简单随机样本,求这一样本的样本均值介于99~101的概率。如果容量为100呢?\n例题某种灯具平均寿命为5000小时,标准差为400小时,从产品中抽取100盏,问它们的平均使用寿命不低于4900小时的概率是多少?如果是从2000盏灯具中不放回地抽取100盏呢?\n有限总体修正系数设总体X服从分布F(x),(X1,X2,…,Xn)是以不放回形式抽自该总体的一个样本,总体均值与样本均值、总体方差与样本均值的方差有如下关系:\n参数估计用样本统计量的来估计相应总体参数,称为参数估计判断估计量优劣的标准无偏性有效性一致性充分性\n参数估计的基本方式点估计(pointestimation)用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。区间估计(intervalestimation)以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。\n区间估计示意图\n区间估计的基础--抽样分布根据抽样分布的原理,可得到不同条件下总体参数的区间估计的计算方法区间估计涉及置信水平(confidencelevel)和置信区间(confidenceinterval)。\n例题某种零件的长度服从正态分布。已知总体标准差σ=1.5厘米。从总体中抽取100个零件组成样本,测得它们的平均长度为10.00厘米。试估计在95%置信水平下,全部零件平均长度的置信区间。\n例题*上例中,若已知该批零件共有2000件,抽样方式采用不放回抽样,求该批零件平均长度的置信水平为95%的置信区间。\n假设检验假设检验回答的问题某总体平均水平有无显著变化?两总体平均水平有无显著差异?多个总体平均水平有无显著差异?两个或多个总体方差有无显著差异?……以上:参数假设检验某总体是否服从正态分布(或其他分布)?某串数据是否随机?……以上:非参数假设检验\n非参数假设检验举例单样本游程检验某食堂窗口前排队性别规律性:FMFMFFFFFMMMFFMMFMFMFMFMFMFMFMFMFFFFFFFFMMMMMMMMMMMMMMMMFFFFFFFF\nFMFMFFFFFMMMFFMMFMFMFMFMFMFMFMFMFFFFFFFFMMMMMMMMMMMMMMMMFFFFFFFF\n假设检验利用样本信息根据一定概率对总体参数或分布的某一假设作出拒绝或保留的决断称为假设检验\n假设有两个相互对立的假设即零假设(nullhypothesis,或称原假设、虚无假设、解消假设)备择假设(alternativehypothesis,或称研究假设、对立假设)假设检验是从零假设出发,视其被拒绝的机会,从而得出决断。\n假设检验示意图\n显著性水平拒绝零假设的概率称为显著性水平(significancelevel)α。显著性水平和可靠性程度(置信水平)之间的关系是:两者之和为1。\n双侧检验与单侧检验双侧检验(two-tailedtest,two-sidedtest):零假设为无显著差异的情况;左侧检验(left-tailedtest):零假设为大于等于的情况;右侧检验(right-tailedtest):零假设为小于等于的情况。\n例题某小学历届毕业生汉语拼音测验平均分数为66分,标准差为10分。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽取25份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?\n统计决断的两类错误第一类型的错误(TypeIerror)--α错误拒绝了属于真实的零假设。这种错误的可能性大小正是显著性水平的大小水平未变而认为有显著差异第二类型的错误(TypeIIerror)--β错误保留了属于不真实的零假设水平显著差异而认为无显著差异