统计学原理(第五讲) 87页

  • 1.23 MB
  • 2022-09-01 发布

统计学原理(第五讲)

  • 87页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
统计学原理(第五讲)罗洪群\n教学目的与要求:抽样估计是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征的方法。通过本章的学习,要理解和掌握抽样估计的概念、特点,抽样误差的含义、计算方法,抽样估计的置信度,推断总体参数的方法,能结合实际资料进行抽样估计。\n本章主要内容抽样推断的一般问题抽样误差抽样估计的方法抽样组织设计\n一、抽样推断的概念和特点概念抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。特点它是由部分推断整体的一种认识方法。抽样推断建立在随机取样的基础上。抽样推断运用概率估计的方法。抽样推断的误差可以事先计算并加以控制。第一节抽样推断的一般问题\n二、抽样推断的内容参数估计参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。假设检验假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。\n三、有关抽样的基本概念(一)总体和样本总体:又称全及总体。指所要认识的研究对象全体。总体单位总数用“N”表示。样本:又称子样。是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单位总数用“n”表示。\n(二)参数和统计量参数反映总体数量特征的全及指标。参数研究总体中的数量标志总体平均数总体方差X=∑XNX=∑XF∑FΣ(X-X)N2σ=2Σ(X-X)FΣF2σ=2研究总体中的品质标志总体成数成数方差σ2=P(1-P)P=N1N(只有两种表现)\n统计量根据样本数据计算的综合指标。研究数量标志样本平均数x=∑xnx=∑xf∑f样本标准差研究品质标志样本成数成数标准差np=n\n(三)样本容量和样本个数样本容量:一个样本包含的单位数。用“n”表示。一般要求n≥30样本个数:从一个全及总体中可能抽取的样本数目。(四)重复抽样和不重复抽样重复抽样:又称回置抽样。不重复抽样:又称不回置抽样。可能组成的样本数目:N(N-1)(N-2)……(N-n+1)可能组成的样本数目:nN\n例如:从A、B、C、D四个单位中,抽出两个单位构成一个样本,问可能组成的样本数目是多少?重复抽样AAACADBABBBCBDABCACBCCCDDADBDCDDNn=42=16(个样本)不重复抽样N(N-1)(N-2)…….4×3=12(个样本)\n第二节抽样误差一、抽样误差的含义由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。\n二、影响抽样误差大小的因素1、总体各单位标志值的差异程度2、样本的单位数3、抽样方法4、抽样调查的组织形式\n三、抽样平均误差抽样平均误差是抽样平均数或抽样成数的标准差,反映了抽样指标与总体指标的平均误差程度。\n假设总体包含1、2、3、4、5,五个数字。则:总体平均数为x=1+2+3+4+55=3现在,采用重复抽样从中抽出两个,组成一个样本。可能组成的样本数目:25个。如:1+32=21+42=2.52+42=33+52=4\n多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平均误差是反映抽样误差一般水平的指标。\n抽样平均误差的计算公式抽样平均数的平均误差抽样成数平均误差(以上两个公式实际上就是第四章讲的标准差。但反映的是样本指标与总体指标的平均离差程度)实际上,利用上述两个公式是计算不出抽样平均误差的。想一想,为什么?\n抽样平均数平均误差的计算方法采用重复抽样:此公式说明,抽样平均误差与总体标准差成正比,与样本容量成反比。(当总体标准差未知时,可用样本标准差代替)(教材P180例题)通过例题可说明以下几点:①样本平均数的平均数等于总体平均数。②抽样平均数的标准差仅为总体标准差的③可通过调整样本单位数来控制抽样平均误差。\n例题:假定抽样单位数增加2倍、0.5倍时,抽样平均误差怎样变化?解:抽样单位数增加2倍,即为原来的3倍则:抽样单位数增加0.5倍,即为原来的1.5倍则:即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。\n采用不重复抽样:公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与总体单位数的多少有关。例题一:随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?\n例题一解:即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。例题二解:计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。已知:则:已知:则:n=100σ=10x=58N=2000n=400σ=300x=4800\n抽样成数平均误差的计算方法采用重复抽样:采用不重复抽样:例题三:某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?例题四:一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品率的抽样平均误差?\n例题三解:已知:则:样本成数即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。\n例题四解:已知:则:样本合格率计算结果表明:不重复抽样的平均误差小于重复抽样,但是“N”的数值越大,则两种方法计算的抽样平均误差就越接近。\n四、抽样极限误差含义:抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。计算方法:它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。=Δp│p-P│p-Δ≤P≤p+Δpp抽样平均数极限误差:抽样成数极限误差:≤≤\n五、抽样误差的概率度含义抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号“t”表示。公式表示:t=ΔμΔ=tμ(t是极限误差与抽样平均误差的比值)(极限误差是t倍的抽样平均误差)上式可变形为:\n第三节抽样估计的方法一、总体参数的点估计总体参数点估计的特点:P188总体参数优良估计的标准无偏性一致性有效性二、总体参数的区间估计区间估计三要素估计值抽样误差范围抽样估计的置信度总体参数区间估计的特点:P195\n什么是抽样估计的置信度?抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度(教材P191)符号表示:P(x-X≤Δ)x(教材P192例题)\n理论已经证明,在大样本的情况下,抽样平均数的分布接近于正态分布,分布特点是:抽样平均数以总体平均数为中心,两边完全对称分布,即抽样平均数的正误差与负误差的可能性是完全相等的。且抽样平均数愈接近总体平均数,出现的可能性愈大,概率愈大;反之,抽样平均数愈离开总体平均数,出现的可能性愈小,概率愈小,趋于0。(见下图)\n正态概率分布图Xx+1μx-1μ68.27%x+2μx-2μ95.45%由此可知,误差范围愈大,抽样估计的置信度愈高,但抽样估计的精确度愈低;反之,误差范围愈小,则抽样估计的置信度愈低,但抽样估计的精确度愈高。因为扩大或缩小以后的平均误差,就是极限误差:Δ=tμ所以,抽样平均误差的系数就是概率度t。数理统计已经证明,抽样误差的概率就是概率度的函数,二者对应的函数关系已编成“正态分布概率表”。(P485)\n三、总体参数区间估计的方法(一)根据给定的抽样误差范围,求概率保证程度分析步骤:1、抽取样本,计算抽样指标。2、根据给定的极限误差范围估计总体参数的上限和下限。3、计算概率度。4、查表求出概率F(t),并对总体参数作出区间估计。(例题:教材P197和P198)\n(二)根据给定的概率F(t),推算抽样极限误差的可能范围分析步骤:1、抽取样本,计算样本指标。2、根据给定的F(t)查表求得概率度t。3、根据概率度和抽样平均误差计算极限误差。4、计算被估计值的上、下限,对总体参数作出区间估计。(例题:教材P199)\n某农场进行小麦产量抽样调查,小麦播种总面积为1万亩,采用不重复简单随机抽样,从中抽选了100亩作为样本进行实割实测,测得样本平均亩产400斤,方差144斤。(1)以95.45%的可靠性推断该农场小麦平均亩产可能在多少斤之间?若概率保证程度不变,要求抽样允许误差不超过1斤,问至少应抽多少亩作为样本?例题一:\n例题一解题过程:已知:N=10000n=100问题一解:1、计算抽样平均误差2、计算抽样极限误差3、计算总体平均数的置信区间上限:下限:即:以95.45%的可靠性估计该农场小麦平均亩产量在397.62斤至402.38斤之间.\n问题二解:已知:则样本单位数:即:当至少应抽544.6亩作为样本。\n例题二:某纱厂某时期内生产了10万个单位的纱,按纯随机抽样方式抽取2000个单位检验,检验结果合格率为95%,废品率为5%,试以95%的把握程度,估计全部纱合格品率的区间范围及合格品数量的区间范围?已知:区间下限:区间上限:\n例题三:为调查农民生活状况,在某地区5000户农民中,按不重复简单随机抽样法,抽取400户进行调查,得知这400户中拥有彩色电视机的农户为87户。要求计算:1、以95%的把握程度估计该地区全部农户中拥有彩色电视机的农户在多大比例之间?2、若要求抽样允许误差不超过0.02,其它条件不变,问应抽多少户作为样本?\n例题三的问题一解:已知:N=5000N=4001、计算样本成数:2、计算抽样平均误差:\n即:以95%的把握程度估计该地区农户中拥有彩电的农户在17.87%至25.63%之间。4、计算总体P的置信区间:下限:上限:3、计算抽样极限误差:\n例题三的问题二解:当其他条件不变时:\n第四节抽样组织设计一、简单随机抽样1、含义:按随机原则直接从总体N个单位中抽取n个单位作为样本。2、样本单位数的计算方法:通过抽样极限误差公式计算必要的样本单位数。重复抽样:不重复抽样:抽样平均数抽样成数\n二、类型抽样三、等距抽样四、整群抽样先对总体各单位按主要标志加以分组,然后再从各组中按随机的原则抽选一定单位构成样本。先按某一标志对总体各单位进行排队,然后依一定顺序和间隔来抽取样本单位的一种组织形式。将总体各单位划分成许多群,然后从其中随机抽取部分群,对中选群的所有单位进行全面调查的抽样组织形式。\n本章作业\n一.判断题1、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。()×\n2、在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机变量。()√\n3、抽样成数的特点是:样本成数越大,则抽样平均误差越大。()×\n4、抽样平均误差总是小于抽样极限误差。()×\n5、在其它条件不变的情况下,提高抽样估计的可靠程度,则降低了抽样估计的精确程度。()√\n6、从全部总体单位中抽取部分单位构成样本,在样本变量相同的情况下,重复抽样构成的样本个数大于不重复抽样构成的样本个数。()√\n7、抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽样平均误差,也可能小于抽样平均误差。()√\n8、在抽样推断中,抽样误差的概率度越大,则抽样极限误差就越大于抽样平均误差。()√\n9、抽样估计的优良标准有三个:无偏性、可靠性和一致性。()×\n10、样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比。()×\n11、抽样推断的目的是,通过对部分单位的调查,来取得样本的各项指标。()×\n12、用来测量估计可靠程度的指标是抽样误差的概率度。()√\n13、总体参数区间估计必须具备三个要素即:估计值、抽样误差范围和抽样误差的概率度。()×\n二.单项选择题部分1:抽样平均误差是(A)。A、抽增指标的标准差B、总体参数的标准差C、样本变量的函数D、总体变量的函数\n2、抽样调查所必须遵循的基本原则是(B)。A、准确性原则B、随机性原则C、可靠性原则D、灵活性原则\n3、在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的(C)。A、2倍B、3倍C、4倍D、1/4倍\n4、按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是(A)。A、简单随机抽样B、类型抽样C、等距抽样D、整群抽样\n5、事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为(C)A、简单随机抽样B、类型抽样C、等距抽样D、整群抽样\n6、在一定的抽样平均误差条件下(A)。A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度\n8、反映样本指标与总体指标之间的平均误差程度的指标是(C)。A、平均数离差B、概率度C、抽样平均误差D、抽样极限误差\n9、以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,这一标准称为(A)。A、无偏性B、一致性C、有效性D、准确性\n10、在其它条件不变的情况下,提高估计的概率保证程度,其估计的精确程度(B)。A、随之扩大B、随之缩小C、保持不变D、无法确定\n11、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是(D)。A、简单随机抽样B、类型抽样C、等距抽样D、整群抽样\n12、抽样误差是指(C)。A、调查中所产生的登记性误差B、调查中所产生的系统性误差C、随机的代表性误差D、计算过程中产生的误差\n14、为了了解某工厂职工家庭收支情况,按该厂职工名册依次每50人抽取1人,对其家庭进行调查,这种调查属于(B)。A、简单随机抽样B、等距抽样C、类型抽样D、整群抽样\n15、抽样极限误差和抽样平均误差的数值之间的关系为(A)。A、抽样极限误差可以大于或小于抽样平均误差B、抽样极限误差一定大于抽样平均误差C、抽样极限误差一定小于抽样平均误差D、抽样极限误差一定等于抽样平均误差\n三.多项选择题1、抽样推断的特点是(ABCE)A、由推算认识总体的一种认识方法B、按随机原则抽取样板单位C、运用概率估计的方法D、可以计算,但不能控制抽样误差E、可以计算并控制抽样误差\n2、抽样估计中的抽样误差(ACE)A、是不可避免要产生的B、是可以通过改进调查方式来消除的C、是可以事先计算出来的D、只能在调查结束后才能计算的E、其大小是可能控制的\n3、从总体中抽取样本单位的具体方法有(BC)A、简单随机抽样B、重复抽样C、不重复抽样D、等距抽样E、非概率抽样\n4、抽样推断中,样本容量的多少取决于(ABCE)A、总体标准差的大小B、允许误差的大小C、抽样估计的把握程度D、总体参数的大小E、抽样方法和组织形式\n5、总体参数区间估计必须具备的三个要素是(BDBDE)A、样本单位数B、样本指标C、全及指标D、抽样误差范围E、抽样估计的置信度\n6、用抽样指标估计总体指标,所谓优良估计的标准有(BCD)A、客观性B、无偏性C、一致性D、有效性E、优良性\n7、在抽样平均误差一定的条件下(AD)A、扩大极限误差,可以提高推断的可靠程度B、缩小极限误差,可以提高推断的可靠程度C、扩大极限误差,只能降低推断的可靠程度D、缩小极限误差,只能降低推断的可靠程度E、扩大或缩小极限误差与推断的可靠程度无关\n四.填空题部分1、抽样推断的主要内容有(参数估计)和(假设检验)两个方面。\n2、总体是非标志(0,1)分布的平均数为(成数P),其方差为(P(1-P)或PQ)。\n3、从全及总体中随机抽取样本的办法有(重复抽样)和(不重复抽样)两种。\n4、重复抽样平均误差的大小与(样本单位数)成反比例关系,又与(标准差)成正比例关系。\n5、抽样极限误差等于(抽样平均误差)与(概率度)的乘积。\n6、总体参数估计有(点估计)和(区间估计)两种方法。\n7、抽样误差范围决定估计的(准确性),而概率保证程度决定估计的(可靠性)。\n问答题:1、统计抽样推断具有哪些特点?2、抽样推断中,参数和统计量之间有何区别?3、什么是抽样误差?影响其大小的因素主要有哪些?\n六.计算题部分1、对一批成品按重复抽样方法抽选100件,其中废品4件,当概率为95.45%(t=2)时,可否认为这批产品的废品率不超过6%?\n2、某乡有5000农户,按随机原则重复抽取100户调查,得平均每户年纯收入12000元,标准差2000元。要求:(1)以95%的概率(t=1.96)估计全乡平均每户年纯收入的区间。(2)以同样概率估计全乡农户年纯收入总额的区间范围。\n3.某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,标准差300小时,试在95.45%(t=2)概率保证下,估计这种新电子元件平均寿命区间。\n4、从某年级学生中按简单随机抽样方式抽取50名学生,对邓小平理论课的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%的概率保证程度推断全年级学生考试成绩的区间范围。如果其它条件不变,将允许误差缩小一半,应抽取多少名学生?

相关文档