统计学(抽样推断) 54页

  • 469.50 KB
  • 2022-08-13 发布

统计学(抽样推断)

  • 54页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
统计学原理 抽样推断1\n第四章第一节第一节抽样调查的意义一、抽样调查的概念广义抽样调查:凡是抽取一部分单位进行观察,并根据观察结果来推断全体的都是抽样调查,可分为随机抽样和非随机抽样两种。狭义的抽样调查:仅指根据大数定律和概率论的要求,随机抽样,保证总体中各个单位都有同样的机会被抽中。概念:按照随机抽样的原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。2\n第四章第一节二、抽样调查的特点按随机原则抽取调查单位;要抽取足够多的调查单位;可从数量上推断总体要运用概率估计的方法抽样调查中所产生的抽样误差可以事先计算并加以控制。基本原则基本目的及任务科学性体现3\n第四章第一节三、抽样调查的使用范围有些事情在测量或实验时有破坏性,不可能进行全面调查有些总体从理论上讲可以进行全面调查,但是实际上办不到和全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活在有些情况下,抽样调查的结果比全面调查要准确用抽样调查的资料修正和补充全面调查资料抽样调查方法可以用于工业生产过程中的质量控制利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍4\n第四章第一节四、抽样估计的一般步骤1、设计抽样方案2、抽取样本单位3、搜集样本资料4、整理样本资料5、推断总体指标5\n第四章第二节第二节调样调查的基本概念及理论依据一、全及总体和抽样总体(教材没有)全及总体-简称总体(N):研究对象的全体(唯一确定)变量总体:各单位可用数量标志计量A有限总体:变量值有限B无限总体:变量值无限,分为可列或连续属性总体:各单位用品质标志描述6\n第四章第二节抽样总体,简称样本(n):将从总体中抽取的部分单位称为样本大样本:样本数达到或超过30小样本:样本数在30以下注意:对于全及总体单位数N来说,样本n是一个很小的数,它可以是N的几十分之一,几百分之一、几千分之一、几万分之一。7\n第四章第二节二、全及指标和抽样指标全及指标(总体指标)定义:根据全及总体各个单位的标志值或标志特征计算的,反映总体某种属性的综合指标,称为全及指标(总体指标)。8\n第四章第二节全及指标的运用及计算变量总体的平均数:属性总体:计算结构相对指标,即总体成数,用P表示,表明总体中具有某一属性的单位数占总体单位数的比重。设总体中有N个单位,有N1个单位具有某种属性,N0个单位不具有某种属性,N1+N0=N,P为总体中具有某种属性的单位数所占的比重,Q为不具有某种属性的单位数所占的比重,则总体成数为:9\n第四章第二节属性总体的平均数——成数属性总体的平均数变量值X频数F频率F/∑F具有某一属性不具有某一属性10N1N0P=N1/N1-P=N0/N合计——N110\n第四章第二节变量总体标准差和总体方差,它们都是测量总体标志值分散程度的指标注意:总体的参数是一个确定的值11\n第四章第二节属性总体的方差和标准差注意:总体的统计量是一个确定的值12\n第四章第二节抽样指标——样本统计量定义:由抽样总体各个标志值或标志特征计算的综合指标称为抽样指标抽样指标的运用及计算变量总体:属性总体:设样本中有n个单位,有n1个单位具有某种属性,n0个单位不具有某种属性,n1+n0=n,p为总体中具有某种属性的单位数所占的比重,q为不具有某种属性的单位数所占的比重,则抽样成数为:13\n第四章第二节属性样本的平均数——成数属性样本的平均数变量值x频数f频率f/∑f具有某一属性不具有某一属性10n1n0p=n1/n1-p=n0/n合计——n114\n第四章第二节样本标准差和样本方差,它们都是测量样本标志值分散程度的指标注意:样本统计量不含未知参数,它是随样本不同而不同的随机变量(见教材34页)15\n第四章第二节属性样本的方差和标准差注意:样本统计量不含未知参数,它是随样本不同而不同的随机变量16\n第四章第二节统计抽样过程根据样本的平均数、成数(也称比率)来推断总体的平均数,成数或所在的范围,只要总体的平均数或成数掌握了,那么总体的标志总量也就可以推断出来。总体N样本n(抽取方式方法)计算抽样指标推断总量指标(抽样估计)(计算抽样误差)17\n第四章第二节三、抽样方法和样本的可能数目样本的容量(n)样本的可能数目抽样的方法取样方式:重复、不重复抽样的方法对样本的要求:考虑顺序、不考虑顺序18\n第四章第二节考虑顺序的不重复抽样数目考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的重复抽样数目19\n第四章第二节四、抽样调查的理论依据大数法则:随着抽样单位数n的增加,抽样平均数有接近总体平均数的趋势,几乎具有实际的必然性。中心极限定理:如果总体变量存在有限的平均数和方差,则不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋于正态分布。20\n五、抽样分布(教材98页)概念——由样本n个观察值计算的统计量的概率分布。抽样分布的形式样本比率的抽样分布样本方差的抽样分布21\n样本统计量样本均值样本比率p样本方差s2正态总体或非正态总体大样本非正态总体(小样本)正态分布t分布大样本正态分布分布22\n第四章第三节第三节抽样平均误差(样本平均数的方差与标准差)一、抽样误差的概念是指样本指标和总体指标之间数量上的差别。统计调查误差登记性误差代表性误差系统误差(偏差)随机性误差23\n第四章第三节随机误差实际误差平均误差(指一个样本指标与总体指标之间的差别)(指所有可能出现的样本指标的标准差,即所有实际误差的平均值)24\n第四章第三节二、抽样平均误差的意义抽样误差是一个随机变量;抽样误差是反映抽样指标对全及指标代表性程度;不能用一次抽样得到的抽样误差来衡量抽样指标对于全及指标的代表性大小;抽样平均误差概括地反映了所有可能抽样指标与全及指标之间的误差的一般水平。因此:抽样平均误差是实际可以运用于衡量抽样指标对于全及指标代表性程度的一个尺度;也是计算抽样指标与全及指标之间变异范围的一个根据。25\n第四章第三节三、抽样平均误差的计算(p103)1、原理公式:2、运用公式A平均数的抽样平均误差B成数的抽样平均误差26\n第四章第三节注意:在上述公式中,或总体标准差,但是实际中这两个数据却是未知的。计算抽样平均误差时通常采用以下替代方法。1、用样本标准差替代总体标准差。大样本情况下,可以直接用样本标准差S代表代表总体标准差;在小样本的情况下,则采用样本修正标准差来代替。2、用以前(近期)的总体标准差或同类地区的总体标准差来代表所研究的标准差。若同时有多个可供参考的数值时,应选择其中最大者。对于成数P,应选最接近0.5的比率。27\n第四章第三节四、影响抽样平均误差的因素1、全及总体标志的变动程度全及总体标志变动程度越大,抽样平均误差就越大;反之,全及总体标志变动程度越小,则抽样平均误差越小。两者成正比关系的变化。2、抽样单位数的多少在其他条件不变的情况下,抽取的单位数越多,抽样平均误差越小;样本单位数越少,抽样平均误差越大。抽样平均误差的大小和样本单位数成相反关系的变化。4、抽样方法(重复或者不重复)3、抽样的组织方式28\n第四章第三节例题:①某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200只,分别计算抽样平均误差。②该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平均误差。29\n第五章第三节例题:某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,所得资料如下表:按照质量规定,电灯泡使用寿命在1000小时以上的为合格品,计算灯泡使用时间抽样平均误差和灯泡合格率的抽样平均误差?使用时间(小时)抽样检查电灯泡数(个)使用时间(小时)抽样检查电灯泡数(个)900以下900~950950~10001000~10502411711050~11001100~11501150~12001200以上841873合计20030\n第四章第四节第四节全及指标的推断一、抽样推断要求(教材126页)1、无偏性2、一致性3、有效性31\n第四章第四节二、抽样推断的方法(一)点估计也叫定值估计(或直接估计),就是把样本平均数或样本成数直接作为总体平均数或总体成数的估计值。(二)区间估计1、区间估计的意义在一定概率的保证下,用样本指标去推断总体指标,在考虑抽样误差的前提下,使得总体指标落到某一范围之内,即根据抽样指标定出置信区间和置信度。32\n第四章第四节2、抽样极限误差概念:抽样极限误差是指总体指标和抽样指标之间误差的可能范围。(1)抽样平均数的抽样极限误差(2)抽样成数的抽样极限误差33\n第四章第四节总体范围的估计若有了抽样极限误差,则总体平均数和总体成数的可能范围可以用下式估计:(1)抽样平均数的范围(2)抽样成数的极限误差34\n第四章第四节例:要估计一批产品的合格率,从1000件产品中抽取200件,其中有10件不合格品,如果确定抽样极限误差的范围为2%,试估计产品合格率的范围。样本成数p=190/200=95%总体成数下限=95%-2%=93%总体成数上限=95+2%=97%即该产品合格率在93%~97%之间。35\n第四章第四节抽样极限误差与抽样平均误差的关系抽样极限误差通常用抽样平均误差的倍数表示,即t称为概率度。或或36\n第五章第四节3、可信程度可信程度是表示估计的可靠程度如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t决定的。因而可靠程度与t之间有一定正比关系。概率度t与概率保证程度(可靠程度)之间的关系见下表。例:若概率为0.95,查表得t=1.96概率度t误差范围()概率F(t)概率度t误差范围()概率F(t)0.51.001.500.51.001.500.38290.68270.86641.962.003.001.962.003.000.95000.95450.997337\n38\n第四章第四节三、抽样推断抽样推断的步骤如下:⒈计算抽样平均误差⒉给定概率保证程度,查表得概率度t⒊计算抽样极限误差⒋估计总体指标区间39\n第四章第四节接前面灯泡例题:灯泡样本平均使用时间为1057小时,合格率为91.5%,重复抽样下,灯泡的使用时间抽样平均误差为小时,合格率的平均误差为,计算在不同概率保证下,平均数和成数的抽样极限误差?当t=1?当t=2?当t=3?40\n第四章第五节第五节抽样方案设计一、抽样方案设计的基本原则保证实现抽样随机性的原则(保证消除代表性误差中的偏差)保证实现最大的抽样效果原则41\n注意:调查费用取决很多因素,其中最重要的是抽样单位数目,要确定适当的抽样单位数目,取决于抽样的精度和可靠性的要求;精度是指希望估计区间的长度越短越好,可靠性是指估计区间包含参数的概率越大越好;在样本容量确定的条件下二者是矛盾的,因此抽样设计的原则是在一定的误差和可靠性的要求下选择费用最少的样本设计。第四章第五节42\n第四章第五节二、简单随机抽样(既不分组也不排队)简单随机抽样又称纯随机抽样,是按照随机的原则直接从N个总体单位中抽取n个单位作为样本。注意:简单随机抽样最符合随机原则直接抽选法抽签法随机数码表法43\n第四章第五节三、类型抽样(分层抽样)类型抽样又称分类抽样,是先对总体各单位按一定标志加以分类,然后再从各类中按随机原则抽取样本,由各类内的样本组成一个总样本。将总体N分成N1、N2、Nm,从N1中抽取n1个单位、N2中抽取n2个单位、Nm中抽取nm个单位组成样本。总体单位数N=N1+N2+…Nm样本单位数n=n1+n2+…nm注意:在类型抽样的情况下,因为从各类型组都抽取了样本单位,所以,对各类型组来说是全面调查,因此,组间方差是可以不考虑的。影响抽样误差的总方差是组内方差。44\n第四章第五节四、机械抽样机械抽样又称等距抽样,它是对总体按一定的顺序排列,每隔一定的间隔抽取一个或若干个单位,并把这些单位组成样本的一种抽样方法。等距抽样按排队的标志不同,分为无关标志排队和有关标志排队的等距抽样。随机起点等距抽样半距起点等距抽样对称等距抽样45\n第四章第五节五、整群抽样整群抽样是将总体划分为由总体单位的组成的若干群,然后以群为抽样单位,抽取若干群作为样本,对群内所有单位进行全面调查的抽样方法。影响整群抽样误差大小的是群间方差。46\n第四章第五节六、多阶段抽样在抽样调查抽选样本时并不是一次直接从总体中抽取,而是分成两个或者两个以上的阶段来进行。多阶段抽样的前几个阶段类似整群抽样两阶段抽样和类型抽样、整群抽样的联系47\n第四章第六节第六节必要抽样单位数的确定(p142-144)一、确定抽样单位数的意义和原则在选定了抽样方式后,必须确定样本容量n。n的大小同抽样推断的效果成正比,同抽样组织需要耗费的人力、物力、财力等也成正比。在组织抽样调查的时候,需要在确保抽样推断的可靠程度和精确程度的要求下,力求抽样组织工作更简单。48\n第四章第六节二、确定抽样单位数的依据总体各单位标志变异程度:即总体方差或p(1-p)的大小。总体标志变异程度大,要求样本容量大一些;反之,总体标志变异程度小,样本容量可以小些。允许的极限误差或的大小:允许的极限误差越大,样本容量越小;反之,极限误差越小,样本容量越大抽样方法:在其它条件相同的情况下,重置抽样比不重置抽样要抽取多一些样本单位。抽样方式:采用类型抽样的样本容量要小于简单随机抽样的样本容量。49\n第四章第六节三、确定抽样单位数的计算公式(只要求掌握简单随机抽样)简单随机重复抽样平均指标的必要抽样单位数公式简单随机不重复抽样平均指标的必要抽样单位数公式50\n第四章第六节简单随机重复抽样成数的必要抽样单位数公式简单随机不重复抽样成数的必要抽样单位数公式51\n第四章第六节注意:公式的运用要求事先取得全及总体的标准差或,这往往无法知道,所以一般用抽样指标的标准差或来代替。如果缺少成数资料,可以直接假定P=0.5来计算,这样P(1-P)取得最大值为0.25在同一个抽样调查中,如果既需要推断全及平均数,也需要推断全及成数,依据成数和平均数计算出来的必要抽样单位数不一致的时候,取较大的n作为统一的抽样单位数。52\n第四章第六节例题:详见教材143页例6.19、6.20做题时,如果没有指出时重复抽样还是不重复抽样,需要计算两种情况下的抽样单位数。注意,不重复抽样单位数一定比重复抽样单位数要小。53\n第四章第六节本章结束!54

相关文档