• 3.99 MB
  • 2022-09-01 发布

《统计学抽样分析》PPT课件

  • 146页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
抽样估计的现实应用例1一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。120个样本测试平均里程:36,500公里推断新轮胎平均寿命:36,500公里400个样本支持人数:160推断支持该候选人的选民占全部选民的比例:160/400=40%例2:某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众占全部登记投票人总数的比例。由于时间及财力的限制:\n本章要求:教学目的:本章阐述参数估计的理论与方法,通过学习使学生能运用不同的抽样方式对总体参数进行估计及进行假设检验。教学重点及难点:教学重点:抽样误差的计算;简单随机抽样下总体参数的区间估计及简单随机抽样下样本单位数的计算;假设检验。教学难点:抽样平均误差的计算,参数的区间估计。主要教学内容及要求:1、了解抽样方案设计的主要内容和抽样方案的检验;了解抽样分布的概念和定理;2、理解抽样法的意义、特点;3、掌握抽样误差、抽样平均差和抽样极限误差等概念的涵义;掌握影响抽样误差大小的因素;掌握确定必要样本单位数目的方法;掌握统计假设检验。4、熟练掌握抽样推断中的基本原理和方法,能够利用样本资料推断总体指标。5、能运用excel计算有关样本统计量,进行总体参数的区间估计。第六章抽样调查\n第六章抽样调查★第一节抽样调查的意义第二节抽样调查的基本概念及理论的依据第三节抽样平均误差第四节全及指标的推断第五节抽样方案的设计第六节必要样本数的确定第七节假设检验\n第一节抽样估计的意义一、抽样估计的定义二、抽样估计的特点三、抽样估计的运用四、抽样估计的一般步骤★\n指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会抽样估计按照随机原则从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法\n统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)抽样估计\n并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样总体随机样本非随机样本与总体分布特征相同与总体分布特征不同\n按随机原则抽取样本单位目的是推断总体的数量特征抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制抽样估计的特点\n不可能进行全面调查时不必要进行全面调查时来不及进行全面调查时对全面调查资料进行补充修正时抽样估计的适用范围\n设计抽样方案抽取样本单位收集样本数据计算样本统计量推断总体参数抽样估计的一般步骤\n第二节抽样调查的基本概念及理论依据一、全及总体和抽样总体二、全及指标和抽样指标三、抽样方法和样本的可能数目四、抽样调查的理论依据★\n全及总体研究对象的全体,即第一章中学过的总体。抽样总体按随机原则从全及总体中抽取一部分单位组成的集合体,又叫抽样总体。样本总体中所包括的单位数叫样本容量,一般用n表示1、大样本(n≥302、小样本(n≤30)全及总体中所包括的单位数一般用N表示。1、有限总体2、无限总体\n设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则⒈总体平均数(又叫总体均值):指被估计的总体指标,又被称为总体参数全及指标\n⒉总体标准差:⒊总体方差:\n⒋总体成数:⒌总体是非标志的标准差:⒍总体是非标志的方差:\n设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则⒈样本平均数(又叫样本均值):指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量样本指标\n⒉样本单位标志值的标准差:⒊样本单位标志值的方差:为自由度为的无偏估计为的无偏估计\n⒋样本成数:⒌样本单位是非标志的标准差:⒍样本单位是非标志的方差:为的无偏估计为的无偏估计\n当样本容量很大时,1/n,与1/(n-1)相差不大,样本方差的分式,可以直接除以n,与总本的方差计算分式保持一致。\n例3:某大公司人事部经理整理其2500个中层干部的档案。其中一项内容是考察这些中层干部的平均年薪及参加过公司培训计划的比例。总体:2500名中层干部如果:上述情况可由每个人的个人档案中得知,可容易地测出这2500名中层干部的平均年薪及标准差。假如:1:已经得到了如下的结果:总体均值:=51800总体标准差:=4000\n参数是总体的数值特征上述总体均值、总体标准差、比例均称为总体的参数2、同时,有1500人参加了公司培训,则参加公司培训计划的比例为:P=1500/2500=0.60如:例3中的中层干部平均年薪,年薪标准差及受培训人数所占比例均为该公司中层干部这一总体的参数。●抽样估计就是要通过样本而非总体来估计总体参数。\n假如随机抽取了一个容量为30的样本:工资是否参加培训49094.3Yes53263.9Yes49643.5Yes……假如根据该样本求得的年薪样本平均数、标准差及参加过培训计划人数的比例分别为:\n抽样方法重复抽样又被称作重置抽样、有放回抽样继续抽取抽出个体登记特征放回总体特点同一总体单位有可能被重复抽中,而且每次抽取都是独立进行\n不重复抽样又被称作不重置抽样、不放回抽样抽出个体登记特征继续抽取特点同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。抽样方法\n对样本的要求不同考虑顺序的抽样AB≠BA不考虑顺序的抽样AB=BA两种分类交叉考虑顺序的重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的不重复抽样\n例:从A、B、C、D四个工人中随机抽取二人组成一样本,可能的样本是:考虑顺序的重复抽样考虑顺序的不重复抽样AAABACADAAABACADBABBBCBDBABBBCBDCACBCCCDCACBCCCDDADBDCDDDADBDCDD不考虑顺序的重复抽样不考虑顺序的不重复抽样AAABACADAAABACADBABBBCBDBABBBCBDCACBCCCDCACBCCCDDADBDCDDDADBDCDD\n第八章抽样推断★§1.1抽样方案的设计§1.2简单随机抽样的抽样误差的测定§1.3简单随机抽样的抽样估计★\n一、抽样误差的概念二、抽样平均误差三、抽样极限误差第三节抽样平均误差\n说明对于任何一个样本,其抽样误差都不可能测量出来抽样误差的大小可以依据概率分布理论加以说明指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差抽样误差\n某个样本容量的抽样分布更大样本容量的抽样分布\n抽样平均误差根据所有可能样本的样平均数或样本成数计算的标准差,即每一次抽样的样本指标和总体指标之间的平均差异程度。即样本估计量的标准差式中:为样本平均数的抽样平均误差;为可能的样本数目;为第个可能样本的平均数;为总体平均数注意:不要混淆抽样平均误差与样本标准差!\n例:有4个工人,月产量分别为40,50,70,80,这一总体平均数和标准差为:总体平均数标准差\n现用重复抽样的方法从4人中抽取2人构成样本,求样本的平均数,用以代表4人总体的平均水平,所有可能的样本及样本的平均工资列表如下:序号样本变量样本平均数平均数离差离差平方(1)(2)1404040-204002405045-152253407055-5254408060005504045-152256505050-1010075070600085080655259704055-52510705060001170707010100127080751522513804060001480506552515807075152251680808020400合计-----960---2000\n样本平均数的平均数:抽样平均误差\n抽样平均误差的计算公式⒈样本平均数的抽样平均误差当N≥500时,有重复抽样时:不重复抽样时:\n⒉样本成数的抽样平均误差重复抽样时:不重复抽样时:当N≥500时,有抽样平均误差的计算公式\n关于总体方差的估计方法用过去同类问题全面调查或抽样调查的经验数据代替;用样本标准差代替总体标准差,用代替。抽样平均误差的计算公式\n影响抽样误差的因素总体各单位的差异程度(即标准差的大小):越大,抽样误差越大;样本单位数的多少:越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。\n练习1、对某乡进行简单重复抽样调查,抽出100个农户,户均年收入2000元,年收入标准差100元,求抽样平均误差。若抽取的是200户,则抽样平均误差以是多少。若要使抽样平均误差降低为原来的一半,则应抽多少户。2、对某县人口用不重复抽样方法按1/10比例抽出1万人进行调查,得知样本平均年龄40岁,年龄标准差20岁,求抽样平均误差。3、某县人口10万人,用简单随机不重复抽样方法抽取1/10的人口进行调查,得知男性人口比重为51%,求男性人口比重的抽样平均误差。4、对某乡进行简单随机重复抽样调查,抽出100个农户进行调查,得知年收入在1800元以上的占95%,求农户年收入在1800元以上比重的抽样平均误差。\n抽样极限误差指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围,也称作允许误差、误差范围、误差置信限等▼注意:1、统计学上往往用抽样极限误差来测度抽样误差的大小或者说测度点估计的精度。原因:总体参数值往往并不知道,因此,实际抽样误差与抽样平均误差也往往无法求出,但在抽样分布大体知道的情况下,抽样极限误差是可以估计出来的。\n2、抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。原因:样本统计量往往是一随机变量,它与总体参数真值之差也是一个随机变量,因此就不能期望某次抽样的样本估计值落在一定区间内是一个必然事件,而只能给予一定的概率保证。因此,在进行抽样估计时,既需要考虑抽样误差的可能范围,同时还需考虑落到这一范围的概率大小。前者是估计的准确度问题,后者是估计的可靠性问题,两者紧密联系不可分开。这也正是区间估计所关心的主要问题。\n平均产量的分布如下:样本平均数404550556065707580频数121242121频率1/162/161/162/164/162/161/162/161/16\n实际计算中一般不直接计算概率保证程度,由于,样本平均数的极限误差:⒈样本成数的极限误差:⒉所以抽样极限误差是概率度t的函数t为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。\n据中心极限定理,当总体为正态或总体非正态但n≥30时,样本均值的分布趋近于正态分布;当n足够大时,样本成数的分布近似为正态分布。令\n平均数的抽样分布全部可能样本平均数的均值等于总体均值,即:从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样本均值的标准差为总体标准差的\n成数的抽样分布全部可能样本成数的均值等于总体比率,即:从非正态总体中抽取的样本成数,当n足够大时其分布接近正态分布。从正态总体中抽取的样本成数,不论容量大小其分布均为正态分布。样本成数的标准差为总体标准差的\n样本抽样分布原总体分布\n\nt与相应的概率保证程度存在一一对应关系,常用t值及相应的概率保证程度为:t值 概率保证程度1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973在实际中,一般将这种对应函数关系编成《正态概率表》供直接查用(大样本条件下)\n68.27%95.45%99.73%\n估计的准确度和估计的可靠性问题由于提高把握程度,会增大允许误差,使估计精度降低,而缩小允许误差,提高估计的精度,又会降低估计的把握程度,所以在实际中应根据具体情况,先确定一个合理的把握程度再求相应的允许误差或先确定一个允许误差范围再求相应的把握程度。\n抽样估计量的优良标准设 为待估计的总体参数,为样本统计量,则 的优良标准为:若     ,则称 为 的无偏估计量指样本指标的均值应等于被估计的总体指标无偏性第四节全及指标的推断\n若    ,则称 为比 更有效的估计量作为优良的估计量,除了满足无偏性的要求外,其方差应比较小有效性指随着样本单位数的增大,样本估计量将在概率意义下越来越接近于总体真实值一致性抽样估计量的优良标准若对于任意ε>0,有\n为 的无偏、有效、一致估计量;为 的无偏、有效、一致估计量;为 的无偏、有效、一致估计量。数理统计证明:抽样估计量的优良标准\n点估计指直接以样本指标来估计总体指标,也叫定值估计简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况\n区间估计指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限与上限所包括的区间称为置信区间,估计的可靠程度也称为置信度。(这里只讨论常用的大样本的情况)\n区间估计原理0.6827落在   范围内的概率为68.27%样本抽样分布曲线原总体分布曲线\n区间估计原理0.9545落在   范围内的概率为95.45%样本抽样分布曲线原总体分布曲线\n区间估计原理0.9973落在   范围内的概率为99.73%样本抽样分布曲线总体分布曲线\n总体平均数的区间估计表达式其中,为极限误差\n步骤⒈计算样本平均数;⒉搜集总体方差的经验数据;或计算样本标准差,总体平均数的区间估计⒊计算抽样平均误差:重复抽样时不重复抽样时:\n步骤⒋计算抽样极限误差:⒌确定总体平均数的置信区间:总体平均数的区间估计\n总体成数的区间估计表达式其中,为极限误差\n步骤⒈计算样本成数;⒉搜集总体方差的经验数据;⒊计算抽样平均误差:重复抽样条件下不重复抽样条件下总体成数的区间估计\n步骤⒋计算抽样极限误差:⒌确定总体成数的置信区间:总体成数的区间估计\n1、按照质量要求,灯泡使用寿命在1000小时以上为合格品试,以95.45%的概率保证度估计该批灯泡的耐用时数和合格率;2、试以99%的概率保证程度估计计该批灯泡的而用时数和合格率。使用时间(小时)灯泡数(个)900以下2900-9504950-1000111000-1050711050-1100841100-1150181150-120071200以上3合计200例:某灯泡厂对10000个产品进行使用寿命检验,随机不重复抽取2%的样本进行测试。所得资料如下:\n使用时间(小时)组中值灯泡数(个)900以下8752175066248900-9509254370069696950-10009751110725739641000-105010257172775727041050-110010758490300272161100-115011251820250832321150-1200117578225974681200以上12253367584672合计200211400575200\n\n因此,该批灯泡的使用寿命在1049.49-1064.51之间,其概率保证度为95.45%\n使用时间(小时)灯泡数(个)f900以下2900-9504950-1000111000-1050711050-1100841100-1150181150-120071200以上3合计200\n因此,该批灯泡的合格率在87.6%-95.4%之间,其概率保证度为95.45%\n1、若允许的误差范围为10小时,试估计该批灯泡的耐用时数;2、按照质量要求,灯泡使用寿命在1000小时以上为合格品,要求合格率误差不超过3%,试估计该批灯泡的合格率。使用时间(小时)灯泡数(个)900以下2900-9504950-1000111000-1050711050-1100841100-1150181150-120071200以上3合计200例:某灯泡厂对10000个产品进行使用寿命检验,随机重复抽取2%的样本进行测试。所得资料如下:\n使用时间(小时)组中值灯泡数(个)900以下8752175066248900-9509254370069696950-10009751110725739641000-105010257172775727041050-110010758490300272161100-115011251820250832321150-1200117578225974681200以上12253367584672合计200211400575200\n\n因此,该批灯泡的使用寿命在1047-1067之间,其概率保证度为99.17%\n使用时间(小时)灯泡数(个)f900以下2900-9504950-1000111000-1050711050-1100841100-1150181150-120071200以上3合计200\n因此,该批灯泡的合格率在88.5%-94.5%之间,其概率保证度为87.15%\n作业:某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求:1、在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。2、若工人日产量在118件以上者为完成生产定额任务,要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。\n按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合计—100100名工人的日产量分组资料\n按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计—100126004144100名工人的日产量分组资料\n解:\n则该企业工人人均产量及日总产量的置信区间为:即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95﹪。\n按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合计—100100名工人的日产量分组资料完成定额的人数\n解:\n则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:即该企业工人中完成定额的工人比重在0.8432至0.9568之间,完成定额的工人总数在843.2至956.8人之间,估计的可靠程度为95﹪。\n样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本容量调查精度高但费用较大找出在规定误差范围内的最小样本容量确定样本容量的意义找出在限定费用范围内的最大样本容量\n确定方法推断总体平均数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。或S通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的S。计算结果通常向上进位\n⑵不重复抽样条件下:确定方法推断总体平均数所需的样本容量\n【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45﹪的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?\n解:\n确定方法推断总体成数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。计算结果通常向上进位通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的;③取方差的最大值0.25。\n⑵不重复抽样条件下:确定方法推断总体成数所需的样本容量\n【例B】某企业对一批总数为5000件的产品进行质量检查,过去几次同类调查所得的产品合格率为93﹪、95﹪、96﹪,为了使合格率的允许误差不超过3﹪,在99.73﹪的概率保证程度下,应抽查多少件产品?【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其中方差最大者,即P=93﹪。\n解:\n必要样本容量的影响因素总体方差的大小;允许误差范围的大小;概率保证程度;抽样方法;抽样的组织方式。重复抽样条件下:不重复抽样条件下:\n抽样复查的方法其全面调查时的登记结果为2.2861亿元其抽样复查的结果为2.1734亿元随机抽取五个下属单位修正系数为则:该企业集团所拥有的固定资产原值应为16.851×0.9507=16.020(亿元)所拥有固定资产原值的普查结果为16.851亿元某企业集团总体\n第五节抽样方案的设计一、抽样方案设计的基本准则二、抽样方案设计的主要内容★\n㈠随机原则——抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位㈡抽样误差最小——在其他条件相同的情况下,选抽样误差最小的方案㈢费用最少——在其他条件相同的情况下,选费用最少的方案设计抽样方案时,通常是在误差达到一定要求的条件下,选择费用最少的方案抽样方案设计的基本准则\n第五节抽样方案的设计一、抽样方案设计的基本准则二、抽样方案设计的主要内容★★\n抽样框指包括全部抽样单位的名单框架,仅对有限总体而言主要形式名单抽样框区域抽样框时间表抽样框编制抽样框\n确定抽样方法重复抽样又被称作重置抽样、有放回抽样不重复抽样又被称作不重置抽样、不放回抽样\n确定抽样组织方式1·简单随机抽样(纯随机抽样)——对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本应用仅适用于规模不大、内部各单位标志值差异较小的总体是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式\n2·类型抽样(分层抽样)——将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。总体N样本n等额抽取等比例抽取······能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标确定抽样组织方式\n类型抽样的抽样平均误差\n\n某农场种小麦12000公顷,其中平原3600公顷,丘陵6000公顷,山地2400公顷,现用类型抽样法调查1200公顷,以各种麦田占全农场面积的比重分配抽样面积数量。麦田类型抽样的平均误差计算表类型全场播种面积(公顷)抽样调查面积(公顷)单位面积产量不均匀程度指标(千克)符号Niniσi丘陵地区6000600750337500000平原地区3600360840254016000山地24002401000240000000合计120001200-831516000例\n\n高产麦田比重的平均误差计算表类别高产田比重(%)非高产田比重(%)麦田不均匀程度指标(%)抽样调查面积(公顷)pi(1-pi)ni符号pi1-pipi(1-pi)ni丘陵80201660096.0平原9010936032.4山地60402424057.6合计---1200186\n3·等距抽样(机械抽样或系统抽样)——将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。······随机起点半距起点对称起点(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。确定抽样组织方式\n1.若按无关标志排队公式用以上纯随机抽样的公式,一般采用不重复抽样公式:机械抽样(等距抽样)的抽样平均误差\n2.若按有关标志排队公式用类型抽样的公式:\n4·整群抽样(集团抽样)——将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差确定抽样组织方式\n整群抽样的抽样平均误差整群抽样的抽样平均误差受三个因素影响:(1)抽出的群数(r)多少(反比关系)(2)群间方差()(正比关系)\n计算方法如下:\n(3)抽样方法\n假如某一机器大量生产某一种零件,现每隔一小时抽取5分钟产品进行检验,用以检查产品的合格率,检查结果如下:合格率群数rpipir80%20.801.6-0.09960.0198485%40.853.4-0.04960.0098490%120.9010.80.0004…(太小不计)95%30.952.850.05040.0076298%30.982.940.08040.01939合计24-21.59-0.05669例\n以上抽样平均误差的公式归纳如下:\n5·多阶段抽样——指分两个或两个以上的阶段来完成抽取样本单位的过程例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)确定抽样组织方式\n调查对象的性质特点对调查对象的了解程度(抽样框的特点)抽样误差的大小人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组织方式主要应考虑:确定抽样组织方式\n确定样本容量n≥30,为大样本;n<30,为小样本样本容量指样本中含有的总体单位的数目,通常用n来表示。确定适当样本容量的意义:若n过大,调查工作量增大,体现不出抽样调查的优越性;若n过小,抽样误差会增大,抽样推断就会失去价值。\n(一)简单随机抽样必要抽样数目的计算公式\n(二)类型抽样\n(三)整群抽样\n等距抽样的抽样数目,在有总体差异程度和比重的全面资料时,可采用类型抽样的公式;没有总体的全面资料时,可采用简单随机抽样的公式。\n建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料σ=1.5,求样本数应是多少?例1\n某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?例2\n第六节假设检验一、假设检验的意义所谓假设检验,就是对某一总体参数先作出假设的数值;然后搜集样本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,进一步判断两者差异是否显著,若两者差异很小,则假设的参数是可信的,作出“接受”的结论,若两者的差异很大,则假设的参数准确的可能性很小,作出“拒绝”的结论。\n某厂生产一批产品,必须检验合格才能出厂,规定合格率为95%,现从中抽取100件进行质量检查,发现合格率为93%,假设检验就是利用样本指标p=93%的合格率,来判断原来假设P=95%合格率是否成立。如假设成立,产品就能出厂,如假设不成立,这批产品便不能出厂。例1\n某地区去年职工家庭年收入为72000元,本年抽样调查结果表明,职工家庭年收入为71000元,这是否意味着职工生活水平下降呢?我们还不能下这个结论,最好通过假设检验,检验这两年职工家庭收入是否存在显著性统计差异,才能判断该地区今年职工家庭年收入是否低于去年水平。例2\n二、假设检验的程序(一)提出原假设和替代假设原假设(又称虚无假设)是接受检验的假设,记作H0;替代假设(又称备选假设)是当原假设被否定时的另一种可成立的假设,记作H1;H0与H1两者是对立的,如H0真实,则H1不真实;如H0不真实,则H1为真实。H0和H1在统计学中称为统计假设。\n关于总体平均数的假设有三种情况:(1)H0:μ=μ0;H1:μ≠μ0(2)H0:μ≥μ0;H1:μ<μ0(3)H0:μ≤μ0;H1:μ>μ0以上三种类型,对第一种类型的检验,称双边检验,因为μ≠μ0,包含μ>μ0和μ<μ0。而对第二、三种类型的检验,称单边检验。例\n(二)选择显著性水平当原假设H0为真时,却因为样本指标的差异而被否定,这种否定真实的原假设的概率就是显著性水平。用α表示。例α=0.05(即5%)或α=0.01(即1%)\n在假设检验中,要分析样本数值与参数假设值之间的差异,若两者差异越小,假设值真实的可能性则越大;反之,假设值真实的可能性越小。因此,要分析两者差异是否显著,如两者差异是显著的,就要否定原假设,因此,假设检验又称显著性检验。\n(三)选定检验统计量及其分布例\n(四)计算检验统计量在计算检验统计量时,要注意是双边检验还是单边检验。要根据显著性水平α的值确定统计量的否定域、接受域及临界值。\n(五)根据样本指标计算的检验统计量的数值作出决策如果检验统计量的数值落在否定域内(包括临界值),就说明原假设H0与样本描述的情况有显著差异,应该否定原假设;如果该数值落在接受域内,就说明原假设H0与样本描述的情况无显著差异,则应接受原假设。\n(一)双边检验H0:μ=μ0;H1:μ≠μ0三、假设检验的基本方法(介绍方差已知的总体平均数的假设检验)\n某种产品的直径为6cm时,产品为合格,现随机抽取100件作为样本进行检查,得知样本平均值为6.1cm,现假设标准差为0.2cm,令α=0.05,检验这批产品是否合格。例\n\n(二)单边检验\n根据过去学校的记录,学生的统计学考试的平均分数为65分,标准差为16分。现在学校改革了教学方法,经抽取64名学生作调查,得平均分数为69分,问平均分数有无显著提高?(α=0.05)例1\n某工厂生产瓶装1千克的某饮料,标准差为0.02千克,现随机抽取36瓶进行检验,得平均重量为0.9962千克,问能否相信该厂生产的饮料每瓶重量为1千克。(α=0.05)例2\n至于方差未知时总体平均数的检验以及总体成数的假设请参阅教材P315~P317\n本章小结本章主要学习抽样调查与抽样估计的方法、抽样方案设计、假设检验的基本原理。同学们可以根据这些原理和方法去开展抽样调查和对总体指标进行点估计和区间估计。\n本章练习\n本章参考书目1、黄良文主编.统计学原理.北京:中国统计出版社,20002、袁卫主编.统计学.北京:高等教育出版社,20033、贾俊平等编者.统计学.北京:中国人民大学出版社,20004、马国庆著.管理统计.北京:科学出版社,20025、耿修林,谢兆茹编著.应用统计学.北京:科学出版社,2002

相关文档