- 135.50 KB
- 2022-08-18 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计、抽样方法一、教学目标1.随机抽样。2.用样本估计总体。3.变量的相关性。二、知识提要1.抽样当总体中的个体较少时,一般可用简单随机抽样;当总体中的个体较多时,一般可用系统抽样;当总体由差异明显的几部分组成时,一般可用分层抽样,而简单随机抽样作为一种最简单的抽样方法,又在其中处于一种非常重要的地位.实施简单随机抽样,主要有两种方法:抽签法和随机数表法.系统抽样适用于总体中的个体数较多的情况,因为这时采用简单随机抽样就显得不方便,系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均匀分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样也属于等概率抽样.分层抽样在内容上与系统抽样是平行的,在每一层进行抽样时,采用简单随机抽样或系统抽样,分层抽样也是等概率抽样.2.样本与总体用样本估计总体是研究统计问题的一种思想方法.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图,当总体中的个体取不同值较多,甚至无限时,其频率分布的研究要用到初中学过的整理样本数据的知识.用样本估计总体,除在整体上用样本的频率分布去估计总体的分布以外,还可以从特征数上进行估计,即用样本的平均数去估计总体的平均数,用关于样本的方差(标准差)去估计总体的方差(标准差).3.正态分布正态分布在实际生产、生活中有着广泛的应用,很多变量,如测量的误差、产品的尺寸等服从或近似服从正态分布,利用正态分布的有关性质可以对产品进行假设检验.4.线性回归直线设x、y是具有相关关系的两个变量,且相应于n组观察值的n个点大致分布在一条直线的附近,我们把整体上这n个点最接近的一条直线叫线性回归直线.三、基础训练1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是()A.B.C.D.2.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为()\nA.0.6hB.0.9hC.1.0hD.1.5h3.如果随机变量ξ~N(μ,σ2),且Eξ=3,Dξ=1,则P(-1<ξ≤1)等于()A.2Φ(1)-1B.Φ(4)-Φ(2)C.Φ(2)-Φ(4)D.Φ(-4)-Φ(-2)4..为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:广告费用(千元)1.04.06.010.014.0销售额(千元)19.044.040.052.053.0现要使销售额达到6万元,则需广告费用为______.(保留两位有效数字)四、典型例题【例1】某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.【例2】已知测量误差ξ~N(2,100)(cm),必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过8cm的频率大于0.9?五、达标检测1.对总数为N的一批零件抽取一个容量为30的样本,若每个零件被抽取的概率为0.25,则N等于()A.150B.200C.120D.1002.设随机变量ξ~N(μ,σ),且P(ξ≤C)=P(ξ>C),则C等于()A.0B.σC.-μD.μ3.(2003年全国,14)某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取______辆、______辆、______辆.4.某厂生产的零件外直径ξ~N(8.0,1.52)(mm),今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分别为7.9mm和7.5mm,则可认为()A.上、下午生产情况均为正常B.上、下午生产情况均为异常C.上午生产情况正常,下午生产情况异常D.上午生产情况异常,下午生产情况正常5.随机变量ξ服从正态分布N(0,1),如果P(ξ<1)=0.8413,求P(-1<ξ<0).6.公共汽车门的高度是按照确保99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成年男子的身高ξ~N(173,72)(cm),问车门应设计多高?\n基础训练1.解析:简单随机抽样中每一个体的入样概率为.答案:C2.解析:一天平均每人的课外阅读时间应为一天的总阅读时间与学生数的比,即=0.9h.答案:B3.解析:对正态分布,μ=Eξ=3,σ2=Dξ=1,故P(-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2).答案:B4.解析:先求出回归方程=bx+a,令=6,得x=1.5万元.答案:1.5万元典型例题【例1】剖析:要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个体时,每个个体被取到的概率.解:(1)简单随机抽样法:可采取抽签法,将160个零件按1~160编号,相应地制作1~160号的160个签,从中随机抽20个.显然每个个体被抽到的概率为=.(2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k号(1≤k≤8),则在其余组中分别抽取第k+8n(n=1,2,3,…,19)号,此时每个个体被抽到的概率为.(3)分层抽样法:按比例=,分别在一级品、二级品、三级品、等外品中抽取48×=6个,64×=8个,32×=4个,16×=2个,每个个体被抽到的概率分别为,,,,即都是.综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是.评述:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.思考讨论:现有20张奖券,已知只有一张能获奖,甲从中任摸一张,中奖的概率为,刮开一看没中奖.乙再从余下19张中任摸一张,中奖概率为,这样说甲、乙中奖的概率不一样,是否正确?【例2】解:设η表示n次测量中绝对误差不超过8cm的次数,则η~B(n,p).其中P=P(|ξ|<8)=Φ()-Φ()=Φ(0.6)-1+Φ(1)=0.7258-1+0.8413=0.5671.由题意,∵P(η≥1)>0.9,n应满足P(η≥1)=1-P(η=0)=1-(1-p)n>0.9,\n∴n>==2.75.因此,至少要进行3次测量,才能使至少有一次误差的绝对值不超过8cm的概率大于0.9.达标检测1.解析:∵=0.25,∴N=120.答案:C2.解析:由正态曲线的图象关于直线x=μ对称可得答案为D.答案:D3.解析:因总轿车数为9200辆,而抽取46辆进行检验,抽样比例为=,而三种型号的轿车有显著区别.根据分层抽样分为三层按比例分别有6辆、30辆、10辆.答案:630104.解析:根据3σ原则,在8+3×1.5=8.45(mm)与8-3×1.5=7.55(mm)之外时为异常.答案:C5.解:∵ξ~N(0,1),∴P(-1<ξ<0)=P(0<ξ<1)=Φ(1)-Φ(0)=0.8413-0.5=0.3413.6.解:设公共汽车门的设计高度为xcm,由题意,需使P(ξ≥x)<1%.∵ξ~N(173,72),∴P(ξ≤x)=Φ()>0.99.查表得>2.33,∴x>189.31,即公共汽车门的高度应设计为190cm,可确保99%以上的成年男子头部不跟车门顶部碰撞.