• 543.21 KB
  • 2022-04-12 发布

2020版高中数学第二章统计2.2.2用样本的数字特征估计总体的数字特征学案(含解析)新人教b版

  • 14页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
2.2.2 用样本的数字特征估计总体的数字特征学习目标 1.能合理地选取样本,并从中提取基本的数字特征.2.了解众数、中位数、平均数的概念,会计算方差和标准差.3.进一步体会用样本估计总体的思想,会用样本的数字特征估计总体的数字特征.知识点一 众数、中位数、平均数思考1 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?答案 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但它的缺点是平均数受数据中极端值的影响较大.思考2 在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?答案 为了避免平均值受数据中个别极端值的影响,增大它在估计总体时的可靠性,故计算评委打分时要去掉一个最高分和一个最低分.梳理 众数、中位数、平均数定义(1)众数:一组数据中出现次数最多的数.(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.(3)平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.知识点二 方差、标准差思考1 当样本数据的标准差为0时,该组数据有何特点?答案 当样本数据的标准差为0时,该组数据都相等.思考2 标准差、方差的意义是什么?答案 标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.梳理 标准差、方差的概念及计算公式(1)标准差是样本数据到平均数的一种平均距离,一般用s表示.s=(xn是样本数据,n是样本容量,是样本平均数).n(2)标准差的平方s2叫做方差.s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数).(3)标准差(或方差)越小,数据越稳定在平均数附近.s=0时,每一组样本数据均为.知识拓展:平均数、方差公式的推广:1.若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.2.设数据x1,x2,…,xn的平均数为,方差为s2,则a.s2=[(x+x+…+x)-n2];b.数据x1+a,x2+a,…,xn+a的方差也为s2;c.数据ax1,ax2,…,axn的方差为a2s2.知识点三 用样本的基本数字特征估计总体的基本数字特征1.样本的基本数字特征包括众数、中位数、平均数、标准差.2.平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,还需要用标准差来反映数据的分散程度.3.现实中的总体所包含的个体数往往是很多的,虽然总体的平均数与标准差客观存在,但是我们无从知道.所以通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.虽然样本具有随机性,不同的样本测得的数据不一样,与总体的数字特征也可能不同,但只要样本的代表性好,这样做就是合理的,也是可以接受的.1.中位数是一组数据中间的数.( × )2.众数是一组数据中出现次数最多的数.( √ )3.一组数据的标准差越小,数据越稳定,且稳定在平均数附近.( √ )题型一 众数、中位数和平均数的理解与应用例1 某公司的33名职工的月工资(单位:元)如下表:职业董事长副董事长董事总经理经理管理员职员人数11215320工资5500500035003000250020001500n(1)求该公司职工月工资的平均数;(2)若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工月工资新的平均数又是什么?解 (1)公司职工月工资的平均数为==≈2091(元).(2)若董事长、副董事长的工资提升后,职工月工资的平均数为==≈3288(元).反思与感悟 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,众数往往更能反映问题.(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.(4)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动.(5)因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.跟踪训练1 对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:①这组数据的众数是3;②这组数据的众数与中位数的数值不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确结论的个数为(  )A.1B.2C.3D.4答案 An解析 在这11个数中,数3出现了6次,频率最高,故众数是3;将这11个数按从小到大的顺序排列得2,2,3,3,3,3,3,3,6,6,10,中间数据是3,故中位数是3;而平均数==4.故只有①正确.命题角度2 用频率分布直方图估算众数、中位数、平均数例2 已知一组数据:125 121 123 125 127 129 125 128 130 129126 124 125 127 126 122 124 125 126 128(1)填写下面的频率分布表:分组频数频率[121,123)[123,125)[125,127)[127,129)[129,131]合计(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.解 (1)频率分布表如下:分组频数频率[121,123)20.10[123,125)30.15[125,127)80.40[127,129)40.20[129,131]30.15合计201.00(2)频率分布直方图如下:n(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125.图中虚线对应的数据是125+2×=126.25,事实上中位数为125.5.使用“组中值”求平均数:=122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的精确值为=125.75.反思与感悟 (1)利用频率分布直方图估计数字特征:①众数是最高的矩形的底边中点的横坐标;②中位数左右两侧直方图的面积相等;③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.(2)利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.跟踪训练2 一批乒乓球,随机抽取100个进行检查,球的直径频率分布直方图如图.试估计这个样本的众数、中位数和平均数.解 众数==40;四个矩形的面积分别是0.02×5=0.1,0.02×10=0.2,0.02×25=0.5,0.02×10=0.2.中位数为39.99+=39.998;平均数为39.96×0.1+39.98×0.2+40×0.5+40.02×0.2=39.996.题型二 标准差、方差的应用例3 计算数据89,93,88,91,94,90,88,87的方差和标准差(标准差结果精确到0.1).解 ①=90+[(-1)+3+(-2)+1+4+0+(-2)+(-3)]=90+×0=90;②计算xi-(i=1,2,…,8),得各数据为-1,3,-2,1,4,0,-2,-3;③计算(xi-)2(i=1,2,…,8),得各数据为1,9,4,1,16,0,4,9;④计算方差:s2=(1+9+4+1+16+0+4+9)==5.5;⑤计算标准差:s=≈2.3.所以这组数据的方差为5.5,标准差约为2.3.n反思与感悟 (1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.(3)若样本数据都相等,则s=0.(4)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度是由标准差来衡量的.跟踪训练3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和(1)中算得的结果,对两人的训练成绩作出评价.解 (1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.甲==13,乙==13,s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s>s可知乙的成绩较稳定.从折线图来看,甲的成绩基本上呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩无明显提高.1.某市2017年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是(  )nA.19B.20C.21.5D.23答案 B解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.2.设样本数据x1,x2,…,x10的平均数和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的平均数和方差分别为(  )A.1+a,4B.1+a,4+aC.1,4D.1,4+a答案 A解析 ∵x1,x2,…,x10的平均数=1,方差s=4,且yi=xi+a(i=1,2,…,10),∴y1,y2,…,y10的平均数=·(y1+y2+…+y10)=·(x1+x2+…+x10+10a)=·(x1+x2+…+x10)+a=+a=1+a,其方差s=·[(y1-)2+(y2-)2+…+(y10-)2]=[(x1-1)2+(x2-1)2+…+(x10-1)2]=s=4.故选A.3.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.答案 6解析 由已知得,所求平均数为=6.4.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.答案 16解析 设样本数据x1,x2,…,x10的标准差为s,则s=8,可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.5.某校医务室抽查了高一10位同学的体重(单位:kg)如下:74,71,72,68,76,73,67,70,65,74.(1)求这10个学生体重数据的平均数、中位数、方差、标准差;(2)估计高一所有学生体重数据的平均数、中位数、方差、标准差.n解 (1)这10个学生体重数据的平均数为=×(74+71+72+68+76+73+67+70+65+74)=71.这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,∴这10个学生体重数据的中位数为=71.5.这10个学生体重数据的方差为s2=×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11,这10个学生体重数据的标准差为s==.(2)由样本估计总体得高一所有学生体重数据的平均数为71,中位数为71.5,方差为11,标准差为.1.利用直方图求数字特征:①众数是最高的矩形的底边的中点.②中位数左右两边直方图的面积应相等.③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.3.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.一、选择题1.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数,众数,中位数分别为(  )A.85分,85分,85分B.87分,85分,86分C.87分,85分,85分D.87分,85分,90分答案 C解析 平均数为=87,众数为85,中位数为85,故选C.n2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有(  )A.a>b>cB.b>c>aC.c>a>bD.c>b>a答案 D解析 由已知得a=×(15+17+14+10+15+17+17+16+14+12)=14.7,b=×(15+15)=15,c=17,∴c>b>a.故选D.3.样本a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这个样本的方差是(  )A.3B.4C.5D.6答案 C解析 x2-5x+4=0的两根是1,4.当a=1时,a,3,5,7的平均数是4;当a=4时,a,3,5,7的平均数不是1.∴a=1,b=4,则方差s2=×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.4.如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为(  )A.2,5B.5,5C.5,8D.8,8答案 C解析 由茎叶图及已知得x=5,又乙组数据的平均数为16.8,即=16.8,解得y=8,选C.5.某高三学生在连续五次月考中的数学成绩为(单位:分):90,90,93,94,93,则该学生在这五次月考中数学成绩数据的平均数和方差分别为(  )A.92,2.8B.92,2C.93,2D.93,2.8答案 A解析 该学生在这五次月考中数学成绩数据的平均数为n=×(90+90+93+94+93)=92,方差为s2=×[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.故选A.6.高三学生李丽在一年的五次数学模拟考试中的成绩为(单位:分):x,y,105,109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x-y|的值为(  )A.15B.16C.17D.18答案 D解析 由题意得,=108,①=35.2,②由①②解得或所以|x-y|=18.故选D.7.某省农科所经过5年对甲、乙两棉种的实验研究,将连续5年棉花产量(千克/亩)的统计数据用茎叶图表示,如图所示,则平均产量较高与产量较稳定的分别是(  )A.甲棉种;甲棉种B.乙棉种;甲棉种C.甲棉种;乙棉种D.乙棉种;乙棉种答案 C解析 根据茎叶图的数据知,甲棉种产量为68,69,70,71,72;乙棉种产量为68,68,69,69,71.∴甲棉种的平均值甲=×(68+69+70+71+72)=70;乙棉种的平均值乙=×(68+68+69+69+71)=69.甲的方差s=×[(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)2]=2,乙的方差s=×[(68-69)2+(68-69)2+(69-69)2+(69-69)2+(71-69)2]=1.2.∴甲棉种平均产量较高,乙棉种产量较稳定.故选C.二、填空题8.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70分~99分),若甲、乙两组学生的平均成绩一样,则a=________;甲、乙两组学生的成绩相对稳定的是________.n答案 5 甲组解析 由题意可知==89,解得a=5.因为s=×[(-14)2+(-1)2+0+92+62]=,s=×[(-13)2+(-4)2+0+92+82]=,所以s<s,故成绩相对稳定的是甲组.9.已知一组数据x1,x2,…,x10的方差是2,且(x1-3)2+(x2-3)2+…+(x10-3)2=380,则这组数据的平均数=________.答案 -3或9解析 ∵数据x1,x2,…,x10的方差为2,∴[(x1-)2+(x2-)2+…+(x10-)2]=2,即(x1-)2+(x2-)2+…+(x10-)2=20.又∵(x1-3)2+(x2-3)2+…+(x10-3)2=380,∴90-102+(2-6)×10=360,∴2-6-27=0,解得=-3或=9.10.一组数据2,x,4,6,10的平均数是5,则此组数据的标准差是________.答案 2解析 ∵一组数据2,x,4,6,10的平均数是5,∴2+x+4+6+10=5×5,解得x=3,∴此组数据的方差s2=×[(2-5)2+(3-5)2+(4-5)2+(6-5)2+(10-5)2]=8,∴此组数据的标准差s=2.11.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1020小时,980小时,1030小时,估计这个企业生产的产品的平均使用寿命为________小时.n答案 50 1015解析 由分层抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1020×50%+980×20%+1030×30%=1015(小时).三、解答题12.从甲、乙两班某项测试成绩中各随机抽取5名同学的成绩,得到如图所示的茎叶图.已知甲班成绩数据的中位数为13,乙班成绩数据的平均数为16.(1)求x,y的值;(2)试估计甲、乙两班在该项测试中整体水平的高低.(注:方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数)解 (1)由茎叶图知甲班成绩数据依次为9,12,10+x,20,26,所以中位数为10+x=13,得x=3;乙班成绩数据的平均数乙=(9+15+10+y+18+20)=16,得y=8.(2)乙班整体水平较高.理由:由题意及(1)得甲=×(9+12+13+20+26)=16,s=×[(9-16)2+(12-16)2+(13-16)2+(20-16)2+(26-16)2]=38,乙=16,s=×[(9-16)2+(15-16)2+(18-16)2+(18-16)2+(20-16)2]==14.8.因为s>s,所以乙班的整体水平较高.13.某工厂36名工人的年龄数据如表所示.(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;n(2)计算(1)中样本的平均数和方差s2;(3)36名工人中年龄在-s与+s之间的有多少人?所占的百分比是多少(精确到0.01%)?解 (1)由系统抽样,将36名工人分为9组(4人一组),每组抽取一名工人.因为在第一分段里抽到的是年龄为44的工人,即编号为2的工人,故所抽样本的年龄数据为44,40,36,43,36,37,44,43,37.(2)平均数==40;方差s2=×[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=.(3)由(2)可知s=.由题意,年龄在内的工人共有23人,所占的百分比为×100%≈63.89%.14.从某企业生产的某种产品中随机抽取100件,测量这些产品的某项质量指标,由测量结果得到如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125]频数62638228(1)在图中作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解 (1)频率分布直方图如图:n(2)质量指标值的样本平均数为80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.

相关文档