• 987.50 KB
  • 2021-06-24 发布

高考文科数学复习备课课件:第四节 用样本估计总体

  • 35页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
文数 课标版 第四节 用样本估计总体 1.作频率分布直方图的步骤 (1)求极差(一组数据中①  最大值     与②  最小值     的差). (2)决定③  组距     与④  组数     . (3)将数据⑤  分组     . (4)列⑥  频率分布表     . 教材研读 (5)画⑦  频率分布直方图     . 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的 ⑧  中点     ,就得到频率分布折线图. (2)总体密度曲线:一般地,随着样本容量的增加,作频率分布直方图时 ⑨  所分组数     增加,⑩  组距     减小,相应的频率分布折线图就会越 来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.茎叶图的优点 茎叶图的优点是可以    保留     原始数据,而且可以    随时     记录. 4.样本的数字特征 (1)众数、中位数、平均数        . (ii)方差:标准差的平方 s 2 . s 2 =          [( x 1 -   ) 2 +( x 2 -   ) 2 + … +( x n -   ) 2 ]     .      (2)标准差、方差 (i)标准差:表示样本数据到平均数的一种平均距离.一般用 s 表示, s =        判断下列结论的正误(正确的打“√”,错误的打“ × ”) (1)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.   ( × ) (2)频率分布直方图中,小矩形的高表示频率.   ( × ) (3)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等 的.   ( × ) (4)一组数据的方差越大,说明这组数据的波动越大.   (√) 1.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图 所示,则该校女教师的人数为   (  )   A.93     B.123     C.137     D.167 答案     C 初中部女教师人数为110 × 70%=77, 高中部女教师人数为150 × (1-60%)=60, 所以该校女教师的人数为77+60=137.故选C. 2.10名工人某天生产同一种零件,生产的件数分别是15,17,14,10,15,17, 17,16,14,12,设其平均数为 a ,中位数为 b ,众数为 c ,则有   (  ) A. a > b > c      B. b > c > a      C. c > a > b      D. c > b > a 答案     D     a =   =14.7,因为这组数据 中,17出现的次数最多,故 c =17.这些数据由小到大排列依次是10,12,14, 14,15,15,16,17,17,17,因此 b =15,所以 c > b > a . 3.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3; [30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率 是   (  ) A.0.05     B.0.25     C.0.5     D.0.7 答案     D 由题意知,在区间[10,50)上的数据的频数是2+3+4+5=14,故 其频率为   =0.7. 4.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”, 并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检 测后所作的频率分布直方图,则从图中可以看出被处罚的汽车大约有   (  )   A.30辆     B.40辆      C.60辆     D.80辆 答案     B 从频率分布直方图可知,车速大于或等于70 km/h的频率为 0.02 × 10=0.2,而样本容量为200,所以被处罚的汽车约有200 × 0.2=40辆. 5.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差 是         . 答案  0.1 解析        =   =5.1, 则该组数据的方差 s 2 =   =0.1. 考点一 频率分布直方图 典例1     (2016北京,17,13分)某市居民用水拟实行阶梯水价.每人月用水 量中不超过 w 立方米的部分按4元/立方米收费,超出 w 立方米的部分按1 0元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用 水量数据,整理得到如下频率分布直方图:   考点突破 (1)如果 w 为整数,那么根据此次调查,为使80%以上居民在该月的用 水价格为4元/立方米, w 至少定为多少? (2)假设同组中的每个数据用该组区间的右端点值代替.当 w =3时,估计 该市居民该月的人均水费. 解析  (1)由用水量的频率分布直方图知, 该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频 率依次为0.1,0.15,0.2,0.25,0.15. 所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的 居民占45%. 依题意, w 至少定为3. (2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分 组与频率分布表如下: 根据题意,该市居民该月的人均水费估计为: 4 × 0.1+6 × 0.15+8 × 0.2+10 × 0.25+12 × 0.15+17 × 0.05+22 × 0.05+27 × 0.05= 10.5(元). 组号 1 2 3 4 5 6 7 8 分组 [2,4] (4,6] (6,8] (8,10] (10,12] (12,17] (17,22] (22,27] 频率 0.1 0.15 0.2 0.25 0.15 0.05 0.05 0.05 方法技巧 1.绘制频率分布直方图时需注意: (1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表 是否正确; (2)频率分布直方图的纵坐标是   ,而不是频率. 2.由频率分布直方图进行相关计算时,需掌握下列关系式: (1)   × 组距=频率; (2)   =频率,此关系式的变形为   =样本容量,样本容量 × 频率= 频数. 1-1     (2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位: 小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5, 30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据 直方图,这200名学生中每周的自习时间不少于22.5小时的人数是(     )   A.56     B.60     C.120     D.140 答案     D 由频率分布直方图知200名学生每周的自习时间不少于22.5 小时的频率为1-(0.02+0.10) × 2.5=0.7,则这200名学生中每周的自习时间 不少于22.5小时的人数为200 × 0.7=140,故选D. 1-2     (2015湖北,14,5分)某电子商务公司对10 000名网络购物者2014年 度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内, 其频率分布直方图如图所示. (1)直方图中的 a =         ; (2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为             . 答案  (1)3 (2)6 000 解析  (1)由频率分布直方图可知: 0.1 × (0.2+0.8+1.5+2.0+2.5+ a )=1,解得 a =3. (2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1 × (3.0+2.0+0.8+0.2) =0.6,所以所求购物者的人数为0.6 × 10 000=6 000. 考点二 茎叶图 典例2  (1)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示, 则这组数据的中位数和平均数分别是   (  )   A.91.5和91.5     B.91.5和92 C.91和91.5     D.92和92 (2)(2014课标Ⅱ,19,12分)某市为了考核甲、乙两部门的工作情况,随机 访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市 民的评价越高),绘制茎叶图如下: 甲部门 乙部门 4 97 97665332110 98877766555554443332100 6655200 632220 3 4 5 6 7 8 9 10 59 0448 122456677789 011234688 00113449 123345 011456 000 ①分别估计该市的市民对甲、乙两部门评分的中位数; ②分别估计该市的市民对甲、乙两部门的评分高于90的概率; ③根据茎叶图分析该市的市民对甲、乙两部门的评价. 答案  (1)A 解析  (1)将这组数据从小到大排列为87,89,90,91,92,93,94,96. 故中位数为   =91.5. 平均数为91+   =91.5. (2)①由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第 25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的 中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第 25,26位的是66,68,故样本中位数为   =67,所以该市的市民对乙部门 评分的中位数的估计值是67. ②由所给茎叶图知,50位市民对甲、乙两部门的评分高于90的比率分别 为   =0.1,   =0.16,故该市的市民对甲、乙两部门的评分高于90的概率 的估计值分别为0.1,0.16. ③由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分 的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于 对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较 为一致,对乙部门的评价较低、评价差异较大. 规律总结 (1)茎叶图的绘制需注意:①“叶”的每个位置上只有一个数字,而 “茎”的每个位置上的数的位数一般不需要统一;②重复出现的数据要 重复记录,不能遗漏. (2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以 用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中 在哪块茎,数据分布是否均匀等. 2-1  为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地 选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间 后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下: 服用A药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5 (1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好? 解析  (1)设A药观测数据的平均数为   ,B药观测数据的平均数为   ,由 观测结果可得   =   × (0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+ 2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,   =   × (0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1 +2.4+2.5+2.6+2.7+3.2)=1.6. 由以上计算结果可得   >   ,因此可看出A药的疗效更好. (2)由观测结果可绘制如下茎叶图:   从以上茎叶图可以看出,A药疗效的试验结果有   的叶集中在茎2,3上, 而B药疗效的试验结果有   的叶集中在茎0,1上,由此可看出A药的疗效 更好. 考点三 样本的数字特征 典例3     (2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制 定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年1 00位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1), …… , [4,4.5]分成9组,制成了如图所示的频率分布直方图. (1)求直方图中 a 的值; (2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说 明理由; (3)估计居民月均用水量的中位数. 解析 (1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08 × 0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08, 0.21,0.25,0.06,0.04,0.02. 由 1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5 × a +0.5 × a , 解得 a =0.30. (2) 由 (1) 知 ,100 位居民月均用水量不低于 3 吨的频率为 0.06+0.04+0.02 =0.12, 由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的 人数为300 000 × 0.12=36 000. (3)设中位数为 x 吨. 因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5, 而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5, 所以2 ≤ x <2.5. 由0.50 × ( x -2)=0.5-0.48, 解得 x =2.04. 故可估计居民月均用水量的中位数为2.04吨. 规律总结 频率分布直方图与众数、中位数、平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的; (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个 小长方形的面积乘以小长方形底边中点的横坐标之和. 3-1     (2015山东,6,5分)为比较甲、乙两地某月14时的气温状况,随机选 取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎 叶图.   考虑以下结论: ①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为   (  ) A.①③     B.①④     C.②③     D.②④ 答案     B 由茎叶图中的数据通过计算求得   =29,   =30, s 甲 =   , s 乙 =   ,∴   <   , s 甲 > s 乙 ,故①④正确.选B. 3-2     (2015广东,17,12分)某工厂36名工人的年龄数据如下表. (1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段 里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值   和方差 s 2 ; (3)36名工人中年龄在   - s 与   + s 之间有多少人?所占的百分比是多少(精 确到0.01%)? 解析  (1)由系统抽样,将36名工人分为9组(4人一组),每组抽取一名工 人. 因为在第一分段里抽到的是年龄为44的工人,即编号为2的工人,故所抽 样本的年龄数据为44,40,36,43,36,37,44,43,37. (2)均值   =   =40; 方差 s 2 =   × [(44-40) 2 +(40-40) 2 +(36-40) 2 +(43-40) 2 +(36-40) 2 +(37-40) 2 +(44-40) 2 +(43-40) 2 +(37-40) 2 ]=   . (3)由(2)可知 s =   .由题意,年龄在   内的工人共有23人,所 占的百分比为   × 100% ≈ 63.89%.