• 1.71 MB
  • 2021-07-01 发布

高考数学专题复习课件:11-2 用样本估计总体

  • 63页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
§ 11.2  用样本估计总体 [ 考纲要求 ]   1. 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点 .2. 理解样本数据标准差的意义和作用,会计算数据标准差 .3. 能从样本数据中提取基本的数字特征 ( 平均数、标准差 ) ,并给出合理解释 .4. 会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想 .5. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 1 .作频率分布直方图的步骤 (1) 求极差 ( 即一组数据中 _______ 与 _______ 的差 ) . (2) 决定 _____ 与 _____ . (3) 将数据 _____ . (4) 列 ____________ . (5) 画 _________________ . 最大值 最小值 组距 组数 分组 频率分布表 频率分布直方图 2 .频率分布折线图和总体密度曲线 (1) 频率分布折线图:连接频率分布直方图中各小长方形上端的 _____ ,就得到频率分布折线图. (2) 总体密度曲线:随着 __________ 的增加,作图时 _____ _______ 增加, ______ 减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 中点 样本容量 所分 的组数 组距 3 .茎叶图 (1) 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. (2) 茎叶图的优点 茎叶图的优点是可以 ____ 原始数据,而且可以 ____ 记录,这对数据的记录和表示都能带来方便. 保留 随时 4 . 样本的数字特征 (1) 众数、中位数、平均数 数字特征 定义与求法 优点与缺点 众数 一组数据中重复出现 次数 _____ 的 数 众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征 最多 6 . 平均数、方差的公式推广 (1) 若数据 x 1 , x 2 , … , x n 的平均数为 x ,那么 mx 1 + a , mx 2 + a , mx 3 + a , … , mx n + a 的平均数是 mx + a . (2) 数据 x 1 , x 2 , … , x n 的方差为 s 2 . ① 数据 x 1 + a , x 2 + a , … , x n + a 的方差也为 s 2 ; ② 数据 ax 1 , ax 2 , … , ax n 的方差为 a 2 s 2 . 【 思考辨析 】  判断下面结论是否正确 ( 请在括号中打 “√” 或 “ ×” ) (1) 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. (    ) (2) 一组数据的众数可以是一个或几个,那么中位数也具有相同的结论. (    ) (3) 从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. (    ) (4) 茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次. (    ) (5) 在频率分布直方图中,最高的小长方形底边中点的横坐标是众数. (    ) (6) 在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的. (    ) 【 答案 】 (1) √   (2) ×   (3) √   (4) ×   (5) √   (6) × 1 . (2015· 陕西 ) 某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别比例如图所示,则该校女教师的人数为 (    ) A . 93            B . 123 C . 137 D . 167 【 解析 】 由题干扇形统计图可得该校女教师人数为: 110 × 70% + 150 × (1 - 60%) = 137. 故选 C. 【 答案 】 C 2 .若某校高一年级 8 个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是 (    ) A . 91.5 和 91.5 B . 91.5 和 92 C . 91 和 91.5 D . 92 和 92 【 答案 】 A 【 答案 】 B 4 . (2016· 江苏卷 ) 已知一组数据 4.7 , 4.8 , 5.1 , 5.4 , 5.5 ,则该组数据的方差是 ________ . 【 答案 】 0.1 5 . ( 教材改编 ) 甲、乙两人在相同条件下各射靶 10 次,每次命中环数如下: 甲  4   7   10   9   5   6   8   6   8   8 乙  7   8   6   8   6   7   8   7   5   9 试问 10 次射靶的情况较稳定的是 ________ . 【 答案 】 乙 题型一 频率分布直方图的绘制与应用 【 例 1 】 (2015· 课标全国 Ⅱ ) 某公司为了解用户对其产品的满意度,从 A , B 两地区分别随机调查了 40 个用户,根据用户对产品的满意度评分,得到 A 地区用户满意度评分的频率分布直方图和 B 地区用户满意度评分的频数分布表. A 地区用户满意度评分的频率分布直方图 B 地区用户满意度评分的频率分布表 满意度评分分组 [50 , 60) [60 , 70) [70 , 80) [80 , 90) [90 , 100] 频数 2 8 14 10 6 (1) 在图 ② 中作出 B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度 ( 不要求计算出具体值,给出结论即可 ) . B 地区用户满意度评分的频率分布直方图 (2) 根据用户满意度评分,将用户的满意度分为三个等级: 满意度评分 低于 70 分 70 分到 89 分 不低于 90 分 满意度等级 不满意 满意 非常满意 估计哪个地区用户的满意度等级为不满意的概率大?说明理由. 【 解析 】 (1) 如图所示. 通过两地区用户满意度评分的频率分布直方图可以看出, B 地区用户满意度评分的平均值高于 A 地区用户满意度评分的平均值; B 地区用户满意度评分比较集中,而 A 地区用户满意度评分比较分散. (2) A 地区用户的满意度等级为不满意的概率大. 记 C A 表示事件: “ A 地区用户的满意度等级为不满意 ” ; C B 表示事件: “ B 地区用户的满意度等级为不满意 ” . 由直方图得 P ( C A ) 的估计值为 (0.01 + 0.02 + 0.03) × 10 = 0.6 , P ( C B ) 的估计值为 (0.005 + 0.02) × 10 = 0.25. 所以 A 地区用户的满意度等级为不满意的概率大. 【 方法规律 】 (1) 明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为 1. (2) 对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据. 跟踪训练 1 (1) (2016· 山东 ) 某高校调查了 200 名学生每周的自习时间 ( 单位:小时 ) ,制成了如图所示的频率分布直方图,其中自习时间的范围是 [17.5 , 30] ,样本数据分组为 [17.5 , 20) , [20 , 22.5) , [22.5 , 25) , [25 , 27.5) , [27.5 , 30] .根据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数是 (    ) A . 56             B . 60 C . 120 D . 140 【 解析 】 由频率分布直方图知,数据落在区间 [22.5 , 30] 的频率为 2.5 × (0.16 + 0.08 + 0.04) = 0.7. 故这 200 名学生中每周的自习时间不少于 22.5 小时的人数为 200 × 0.7 = 140. 故选 D. 【 答案 】 D (2) 某校从参加高一年级期中考试的学生中随机抽出 60 名学生,将其物理成绩 ( 均为整数 ) 分成六段 [40 , 50) , [50 , 60) , … , [90 , 100] 后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题: ① 求分数在 [70 , 80) 内的频率,并补全这个频率分布直方图; ② 统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分. 【 解析 】 ① 设分数在 [70 , 80) 内的频率为 x ,根据频率分布直方图,有 (0.010 + 0.015 × 2 + 0.025 + 0.005) × 10 + x = 1 ,可得 x = 0.3 ,所以频率分布直方图如图所示. ② 平均分: 45 × 0.1 + 55 × 0.15 + 65 × 0.15 + 75 × 0.3 + 85 × 0.25 + 95 × 0.05 = 71( 分 ) . 题型二 茎叶图的应用 【 例 2 】 (1)(2015· 山东 ) 为比较甲、乙两地某月 14 时的气温情况,随机选取该月中的 5 天,将这 5 天中 14 时的气温数据 ( 单位: ℃ ) 制成如图所示的茎叶图.考虑以下结论: ① 甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温; ② 甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温; ③ 甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差; ④ 甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为 (    ) A . ①③ B . ①④ C . ②③ D . ②④ (2) 以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩 ( 单位:分 ) . 已知甲组数据的中位数为 15 ,乙组数据的平均数为 16.8 ,则 x , y 的值分别为 (    ) A . 2 , 5 B . 5 , 5 C . 5 , 8 D . 8 , 8 【 答案 】 (1)B   (2)C 【 引申探究 】 1 .本例 (2) 中条件不变,试比较甲、乙两组哪组成绩较好. 2 .在本例 (2) 条件下: ① 求乙组数据的中位数、众数; ② 求乙组数据的方差. 【 方法规律 】 茎叶图的优缺点 由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐. 跟踪训练 2 (2017· 内蒙古月考 ) 在高二的 5 次月考中,甲、乙两位同学的数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是 x 甲 , x 乙 ,则下列结论正确的是 (    ) A . x 甲 < x 乙 ,甲比乙成绩稳定 B . x 甲 > x 乙 ,乙比甲成绩稳定 C . x 甲 > x 乙 ,甲比乙成绩稳定 D . x 甲 < x 乙 ,乙比甲成绩稳定 【 答案 】 D 题型三 用样本的数字特征估计总体的数字特征 【 例 3 】 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图. (1) 分别求出两人得分的平均数与方差; (2) 根据图和上面算得的结果,对两人的训练成绩作出评价. 【 解析 】 (1) 由题图象可得甲、乙两人五次测试的成绩分别为 甲: 10 分, 13 分, 12 分, 14 分, 16 分; 乙: 13 分, 14 分, 12 分, 12 分, 14 分. 【 方法规律 】 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小. 跟踪训练 3 (2015· 广东 ) 某工厂 36 名工人的年龄数据如下表. 工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄 1     40 10     36 19     27 28     34 2     44 11     31 20     43 29     39 3     40 12     38 21     41 30     43 4     41 13     39 22     37 31     38 5     33 14     43 23     34 32     42 6     40 15     45 24     42 33     53 7     45 16     39 25     37 34     37 8     42 17     38 26     44 35     49 9     43 18     36 27     42 36     39 (1) 用系统抽样法从 36 名工人中抽取容量为 9 的样本,且在第一分段里用随机抽样法抽到的年龄数据为 44 ,列出样本的年龄数据; (2) 计算 (1) 中样本的均值 x 和方差 s 2 ; (3)36 名工人中年龄在 x - s 与 x + s 之间的有多少人?所占的百分比是多少 ( 精确到 0.01%)? 高频小考点 9 高考中频率分布直方图的应用 【 典例 】 (12 分 ) (2015· 广东 ) 某城市 100 户居民的月平均用电量 ( 单位:度 ) ,以 [160 , 180) , [180 , 200) , [200 , 220) , [220 , 240) , [240 , 260) , [260 , 280) , [280 , 300] 分组的频率分布直方图如图. (1) 求直方图中 x 的值; (2) 求月平均用电量的众数和中位数; (3) 在月平均用电量为 [220 , 240) , [240 , 260) , [260 , 280) , [280 , 300] 的四组用户中,用分层抽样的方法抽取 11 户居民,则月平均用电量在 [220 , 240) 的用户中应抽取多少户? 【 温馨提醒 】 本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意 . ► 方法与技巧 1 .用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致,通过频率分布表和频率分布直方图可以对总体作出估计. 2 .茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作. 3 .若取值 x 1 , x 2 , … , x n 的频率分别为 p 1 , p 2 , … , p n ,则其平均值为 x 1 p 1 + x 2 p 2 + … + x n p n ;若 x 1 , x 2 , … , x n 的平均数为 x ,方差为 s 2 ,则 ax 1 + b , ax 2 + b , … , ax n + b 的平均数为 ax + b ,方差为 a 2 s 2 . ► 失误与防范 频率分布直方图的纵坐标为频率 / 组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误 .