• 2.48 MB
  • 2021-06-20 发布

高中数学北师大版新教材必修一同步课件:6-3 用样本估计总体分布

  • 53页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
§3  用样本估计总体分布 必备知识 · 自主学习 1. 频数与频率 (1) 频数 : 将样本按照一定的方法分成若干组 , 每组内含有的个体数目 . (2) 频率 : 频数与总数的比值 . 2. 频率分布直方图 (1) 画法 : (2) 本质 : 频率分布表与频率分布直方图是对纷杂的样本数据整理和表示的一种方法 , 目的是可以清晰地得到样本数据的频率分布 , 从而估计总体分布 . (3) 应用 :① 数据频数、频率的计算 ;② 估计总体分布 . 【 思考 】 同一组数据 , 如果组距不同 , 得到的频率分布直方图会相同吗 ? 为什么 ? 提示 : 对于同一组数据 , 不同的组距决定不同的组数 , 得到的频率分布直方图也会不同 . 3. 频率折线图 在频率分布直方图中 , 按照分组原则 , 再在左边和右边各加一个区间 , 从所加的 左边区间的 _____ 开始 , 用线段依次连接各个矩形的 _________, 直至右边所加区 间的 _____, 就可以得到一条折线 , 我们称之为频率折线图 . 随着样本容量的增大 , 所划分的区间数也可以随之 _____, 而每个区间的长度则 会相应随之 _____, 相应的频率折线图就会越接近于一条光滑曲线 . 中点 顶端中点 中点 增多 减小 【 基础小测 】 1. 辨析记忆 ( 对的打“√” , 错的打“ ×”) (1) 一般样本容量越大 , 所分组数越多 ; 样本容量越小 , 所分组数越少 . (    ) (2) 频率分布直方图的纵坐标表示频率 . (    ) (3) 频率分布直方图中小矩形的面积表示该组的频数 . (    ) 提示 : (1)√. (2)×. 频率分布直方图的纵坐标表示 (3)×. 频率分布直方图中小矩形的面积表示该组的频率 . 2. 从一堆苹果中任取 10 个 , 称得它们的质量如下 ( 单位 : 克 ):125   120   122   105   130   114   116   95   120   134, 则样本数据落在 [114.5,124.5) 内的频数为 (    ) A.2     B.3     C.4     D.5 【 解析 】 选 C. 依题意 , 样本数据落在 [114.5,124.5) 内的是 120,122,116,120 共 4 个 , 所以频数为 4. 3.( 教材二次开发 : 例题改编 ) 一个容量为 n 的样本 , 分成若干组 , 已知某组的频数 和频率分别为 50 和 0.25, 则 n=      .  【 解析 】 由题意得 =0.25, 所以 n=200. 答案 : 200 关键能力 · 合作学习 类型一 频数与频率的关系 ( 数学抽象、数学运算 ) 【 题组训练 】 1.2020 年 4 月 21-23 日 , 临沂市高三一模考试中某校高三 1,2 班各有 50 人参加了考试 , 考试结束后他们的数学老师对数学成绩做了分析 . 单从成绩是否及格来看 ,1 班有 10 人不及格 ,2 班的及格率是 90%, 则下列说法正确的是 (    ) A.2 班数学成绩及格的有 40 人 B.1 班数学成绩的及格率是 90% C.2 班数学成绩的及格率高于 1 班 D.1 班不及格的人数比 2 班少 2. 已知样本 : 7   10   14   8   7   12   11   10   8   10 13   10   8   11   8   9   12   9   13   12 那么这组样本数据落在范围 8.5 ~ 11.5 内的频数为      , 频率为      .  3. 某县一中记载了近五年 (2015-2019) 学生高考本科上线人数及相应比例如表 , 请根据表中数据说明频数与频率的不同之处 . 2015 2016 2017 2018 2019 本科上线人数 1 013 1 092 1 154 1 187 1 223 比例 69.5% 71.3% 75.1% 77.2% 79.5% 【 解析 】 1. 选 C. 由题意 ,1 班有 10 人不及格 ,40 人及格 , 及格率是 80%,2 班有 5 人不及格 ,45 人及格 , 及格率是 90%. 2. 样本容量是 20, 落在 8.5 ~ 11.5 内的数据有 2 个 9,4 个 10,2 个 11, 共 8 个数据 , 所以频数为 8, 频率是 8÷20=0.4. 答案 : 8   0.4 3. 从 2015 年到 2019 年本科上线人数逐年递增 , 从频数来看 ,2016 年较上一年增加了 79 人 ,2017 年较上一年增加了 62 人 ,2018 年较上一年增加了 33 人 ,2019 年较上一年增加了 36 人 , 容易得到 2015 年到 2016 年增加的人数最多 , 但从这五年的频率来看 ,2015 年到 2016 年的频率增长了 1.8%, 是增长最少的 ,2016 年到 2017 年的频率增长了 3.8%, 是增长最大的 , 这说明只从频数一个角度分析实际问题是远远不够的 , 实际过程中 , 应从频数和频率两方面参考 . 【 解题策略 】 频率的应用 频率反映了相对总数而言的相对强度 , 其携带的总体信息要超过频数 , 频数受总体数量影响较大 , 所以频率能客观地反映总体分布 , 在生活中 , 经常用样本的频率分布去估计总体的频率分布 . 【 补偿训练 】 如表是两名 CBA 球员 2019 赛季的得分情况统计 . 参赛场次 场均得分 场均时间 投篮命中率 罚球命中率 甲 28 30.2 28 45% 88% 乙 28 26 30 40% 82% 请根据表格数据 , 分析这两名运动员的得分水平 . 【 解析 】 由题中表格数据可知 , 甲乙运动员参赛场次相同 , 每场平均时间甲少于乙 , 但场均得分高于乙 . 不论是投篮命中率 , 还是罚球命中率 , 甲均高于乙 , 可以认为甲运动员比乙运动员水平高 . 类型二 画频率分布直方图 ( 数据分析 )  角度 1  列频率分布表  【 典例 】 为了了解某片经济林的生长情况 , 随机测量其中的 100 棵树的底部周长 , 得到如下数据 ( 单位 :cm): 135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 列出频率分布表 . 【 思路导引 】 先计算数据的极差 , 确定组距与组数 , 再列出频率分布表 . 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108 【 解析 】 这组数据的最大的数为 135, 最小的数为 80, 最大的数与最小的数的差为 55, 可将该组数据分为 11 组 , 组距为 5. 频率分布表如下 : 底部周长分组 频数 频率 [80,85) 1 0.01 0.002 [85,90) 2 0.02 0.004 [90,95) 4 0.04 0.008 [95,100) 14 0.14 0.028 底部周长分组 频数 频率 [100,105) 24 0.24 0.048 [105,110) 15 0.15 0.030 [110,115) 12 0.12 0.024 [115,120) 9 0.09 0.018 [120,125) 11 0.11 0.022 [125,130) 6 0.06 0.012 [130,135] 2 0.02 0.004  角度 2  画频率分布直方图  【 典例 】 2020 年 1 月 13 日 ,《 教育部关于在部分高校开展基础学科招生改革试点工作的意见 》 印发 , 决定自 2020 年起 , 在部分高校开展基础学科招生改革试点 , 也称强基计划 , 至此实施了 16 年的自主招生工作宣告结束 . 为了更好指导“强基计划”的实施 , 某高校对 2019 年该校自主招生的数据又做了新的研究 , 从考试成绩中随机抽取 100 名学生的笔试成绩 , 按成绩分组 , 得到如下表格 : 组号 分组 频数 频率 第 1 组 [160,165) 5 0.05 第 2 组 [165,170) ① 0.35 第 3 组 [170,175) 30 ② 第 4 组 [175,180) 20 0.20 第 5 组 [180,185] 10 0.10 合计 100 1.00 请先求出表格中①②处应填写的数据 , 并完成如图所示的频率分布直方图 . 【 思路导引 】 先根据表格中频数与频率的特点 , 计算表中数据 , 再根据表格列出频率分布直方图 . 【 解析 】 由题意可知 , 第 2 组的频数为 0.35×100=35, 第 3 组的频率为 =0.30, 故①处填 35,② 处填 0.30. 频率分布直方图如图所示 . 【 变式探究 】 本例中 , 若从中随机抽取 44 名考生的面试成绩如下 : 57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47, 55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48 请将数据进行适当的分组 , 并画出相应的频率分布直方图与频率折线图 . 【 解析 】 以 4 为组距 , 列表如下 : 分组 频数 频率 [41.5,45.5) 2 0.045 5 [45.5,49.5) 7 0.159 1 [49.5,53.5) 8 0.181 8 [53.5,57.5) 16 0.363 6 [57.5,61.5) 5 0.113 6 [61.5,65.5) 4 0.090 9 [65.5,69.5] 2 0.045 5 频率分布直方图如图所示 . 频率折线图如图所示 . 【 解题策略 】 绘制频率分布直方图的注意点 (1) 组距和组数的确定没有固定的标准 , 将数据分组时 , 组数力求合适 , 使数据的分布规律能较清楚地呈现出来 , 组数太多或太少 , 都会影响我们了解数据的分布情况 , 若样本容量不超过 120, 按照数据的多少常分为 5 ~ 12 组 , 一般样本容量越大 , 所分组数越多 . (2) 在坐标平面内画频率分布直方图时 , 横轴 = 样本数据 , 纵轴 = , 这样每一 组的频率可以用该组的组距为底、 为高的小矩形的面积来表示 . 其中 , 矩 形的高 = × 频数 . 【 题组训练 】 1. 一个容量为 80 的样本中数据的最大值是 140, 最小值是 51, 组距是 10, 则应将样本数据分为 (    ) A.10 组    B.9 组    C.8 组    D.7 组 【 解析 】 选 B. 极差为 140-51=89, 而组距为 10, 故应将样本数据分为 9 组 . 2. 为了了解学校高一年级男生的身高情况 , 选取一个容量为 60 的样本 (60 名男生 的身高 ), 分组情况如下 ( 单位 :cm): (1) 求出表中 a,m 的值 . (2) 画出频率分布直方图 . 分组 [147.5,155.5) [155.5,163.5) [163.5,171.5) [171.5,179.5] 频数 6 21 27 m 频率 a 0.1 【 解析 】 (1) 由题意得 :6+21+27+m=60, 所以 m=6. a= =0.45, 所以 a=0.45. (2) 作出频率分布直方图如图所示 . 类型三 频率分布直方图的应用 ( 直观想象、数学运算 ) 【 典例 】 2020 年春运期间为了了解旅客购票情况 , 某客运站随机抽查了部分旅客从开始在售票窗口排队到购到车票所用的时间 t( 以下简称为购票用时 , 单位为 min), 下面是这次调查统计分析得到的频率分布直方图 ( 如图所示 ). 已知购票用时在区间 内的频数为 10, 请解答下列问题 : (1) 这次抽样的样本容量是多少 ? (2) 分别求出购票用时在区间 内的频数与频率 , 并补全频 率分布直方图 ; (3) 春运前 , 客运总公司对春运工作做了明确要求 , 凡是旅客购票用时在 20( 含 20)min 以上的超过 20%, 为旅客轻微滞留 , 需各客运站点立即采取相应措施 . 如 果你是此客运站站长 , 面对今年的春运现状 , 你该怎么做 ? 【 思路导引 】 (1) 计算区间 内的频率 , 结合区间 内的频数求得样本 容量 ; (2) 由 (1) 中求得的样本容量以及频率分布直方图特征计算求解 ; (3) 旅客购票用时在 20( 含 20)min 以上的为 30%, 超过了 20%, 应增开购票窗口 . 【 解析 】 (1) 由频率分布直方图知 , 购票用时在区间 内的频率为 0.02× 5=0.1, 因为此区间内的频数为 10, 所以样本容量为 =100. (2) 因为购票用时在区间 内的频率分别为 0.1,0.5,0.3, 所 以购票用时在区间 内的频率为 1.00-0.30-0.50-0.10=0.10. 各区间的频 数依次为 10,10,50,30, 如表 : 所补频率分布直方图如图中的阴影部分 . (3) 旅客购票用时在 20( 含 20)min 以上的为 30%, 超过了 20%, 客运站点应立即采取相应措施 , 应当立即增开购票窗口 . 【 解题策略 】 频率分布直方图中的性质 (1) 因为小矩形的面积 = 组距 × = 频率 , 所以各小矩形的面积表示相应各组 的频率 . 这样 , 频率分布直方图就以面积的形式反映了数据落在各个小组内的频 率大小 . (2) 在频率分布直方图中各小矩形的面积之和等于 1. (3) = 样本容量 . (4) 在频率分布直方图中 , 各矩形的面积之比等于频率之比 , 各矩形的高度之比也等于频率之比 . 【 跟踪训练 】 为了研究某药品的疗效 , 选取若干名志愿者进行临床试验 , 所有志愿者的舒张压数据 ( 单位 :kPa) 的分组区间为 [12,13),[13,14),[14,15),[15,16),[16,17], 将其按从左到右的顺序分别编号为第一组 , 第二组 ,…, 第五组 , 如图是根据试验数据制成的频率分布直方图 . 已知第一组与第二组共有 20 人 , 第三组中没有疗效的有 6 人 , 则第三组中有疗效的人数为 (    ) A.6     B.8     C.12     D.18 【 解析 】 选 C. 志愿者的总人数为 =50, 所以第三组人数为 50× 0.36×1=18, 所以有疗效的人数为 18-6=12. 课堂检测 · 素养达标 1. 下列关于频率分布直方图的说法正确的是 (    ) A. 直方图的高表示取某数的频率 B. 直方图的高表示该组上的个体在样本中出现的频率 C. 直方图的高表示取该组上的个体在样本中出现的频数与组距的比值 D. 直方图的高表示取该组上的个体在样本中出现的频率与组距的比值 【 解析 】 选 D. 要注意频率分布直方图的特点 . 在直方图中 , 纵轴 ( 矩形的高 ) 表示频率与组距的比值 , 其相应组距上的频率等于该组距上的矩形的面积 . 2. 容量为 20 的样本数据 , 分组后的频数如表 : 则样本数据落在区间 [10,40) 的频率为 (    ) A.0.35     B.0.45     C.0.55     D.0.65 【 解析 】 选 B. 由表得样本数据落在区间 [10,40) 的频率为 =0.45. 分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70] 频数 2 3 4 5 4 2 3.( 教材二次开发 : 练习改编 ) 某棉纺厂为了解一批棉花的质量 , 从中随机抽测了 100 根棉花纤维的长度 ( 棉花纤维的长度是棉花质量的重要指标 ). 所得数据均在区间 [5,40] 中 , 其频率分布直方图如图所示 , 则在抽测的 100 根中 , 约有 _______ 根棉花纤维的长度小于 20 mm.  【 解析 】 由题意知 , 棉花纤维的长度小于 20 mm 的频率为 (0.01+0.01+0.04)× 5=0.3, 故抽测的 100 根中 , 棉花纤维的长度小于 20 mm 的约有 0.3×100=30( 根 ). 答案 : 30 4. 如图是某班 50 名学生期中考试数学成绩的频率分布直方图 , 其中成绩分组区间是 [40,50),[50,60),[60,70),[70,80),[80,90),[90,100], 则图中 x 的值等于      .  【 解析 】 由题干图可知纵坐标表示 , 故 x=0.1-0.054-0.010-0.006×3= 0.018. 答案 : 0.018