• 1.58 MB
  • 2021-06-20 发布

2018届二轮复习(文)专题六统计与概率

  • 36页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
6.2  统计与概率大题 - 2 - - 3 - - 4 - - 5 - - 6 - 1 . 统计图表 (1) 在频率分布直方图中 : ① 各小矩形的面积表示相应各组的频率 , 各小矩形的高 = ; ② 各小矩形面积之和等于 1 . (2) 茎叶图 : 当数据是两位数时 , 用中间的数字表示十位数 , 两边的数字表示个位数 ; 当数据是三 位数 时 , 前两位相对比较集中时 , 常以前两位为茎 , 第三位 ( 个位 ) 为叶 ( 其余类推 ) . - 7 - 2 . 样本的数字特征 (1) 众数 : 是指出现次数最多的数 , 体现在频率分布直方图中 , 是指高度最高的小矩形的宽的中点的横坐标 ; (2) 中位数是指从左往右小矩形的面积之和为 0 . 5 处的横坐标 ; - 8 - 3 . 变量间的相关关系 (1) 如果散点图中的点从整体上看大致分布在一条直线的附近 , 那么我们说变量 x 和 y 具有线性相关关系 . (2) 线性回归方程 : 若变量 x 与 y 具有线性相关关系 , 有 n 个样本数据 相关 ; 当 r< 0 时 , 表示两个变量负相关 .|r| 越接近 1, 表明两个变量相关性越强 ; 当 |r| 接近 0 时 , 表明两个变量几乎不存在相关性 . - 9 - 4 . 独立性检验 对于取值分别是 { x 1 , x 2 } 和 { y 1 , y 2 } 的分类变量 X 和 Y , 其样本频数列联表是 : - 10 - 5 . 概率 的 五个 基本性质 (1) 随机事件的概率 :0 ≤ P ( A ) ≤ 1; 必然事件的概率是 1; 不可能事件的概率是 0 . (2) 若事件 A , B 互斥 , 则 P ( A ∪ B ) =P ( A ) +P ( B ) . (3) 若事件 A , B 对立 , 则 P ( A ∪ B ) =P ( A ) +P ( B ) = 1 . 6 . 两种常见的概率模型 (1) 古典概型 : ① 特点为有限性 , 等可能性 ; (2) 几何概型 : ① 特点为无限性 , 等可能性 ; - 11 - 7 . 求复杂的互斥事件的概率的两种方法 (1) 直接法 : 将所求事件的概率分解为一些彼此互斥的事件的概率的和 , 运用互斥事件的求和公式 . (2) 间接法 : 先求此事件的对立事件的概率 , 再用公式 P ( A ) = 1 -P ( ), 特别是 “ 至多 ”“ 至少 ” 型题目 , 用间接法简便 . 6 . 2 . 1   统计与统计案例 - 13 - 考向一 考向二 考向三 样本的数字特征的应用 例 1 (2017 全国 Ⅰ , 文 19) 为了监控某种零件的一条生产线的生产过程 , 检验员每隔 30 min 从该生产线上随机抽取一个零件 , 并测量其尺寸 ( 单位 :cm) . 下面是检验员在一天内依次抽取的 16 个零件的尺寸 : - 14 - 考向一 考向二 考向三 其中 x i 为抽取的第 i 个零件的尺寸 , i= 1,2,…,16 . (1) 求 ( x i , i )( i= 1,2,…,16) 的相关系数 r , 并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小 ( 若 |r|< 0 . 25, 则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小 ) . - 15 - 考向一 考向二 考向三 (2) 一天内抽检零件中 , 如果出现了尺寸 在 之外 的零件 , 就认为这条生产线在这一天的生产过程可能出现了异常情况 , 需对当天的生产过程进行检查 . ( ⅰ ) 从这一天抽检的结果看 , 是否需对当天的生产过程进行检查 ? ( ⅱ ) 在 之外 的数据称为离群值 , 试剔除离群值 , 估计这条生产线当天生产的零件尺寸的均值与标准差 . ( 精确到 0 . 01) - 16 - 考向一 考向二 考向三 解 (1) 由样本数据得 ( x i , i )( i= 1,2, … ,16) 的相关系数 为 由于 |r|< 0 . 25, 因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小 . - 17 - 考向一 考向二 考向三 (2)( ⅰ ) 由于 = 9 . 97, s ≈0 . 212, 由样本数据可以看出抽取的第 13 个零件的尺寸 在 以外 , 因此需对当天的生产过程进行检查 . ( ⅱ ) 剔除离群值 , 即第 13 个数据 , 剩下数据的平均数为 这条生产线当天生产的零件尺寸的均值的估计值 为 - 18 - 考向一 考向二 考向三 解题心得 (1) 在预测总体数据的平均值时 , 常用样本数据的平均值估计 , 从而做出合理的判断 . (2) 平均数反映了数据取值的平均水平 , 标准差、方差描述了一组数据围绕平均数波动的大小 . 标准差、方差越大 , 数据的离散程度越大 , 越不稳定 . - 19 - 考向一 考向二 考向三 对点训练 1 (2017 吉林东北师大附中三模 , 文 18) 学校为了了解 A,B 两个班级学生在本学期前两个月内观看电视节目的时长 , 分别从这两个班级中随机抽取 10 名学生进行调查 , 得到他们观看电视节目的时长 ( 单位 : 小时 ) 如下 . A 班 :5,5,7,8,9,11,14,20,22,31;B 班 :3,9,11,12,21,25,26,30,31,35 . 将上述数据作为样本 . (1) 绘制茎叶图 , 并从所绘制的茎叶图中提取样本数据信息 ( 至少写出 2 条 ); (2) 分别求样本中 A,B 两个班级学生的平均观看时长 , 并估计哪个班级的学生平均观看的时间较长 ; (3) 从 A 班的样本数据中随机抽取一个不超过 11 的数据记为 a , 从 B 班的样本数据中随机抽取一个不超过 11 的数据记为 b , 求 a>b 的概率 . - 20 - 考向一 考向二 考向三 解 (1) 茎叶图如下 ( 图中的茎表示十位数字 , 叶表示个位数字 ): 从茎叶图中可看出 ( 答案不唯一 ): ② A 班叶的分布是单峰的 ,B 班叶的分布基本上是对称的 ; ③ A 班数据的中位数是 10,B 班数据的中位数是 23 . - 21 - 考向一 考向二 考向三 (2)A 班样本数据的平均值 为 (3)A 班的样本数据中不超过 11 的数据 a 有 6 个 , 分别为 5,5,7,8,9,11;B 班的样本数据中不超过 11 的数据 b 有 3 个 , 分别为 3,9,11 . 从上述 A 班和 B 班的数据中各随机抽取一个 , 记为 ( a , b ), 分别为 (5,3),(5,9),(5,11),(5,3),(5,9),(5,11),(7,3),(7,9),(7,11),(8,3),(8,9),(8,11),(9,3),(9,9),(9,11),(11,3),(11,9),(11,11), 共 18 种 , 其中 a>b 的有 (5,3),(5,3),(7,3),(8,3),(9,3),(11,3),(11,9), 共 7 种 . 故 a>b 的概率为 P = . - 22 - 考向一 考向二 考向三 利用回归方程进行回归分析 例 2 下图是我国 2008 年至 2014 年生活垃圾无害化处理量 ( 单位 : 亿吨 ) 的折线图 . 注 : 年份代码 1 - 7 分别对应年份 2008 - 2014 . (1) 由折线图看出 , 可用线性回归模型拟合 y 与 t 的关系 , 请用相关系数加以说明 ; - 23 - 考向一 考向二 考向三 (2) 建立 y 关于 t 的回归方程 ( 系数精确到 0 . 01), 预测 2018 年我国生活垃圾无害化处理量 . 附注 : - 24 - 考向一 考向二 考向三 解 (1) 由折线图中数据和附注中参考数据 得 因为 y 与 t 的相关系数近似为 0 . 99, 说明 y 与 t 的线性相关程度相当高 , 从而可以用线性回归模型拟合 y 与 t 的关系 . - 25 - 考向一 考向二 考向三 所以预测 2018 年我国生活垃圾无害化处理量将约为 2 . 02 亿吨 . 解题心得 在求两变量相关系数和两变量的回归方程时 , 由于 r 和的 公式比较复杂 , 求它的值计算量比较大 , 为了计算准确 , 可将这个量分成几个部分分别计算 , 最后再合成 , 这样等同于分散难点 , 各个攻破 , 提高了计算的准确度 . - 26 - 考向一 考向二 考向三 对点训练 2 (2017 湖北武汉五月调考 , 文 19) 据某市地产数据研究显示 ,2016 年该市新建住宅销售均价走势如下图所示 ,3 月至 7 月房价上涨过快 , 为抑制房价过快上涨 , 政府从 8 月开始采用宏观调控措施 ,10 月份开始房价得到很好的抑制 . (1) 地产数据研究院发现 ,3 月至 7 月的各月均价 y ( 单位 : 万元 / 平方米 ) 与月份 x 之间具有较强的线性相关关系 , 试建立 y 关于 x 的回归方程 ; - 27 - 考向一 考向二 考向三 (2) 若政府不调控 , 依此相关关系预测第 12 月份该市新建住宅销售均价 . - 28 - 考向一 考向二 考向三 解 (1) 由题意 , 得下表 : (2) 利用 (1) 中回归方程 , 计算当 x= 12 时 , 故可预测第 12 月份该市新建住宅销售均价为 1 . 52 万元 / 平方米 . - 29 - 考向一 考向二 考 向 三 有关独立性检验的综合问题 例 3 (2017 全国 Ⅱ , 文 19) 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比 , 收获时各随机抽取了 100 个网箱 , 测量各箱水产品的产量 ( 单位 :kg), 其频率分布直方图如下 : 旧养殖 法 新 养殖法 - 30 - 考向一 考向二 考 向 三 (1) 记 A 表示事件 “ 旧养殖法的箱产量低于 50 kg”, 估计 A 的概率 ; (2) 填写下面列联表 , 并根据列联表判断是否有 99% 的把握认为箱产量与养殖方法有关 ; (3) 根据箱产量的频率分布直方图 , 对这两种养殖方法的优劣进行比较 . - 31 - 考向一 考向二 考 向 三 解 (1) 旧养殖法的箱产量低于 50 kg 的频率为 (0 . 012 + 0 . 014 + 0 . 024 + 0 . 034 + 0 . 040) × 5 = 0 . 62 . 因此 , 事件 A 的概率估计值为 0 . 62 . (2) 根据箱产量的频率分布直方图得列联表 由于 15 . 705 > 6 . 635, 故有 99% 的把握认为箱产量与养殖方法有关 . - 32 - 考向一 考向二 考 向 三 (3) 箱产量的频率分布直方图表明 : 新养殖法的箱产量平均值 ( 或中位数 ) 在 50 kg 到 55 kg 之间 , 旧养殖法的箱产量平均值 ( 或中位数 ) 在 45 kg 到 50 kg 之间 , 且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高 , 因此 , 可以认为新养殖法的箱产量较高且稳定 , 从而新养殖法优于旧养殖法 . 解题心得 有关独立性检验的问题解题步骤 :(1) 作出 2 × 2 列联表 ;(2) 计算随机变量 K 2 的值 ;(3) 查临界值 , 检验作答 . - 33 - 考向一 考向二 考 向 三 对点训练 3 (2017 宁夏银川二模 , 文 18) 某单位 N 名员工参加 “ 我爱阅读 ” 活动 , 他们的年龄在 25 岁至 50 岁之间 , 按年龄分组 : 第 1 组 [25,30), 第 2 组 [30,35), 第 3 组 [35,40), 第 4 组 [40,45), 第 5 组 [45,50], 得到的频率分布直方图如图所示 . (1) 求正整数 a , b , N 的值 ; (2) 现要从年龄低于 40 岁的员工中用分层抽样的方法抽取 42 人 , 则年龄在第 1,2,3 组的员工人数分别抽取多少 ? - 34 - 考向一 考向二 考 向 三 (3) 为了估计该单位员工的阅读倾向 , 现对该单位所有员工中按性别比例抽查的 40 人是否喜欢阅读国学类书籍进行了调查 , 调查结果如下所示 :( 单位 : 人 ) 下面是年龄的分布表 : - 35 - 考向一 考向二 考 向 三 根据表中数据 , 我们能否有 99% 的把握认为该单位员工是否喜欢阅读国学类书籍和性别有关系 ? 第 3 组的频率是 1 - 5 × (0 . 02 + 0 . 02 + 0 . 06 + 0 . 02) = 0 . 4, 所以 b= 280 × 0 . 4 = 112 . - 36 - 考向一 考向二 考 向 三 (2) 因为年龄低于 40 岁的员工在第 1,2,3 组 , 共有 28 + 28 + 112 = 168( 人 ), 利用分层抽样在 168 人中抽取 42 人 , 每组抽取的人数分别为 : 所以第 1,2,3 组分别抽 7 人、 7 人、 28 人 . (3) 假设 H 0 :“ 是否喜欢阅读国学类书籍和性别无关 ”, 根据表中数据 , 求得 K 2 的观测值 k = ≈ 6 . 860 5 > 6 . 635, 查表得 P ( K 2 ≥ 6 . 635) = 0 . 01, 从而能有 99% 的把握认为该单位员工是否喜欢阅读国学类书籍和性别有关系 .