• 4.40 MB
  • 2021-07-01 发布

2018届二轮复习频率直方图、22列联表、茎叶图、线性回归方程课件(全国通用)

  • 49页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第十章 概率与统计 第 2 节 频率直方图、 2×2 列联表、茎叶图、线性回归方 考点 1: 茎叶图 【 例 1】 (2014 全国新课标 (Ⅱ)) 某市为了考核甲、乙两部门的工作情况 , 随机访问了 50 位市民 . 根据这 50 位市民评分情况有如下表 : 甲部门 乙部门 3 5   9 4 4 0   4   4   8 9   7 5 1   2   2   4   5   6   6   7   7   7   8   9 9   7   6   6   5   3   3   2   1   1   0 6 0   1   1   2   3   4   6   8   8 9   8   8   7   7   7   6   6   5   5   5   5   5   4   4   4   3   3   3   2   1   0   0 7 0   0   1   1   3   4   4   9 6   6   5   5   2   0   0 8 1   2   3   3   4   5 6   3   2   2   2   0 9 0   1   1   4   5   6 10 0   0   0 (1) 分别估计该市的市民对甲、乙部门评分的中位数 ; (2) 分别估计该市的市民对甲、乙部门的评分高于 90 的概率 ; (3) 根据茎叶图分析该市的市民对甲、乙两部门的评价 . 【 解析 】 (1) 由所给茎叶图知 ,50 位市民对甲部门的评分由小到大排序 , 排在第 25,26 位的是 75,75, 故样本中位数为 75, 所以该市的市民对甲部门评分的中位数的估计值是 75 . 50 位市民对乙部门的评分由小到大排序 , 排在第 25,26 位的是 66,68, 故样本中位数 为 =67, 所以该市的市民对乙部门评分的中位数的估计值是 67 . (2) 由所给茎叶图知 ,50 位市民对甲、乙部门的评分高于 90 的比率分别为 故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别为 0 . 1,0 . 16 . (3) 由所给茎叶图知 , 市民对甲部门的评分的中位数高于对乙部门的评分的中位数 , 而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差 , 说明该市市民对甲部门的评价较高、评价较为一致 , 对乙部门的评价较低、评价差异较大 . ( 注 : 利用其他统计量进行分析 , 结论合理的同样给分 . ) 考点 2:2×2 列联表 【 例 2】 为了解少年儿童的肥胖是否与常喝碳酸饮料有关 , 现对 30 名六年级学生进行了问卷调查得到如下 2×2 列联表 : 平均每天喝 500ml 以上为常喝 , 体重超过 50kg 为肥胖 . 已知在全部 30 人中随机抽取 1 人 , 抽到肥胖的学生的概率为 . (1) 请将上面的列联表补充完整 ; (2) 是否有 99 . 5% 的把握认为肥胖与常喝碳酸饮料有关 ? 说明你的理由 . (3) 现从常喝碳酸饮料且肥胖的学生中 ( 其中有 2 名为女生 ), 抽取 2 人参加电视节目 , 则正好抽到一男一女的概率是多少 ? 常喝 不常喝 合计 肥胖 2 不肥胖 18 合计 30 参考数据 : P ( K 2 ≥ k ) 0 . 15 0 . 10 0 . 05 0 . 025 0 . 010 0 . 005 0 . 001 k 2 . 072 2 . 706 3 . 841 5 . 024 6 . 635 7 . 879 10 . 828 常喝 不常喝 合计 肥胖 6 2 8 不胖 4 18 22 合计 10 20 30 【 解析 】 (1) 设常喝碳酸饮料且肥胖的学生有 x 人 , (2) 由已知数据可求得 : K 2 = ≈8 . 523>7 . 879, 因此有 99 . 5% 的把握认为肥胖与常喝碳酸饮料有关 . (3) 设常喝碳酸饮料的肥胖者男生为 A 、 B 、 C 、 D , 女生为 E 、 F , 则任取两人有 AB , AC , AD , AE , AF , BC , BD , BE , BF , CD , CE , CF , DE , DF , EF , 共 15 种 . 其中一男一女有 AE , AF , BE , BF , CE , CF , DE , DF. 故抽出一男一女的概率是 考点 3: 频率分布直方图 ( 中位数、平均数、众数、分层抽样 ) 【 例 3】 (2015 广东 ) 某城市 100 户居民的月平均用电量 ( 单位 : 度 ) 以 [160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300] 分组的频率分布直方图如图 . (1) 求直方图中 x 的值 ; (2) 求月平均用电量的众数和中位数 ; (3) 在月平均用电量为 [220,240),[240,260),[260,280),[280,300] 的四组用户中 , 用分层抽样的方法抽取 11 户居民 , 则月平均用电在 [220,240) 的用户中应抽取多少户 ? 【 解析 】 (1) 由题意知 ,(0 . 002+0.0025+0.005+ x +0.0095+0.011+0.0125)×20=1, ∴ x =0 . 0075 . (2) 由题意知 , 众数 : =230; 中位数 :∵[160,180),[180,200),[200,220), 三组所占的频率为 20×(0.002+0.0095+0.011)=0.45; [240,260),[260,280),[280,300) 三组所占的频率为 20×(0.0075+0.005+0.0025)=0.3, ∴ m ∈[220,240), 由中位数的性质知 :0 . 45+0.0125( m- 220)=0.0125(240-m)+0 . 3, ∴2 m =448, 即 m =224, 所以 , 中位数为 224 . (3) 由题意知 ,[220,240),[240,260),[260,280),[280,300) 这四组的频率之比为 : (20×0.0125)∶(20×0.0075)∶(20×0.005)∶(20×0.0025)=5∶3∶2∶1, 所以用分层抽样的方法从月平均用电量 [220,240) 的用户中应抽取 : ×11=5( 户 ). 年份 2010 2011 2012 2013 2014 时间代号 t 1 2 3 4 5 储蓄存款 y  ( 千亿元 ) 5 6 7 8 10 【 例 4】 (2015 重庆文科 ) 随着我国经济的发展 , 居民的储蓄存款逐年增长 . 设某地区城乡居民人民币储蓄存款 ( 年底余额 ) 如下表 : i t i y i t i y i 1 1 5 1 5 2 2 6 4 12 3 3 7 9 21 4 4 8 16 32 5 5 10 25 50 ∑ 15 36 55 120 【 解析 】 (1) 列表 : 1 . 为了解一片速生林的生长情况 , 随机测量了其中 100 株树木的底部周长根据所得数据画出样本的频率分布直方图 ( 如图 ), 那么在这 100 株树木中 , 底部周长不小于 110cm 的株数是 ( ) A.30 B.60 C.70 D.80 【 答案 】 A 2 . 某路段检查站监控录像显示 , 在某时间内 , 有 1000 辆汽车通过该站 , 现在随机抽取其中的 200 辆汽车进行车速分析 , 分析的结果表示为如图的频率分布直方图 , 则估计在这一时间段内通过该站的汽车中速度不小于 90km/h 的约有 ( ) A.100 辆 B.200 辆 C.300 辆 D.400 辆 【 答案 】 C 3 . 在一次马拉松比赛中 ,35 名运动员的成绩 ( 单位 : 分钟 ) 如图所示 : 若将运动员按成绩由好到差编为 1 ~ 35 号 , 再用系统抽样方法从中抽取 7 人 , 则其中成绩在区间 [139,151] 上的运动员人数为 ( ) A.3 B.4 C.5 D.6 【 答案 】 B x 3 4 5 6 7 8 y 4 . 0 2 . 5 - 0 . 5 0 . 5 - 2 . 0 - 3 . 0 5 . 从某地区 15000 位老人中随机抽取 500 人 , 其生活能否自理的情况如下表所示 : 估计该地区生活能自理的老人中男性比女性少 人 . 【 答案 】 3000 6 . (2015 全国新课标 (Ⅱ)) 某公司为了了解用户对其产品的满意度 , 从 A , B 两地区分别随机调查了 40 个用户 , 根据用户对其产品的满意度的评分 , 得到 A 地区用户满意度评分的频率分布直方图和 B 地区用户满意度评分的频率分布表 . A 地区用户满意度评分的频率分布直方图 B 地区用户满意度评分的频数分布表 满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频数 2 8 14 10 6 (1) 在答题卡上作出 B 地区用户满意度评分的频率分布直方图 , 并通过此图比较两地区满意度评分的平均值及分散程度 . ( 不要求计算出具体值 , 给出结论即可 ) 满意度评分 低于70分 70 分到 89 分 不低于90分 满意度等级 不满意 满意 非常满意 (2) 根据用户满意度评分 , 将用户的满意度评分分为三个等级 : 估计哪个地区的用户的满意度等级为不满意的概率大 , 说明理由 . 通过两个地区满意度评分的频率分布直方图可以看出 , B 地区的满意度评分的平均分值高于 A 地区用户满意度评分的平均分值 , B 地区的满意度评分比较集中 , 而 A 地区用户满意度评分比较分散 . (2) 记 C A 表示事件为 “ A 地区用户满意度等级为不满意 ” , 记 C B 表示事件为 “ B 地区用户满意度等级为不满意 ” 由直方图知 : P ( C A ) 的估值为 :(0 . 01+0.02+0.03)×10=0 . 6, P ( C B ) 的估值为 :(0 . 005+0.02)×10=0 . 25, P ( C A )> P ( C B ), 所以 A 地区的满意度等级为不满意的概率大 . 7 . (2015 福建理科 ) 某银行规定 , 一张银行卡若在一天内出现 3 次密码尝试错误 , 该银行卡将被锁定 , 小王到银行取钱时 , 发现自己忘记了银行卡的密码 , 但是可以确定该银行卡的正确密码是他常用的 6 个密码之一 , 小王决定从中不重复地随机选择 1 个进行尝试 . 若密码正确 , 则结束尝试 ; 否则继续尝试 , 直至该银行卡被锁定 . (1) 求当天小王的该银行卡被锁定的概率 ; (2) 设当天小王用该银行卡尝试密码次数为 X , 求 X 的分布列和数学期望 . 日需求量 n 14 15 16 17 18 19 20 频数 10 20 16 16 15 13 10 8 . (2012 全国新课标 (Ⅱ)) 某花店每天以每枝 5 元的价格从农场购进若干枝玫瑰花 , 然后以每枝 10 元的价格出售 . 如果当天卖不完 , 剩下的玫瑰花作垃圾处理 . (1) 若花店一天购进 17 枝玫瑰花 , 求当天的利润 y ( 单位 : 元 ) 关于当天需求量 n ( 单位 : 枝 , n ∈N) 的函数解析式 . (2) 花店记录了 100 天玫瑰花的日需求量 ( 单位 : 枝 ), 整理得下表 : ① 假设花店在这 100 天内每天购进 17 枝玫瑰花 , 求这 100 天的日利润 ( 单位 : 元 ) 的平均数 ; ② 若花店一天购进 17 枝玫瑰花 , 以 100 天记录的各需求量的频率作为各需求量发生的概率 , 求当天的利润不少于 75 元的概率 . 【 解析 】 (1) 当日需求量 n ≥17 时 , 利润 y= 85, 当日需求量 n <17 时 , 利润 y= 10 n- 85, 所以 y 关于 n 的函数解析式为 (2)① 这 100 天中有 10 天的日利润为 55 元 ,20 天的日利润为 65 元 ,16 天日利润为 75 元 ,54 天日利润为 85 元 , 所以这 100 天的日利润平均数为 : (55×10+65×20+75×16+85×54)=76.4( 元 ) ② 利润不低于 75 元当且仅当日需求量不少于 16 枝 , 所以利润不少于 75 元的概率 为 : p =0.16+0.16+0.15+0.13+0.1=0.7. 甲 乙 8   9 5  x  0 6   2 7 8 9 6 1   1  y 1   1   6 9.(2015 深圳五校联考 ) 某中学高三年级从甲 ( 文 ) 、乙 ( 理 ) 两个年级组各选出 7 名学生参加高校自主招生数学选拔考试 , 他们取得的成绩 ( 满分 100 分 ) 的茎叶图如图所示 , 其中甲组学生的平均分是 85, 乙组学生成绩的中位数是 83.( 茎叶图 ) (1) 求 x 和 y 的值 ; (2) 计算甲组 7 位学生成绩的方差 s 2 ; (3) 从成绩在 90 分以上的学生中随机抽取两名学生 , 求甲组至少有一名学生的概率 . 【 解析 】 (1)∵ 甲组学生的平均分是 85,∴ =85,∴ x =5. ∵ 乙组学生成绩的中位数是 83,∴ y =3 . (2) 甲组 7 位学生成绩的方差为 : s 2 = [(-6) 2 +(-7) 2 +(-5) 2 +0 2 +0 2 +7 2 +11 2 ]=40. (3) 甲组成绩在 90 分以上的学生有两名 , 分别记为 A , B , 乙组成绩在 90 分以上的学生有三名 , 分别记为 C , D , E. 从这五名学生任意抽取两名学生共有 10 种情况 : ( A , B ),( A , C ),( A , D ),( A , E ),( B , C ),( B , D ),( B , E ),( C , D ),( C , E ),( D , E ), 其中甲组至少有一名学生共有 7 种情况 : ( A , B ),( A , C ),( A , D ),( A , E ),( B , C ),( B , D ),( B , E ), 记 “ 从成绩在 90 分以上的学生中随机抽取两名学生 , 甲组至少有一名学生 ” 为事件 M , 则 P ( M )= 答 : 从成绩在 90 分以上的学生中随机抽取两名学生 , 甲组至少有一名学生的概率为 质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125) 频数 6 26 38 22 8 10 . (2014 全国新课标 (Ⅰ)) 从某企业生产的某种产品中抽取 100 件 , 测量这些产品的一项质量指标值 , 由测量表得如下频数分布表 : (1) 在答题卡上作出这些数据的频率分布直方图 : (2) 估计这种产品质量指标值的平均数及方差 ( 同一组中的数据用该组区间的中点值作代表 ); (3) 根据以上抽样调查数据 , 能否认为该企业生产的这种产品符合 “ 质量指标值不低于 95 的产品至少要占全部产品的 80% ” 的规定 ? (2) 质量指标值的样本平均数为 质量指标值的样本方差为 s 2 =(-20) 2 ×0.06+(-10) 2 ×0.26+0×0.38+10 2 ×0.22+20 2 ×0.08=104. 所以 , 这种产品质量指标的平均数估计值为 100, 方差的估计值为 104 . (3) 依题意 所以该企业生产的这种产品不符合 “ 质量指标值不低于 95 的产品至少要占全部 产品的 80% ” 的规定 . 11 . (2014 广州二模 ) 某校高三年级一次数学考试之后 , 为了解学生的数学学习情况 , 随机抽取 n 名学生的数学成绩 , 制成下表所示的频率分布表 . (1) 求 a , b , n 的值 ; (2) 若从第三、四、五组中用分层抽样方法抽取 6 名学生 , 并在这 6 名学生中随机抽取 2 名与张老师面谈 , 求第三组中至少有 1 名学生与张老师面谈的概率 . 组号 分组 频数 频率 第一组 [90,100) 5 0 . 05 第二组 [100,110) a 0 . 35 第三组 [110,120) 30 0 . 30 第四组 [120,130) 20 b 第五组 [130,140) 10 0 . 10 合 计 n 1 . 00 时间 周一 周二 周三 周四 周五 车流量 x ( 万辆 ) 50 51 54 57 58 PM2 . 5 的浓度 y ( 微克 / 立方米 ) 69 70 74 78 79 12 . ( 线性回归方程 )(2015 深圳二模文数 )PM2 . 5 是指空气中直径小于或等于 2 . 5 微米的 颗粒物 ( 也称可入肺颗粒物 ) . 为了探究车流量与 PM2 . 5 的浓度是否相关 , 现采集到某城市周一至周五某一时间段车流量与 PM2 . 5 的数据如下表 : (1) 根据上表数据 , 请在下列坐标系中画出散点图 ; (2) 根据上表数据 , 用最小二乘法求出 y 关于 x 的线性回归方程 ; (3) 若周六同一时间段车流量是 25 万辆 , 试根据 (2) 求出的线性回归方程预测 , 此时 PM2 . 5 的浓度为多少 ( 保留整数 )? 网购金额 ( 元 ) 频数 频率 (0,500] 5 0 . 05 (500,1000] x p (1000,1500] 15 0 . 15 (1500,2000] 25 0 . 25 (2000,2500] 30 0 . 3 (2500,3000] y q 合计 100 1 . 00 13 . (2015 年东北三省四市教研联合体高考模拟试卷 ( 一 ) 理 18)2014 年 7 月 16 日 , 中国互联网络信息中心发布 《 第三十四次中国互联网发展状况报告 》, 报告显示 : 我国网络购物用户已达 3 . 32 亿 . 为了了解网购者一次性购物金额情况 , 某统计部门随机抽查了 6 月 1 日这一天 100 名网购者的网购情况 , 得到如下数据统计表 . 已知网购金额在 2000 元以上 ( 不含 2000 元 ) 的频率为 0 . 4 . 网龄3年以上 网龄不足3年 合计 购物金额在2000元以上 35 购物金额在 2000 元以下 20 合计 100 ① 请将列联表补充完整 : ② 并据此列联表判断 , 是否有 97 . 5% 的把握认为网购金额超过 2000 元与网龄在三年以上有关 ? P ( K 2 ≥ k ) 0 . 15 0 . 10 0 . 05 0 . 025 0 . 010 0 . 005 0 . 001 k 2 . 072 2 . 706 3 . 841 5 . 024 6 . 635 7 . 879 10 . 828 参考数据 : 【 解析 】 (1) 因为网购金额在 2000 元以上的频率为 0 . 4, 所以网购金额在 2000 元以上的人数为 100×0.4=40, 所以 30+ y =40, 所以 y =10, x =15, 所以 p =0 . 15, q =0 . 1 . 所以频率分布直方图如图 : 网龄3年以上 网龄不足3年 合计 购物金额在 2000 元以上 35 5 40 购物金额在2000元以下 40 20 60 合计 75 25 100 (2)① 由题设列联表如下 考点 :1 . 频率分布直方图的应用 ;2 . 独立性检验的应用 . 所以据此列联表判断 , 有 97 . 5% 的把握认为网购金额超过 2000 元与网龄在三年以上有关 . 14 . 某种产品的质量以其质量指标值衡量 , 质量指标值越大表明质量越好 , 且质量指标值大于或等于 102 的产品为优质品 , 现用两种新配方 ( 分别称为 A 配方和 B 配方 ) 做试验 , 各生产了 100 件这种产品 , 并测试了每件产品的质量指标值 , 得到下面试验结果 : A 配方的频数分布表 B 配方的频数分布表 指标值分组 [90,94) [94,98) [98,102) [102,106) [106,110) 频数 8 20 42 22 8 指标值分组 [90,94) [94,98) [98,102) [102,106) [106,110) 频数 4 12 42 32 10 (1) 分别估计用 A 配方 , B 配方生产的产品的优质品率 ; (2) 已知用 B 配方生成的一件产品的利润 y ( 单位 : 元 ) 与其质量指标值 t 的关系式为 从用 B 配方生产的产品中任取一件 , 其利润记为 X ( 单位 : 元 ), 求 X 的分布列及数学期望 . ( 以实验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率 ) X - 2 2 4 P 0 . 04 0 . 54 0 . 42 【 解析 】 (1) 由实验结果知 , 用 A 配方生产的产品中优质品的频率为 所以用 A 配方生产的产品的优质品率的估计值为 0 . 3 . 由实验结果知 , 用 B 配方生产的产品中优质品的频率 所以用 B 配方生产的产品的优质品率的估计值为 0 . 42 . (2) 用 B 配方生产的 100 件产品中 , 其质量指标值落入区间 [90,94),[94,102), [102,110) 的频率分别为 0 . 04,0 . 54,0 . 42, 因此 P ( X =-2)=0.04, P ( X =2)=0.54, P ( X =4)=0.42, 即 X 的分布列为 X 的数学期望值 E ( X )=-2×0.04+2×0.54+4×0.42=2.68. 15 . (2016 高考全国 Ⅲ 卷 ) 下图是我国 2008 年至 2014 年生活垃圾无害化处理量 ( 单位 : 亿吨 ) 的折线图 . 注 : 年份代码 1 ~ 7 分别对应年份 2008 ~ 2014 . (1) 由折线图看出 , 可用线性回归模型拟合 y 与 t 的关系 , 请用相关系数加以说明 ; (2) 建立 y 关于 t 的回归方程 ( 系数精确到 0 . 01), 预测 2016 年我国生活垃圾无害化处理量 . 抽取次序 1 2 3 4 5 6 7 8 零件尺寸 9 . 95 10 . 12 9 . 96 9 . 96 10 . 01 9 . 92 9 . 98 10 . 04 抽取次序 9 10 11 12 13 14 15 16 零件尺寸 10 . 26 9 . 91 10 . 13 10 . 02 9 . 22 10 . 04 10 . 05 9 . 95 16 . (2017 高考全国 Ⅰ 卷 ) 为了监控某种零件的一条生产线的生产过程 , 检验员每隔 30min 从该生产线上随机抽取一个零件 , 并测量其尺寸 ( 单位 :cm) . 下面是检验员在一天内依次抽取的 16 个零件的尺寸 : (1) 求 ( x i , i )( i= 1,2, … ,16) 的相关系数 r , 并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小 ( 若 | r |<0 . 25, 则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小 ) . (2) 一天内抽检零件中 , 如果出现了尺寸在 之外的零件 , 就认为这条生产线在这一天的生产过程可能出现了异常情况 , 需对当天的生产过程进行检查 . ① 从这一天抽检的结果看 , 是否需对当天的生产过程进行检查 ? ② 在 之外的数据称为离群值 , 试剔除离群值 , 估计这条生产线当天生产的零件尺寸的均值与标准差 . ( 精确到 0 . 01)