• 314.00 KB
  • 2021-06-19 发布

高考数学一轮复习练案73第十章统计统计案例第三讲变量间的相关关系统计案例含解析

  • 11页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
- 1 - [练案 73]第三讲 变量间的相关关系、统计案例 A 组基础巩固 一、单选题 1.观察下列各图形, 其中两个变量 x,y 具有相关关系的图是( C ) A.①②  B.①④  C.③④  D.②③ [解析] 由散点图知③中的点都分布在一条直线附近.④中的点都分布在一条曲线附近, 所以③④中的两个变量具有相关关系. 2.(2019·广西柳州模拟)根据如下样本数据 x 3 4 5 6 7 8 y 4.0 2.5 -0.5 0.5 -2.0 -3.0 得到了回归方程 y^ =bx+a,则( C ) A.a>0,b>0   B.a<0,b>0 C.a>0,b<0   D.a<0,b<0 [解析] 由表格数据可知 y 与 x 是负相关关系,所以 b<0,且当 x=0 时,y>0,所以 a>0,故选 C. 3.(2019·山东师大附中模拟)为了规定工时定额,需要确定加工零件所花费的时间,为 此进行了 5 次试验,得到 5 组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),根据 收集到的数据可知 x1+x2+x3+x4+x5=150,由最小二乘法求得回归直线方程为 y^ =0.67x+ 24.9,则 y1+y2+y3+y4+y5=( C ) A.45  B.125.4  C.225  D.350.4 [解析] 因为 x1+x2+x3+x4+x5=150,所以x= x1+x2+x3+x4+x5 5 = 150 5 =30.又因为 (30,y)在回归直线y ^ =0.67x+24.9 上,将(30,y)代入y ^ =0.67x+24.9,可求得y=45= y1+y2+y3+y4+y5 5 ,所以 y1+y2+y3+y4+y5=225,故选 C. 4.(2020·西北狼联盟质检)广告投入对商品的销售额有较大影响,某电商对连续 5 个年 - 2 - 度的广告费 x 和销售额 y 进行统计,得到统计数据如下表(单位:万元) 广告费 x 2 3 4 5 6 销售额 y 29 41 50 59 71 由上表可得回归方程y ^ =10.2x+a ^ ,据此模型,预测广告费为 10 万元时销售额约为 ( B ) A.118.2 万元   B.111.2 万元 C.108.8 万元   D.101.2 万元 [解析] 由表格中数据可得,x=4,y=50, ∴50=4×10.2+a ^ ,解得a ^ =9.2, ∴回归方程为y ^ =10.2x+9.2, ∴当 x=10 时,y ^ =10.2×10+9.2=111.2, 即预测广告费 10 万元时销售额约为 111.2,故选 B. 5.(2019·沧州七校联考)通过随机询问 200 名性别不同的大学生是否爱好踢毽子运动, 计算得到统计量 K2 的观测值 k≈4.892,参照附表,得到的正确结论是( C ) P(K2≥k) 0.10 0.05 0.025 k 2.706 3.841 5.024 A.有 97.5%以上的把握认为“爱好该项运动与性别有关” B.有 97.5%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过 5%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过 5%的前提下,认为“爱好该项运动与性别无关” 6.(2019·河南商丘)某医疗所为了检查新开发的流感疫苗对甲型 H1N1 流感的预防作用, 把 1 000 名注射疫苗的人与另外 1 000 名未注射疫苗的人半年的感冒记录作比较,提出假设 H0: “这种疫苗不能起到预防甲型 H1N1 流感的作用”,并计算得P(K2≥6.635)≈0.01,则下列说 法正确的是( C ) A.这种疫苗能起到预防甲型 H1N1 流感的有效率为 1% B.若某人未使用疫苗则他在半年中有 99%的可能性得甲型 H1N1 流感 C.有 99%的把握认为“这种疫苗能起到预防甲型 H1N1 流感的作用” D.有 1%的把握认为“这种疫苗能起到预防甲型 H1N1 流感的作用” [解析] 因为 P(K2≥6.635)≈0.01,这说明假设不合理的程度为 99%,即这种疫苗不能起 到预防甲型 H1N1 流感的作用不合理的程度约为 99%,所以有 99%的把握认为“这种疫苗能起 到预防甲型 H1N1 流感的作用”,故选 C. 7.(2020·吉林省吉林市调研)对两个变量进行回归分析,给出如下一组样本数据:(0.675, - 3 - -0.989),(1.102,-0.010),(2.899,1.024),(9.101,2.978),下列函数模型中拟合较好 的是( D ) A.y=3x   B.y=3x C.y=-(x-1)2   D.y=log3x [解析] 如图,作出 A,B,C,D 中四个函数图象, 同时描出题中的四个点,它们在曲线 y=log3x 的两侧,与其他三个曲线都离得很远,因 此 D 是正确选项,故选 D. 二、多选题 8.某车间为了规划生产进度提高生产效率,记录了不同时段生产零件个数 x(单位:百个) 与相应加工总时长 y(单位:小时)的几组对应数据,根据表中提供的数据,求出 y 关于 x 的线 性回归方程为 y^ =0.7x+0.05,则下列结论正确的是( ABC ) x 2 3 4 5 y 1.5 2 m 3.5 A.加工总时长与生产零件数呈正相关 B.该回归直线一定过点(3.5,2.5) C.零件每增加 1 百个,相应加工总时长约增加 0.7 小时 D.m 的值是 2.85 [解析] 依题意,对于 A,注意到 0.7>0,因此加工总时长与生产零件数呈正相关,选项 A 正确;对于 B,当 x=3.5 时,y=0.7×3.5+0.05=2.5,因此回归直线一定过点(3.5,2.5), 选项 B 正确;对于 C,易知零件每增加 1 百个,相应加工总时长约增加 0.7 小时,因此选项 C 正确;回归直线必过样本点的中心,x= 2+3+4+5 4 =3.5,于是有y= 1.5+2+m+3.5 4 =2.5, 由此解得 m=3,因此选项 D 不正确.故选 A、B、C. 9.(2020·山东日照联考)某大学进行自主招生测试,需要对逻辑思维和阅读表达进行能 力测试.学校对参加测试的 200 名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩 进行了排名.其中甲、乙、丙三位同学的排名情况如图所示,下列叙述正确的是( AC ) - 4 - A.甲同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前 B.乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前 C.甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前 D.甲同学的总成绩排名比丙同学的总成绩排名更靠前 [解析] 根据图示,可得甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前, 他的阅读表达成绩排名靠后.故选 AC. 10.(2020·山东烟台期末)某大学为了解学生对学校食堂服务的满意度,随机调查了 50 名男生和 50 名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如图所示的列联 表.经计算 K2 的观测值 k≈4.762,则可以推断出( ACD ) 满意 不满意 男 30 20 女 40 10 P(k2≥k) 0.100 0.050 0.010 k 2.706 3.841 6.635 A.该学校男生对食堂服务满意的概率的估计值为 3 5 B.调研结果显示,该学校男生比女生对食堂服务更满意 C.有 95%的把握认为男、女生对该食堂服务的评价有差异 D.在犯错概率不超过 5%的前提下认为男、女生对该食堂服务的评价有差异 [ 解 析 ]   由 表 易 知 男 生 比 女 生 对 食 堂 服 务 满 意 率 低 , 故 B 错 , 又 K2 = 100 × 30 × 10-40 × 202 70 × 30 × 50 × 50 ≈4.8>3.841,∴ACD 正确. 三、填空题 11.关于独立性检测,K2 越大,则“X 与 Y 有关系”这种判断犯错的概率__越小__. 12.(2019·吉林市五地六校适应性考试)公司对 2019 年 1~4 月份的获利情况进行了数 据统计,如下表所示: 月份 x 1 2 3 4 - 5 - 利润 y/万元 5 6 6.5 8 利用线性回归分析思想,预测出 2019 年 8 月份的利润为 11.6 万元,则 y 关于 x 的线性 回归方程为  y^ =0.95x+4 . [解析] 设线性回归方程为 y^ =b ^ x+ a^ , 因为 x- = 5 2, y- = 51 8 , 由题意可得Error!,解得b ^ =0.95, a^ =4, 即 y^ =0.95x+4.故答案为 y^ =0.95x+4. 四、解答题 13.(2020·唐山模拟)随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网 站为增加收入,促销策略越来越多样化,促销费用也不断增加,下表是某购物网站 2017 年 1- 8 月促销费用 x(万元)和产品销量 y(万件)的具体数据. 月份 1 2 3 4 5 6 7 8 促销费用 x 2 3 6 10 13 21 15 18 产品销量 y 1 1 2 3 3.5 5 4 4.5 (1)根据数据绘制的散点图能够看出可用线性回归模型拟合 y 与 x 的关系,请用相关系数 r 加以说明;(系数精确到 0.001) (2)建立 y 关于 x 的回归方程 y^ =b ^ x+ a^ (系数精确到 0.01),如果该公司计划在 9 月份实 现产品销量超 6 万件,预测至少需投入促销费用多少万元.(结果精确到 0.01) 参考数据: ∑ 8 i=1 (xi-11)(yi-3)=74.5, ∑ 8 i=1 (xi-11)2=340, ∑ 8 i=1 (yi-3)2=16.5, 340≈18.44, 16.5=4.06,其中 xi,yi 分别为第 i 个月的促销费用和产品销量,i= 1,2,3,…,8. 参 考 公 式 : (i) 样 本 (xi , yi)(i = 1,2 , … , n) 的 相 关 系 数 r = ∑ n i=1 xi-xyi-y ∑ n i=1 xi-x2 ∑ n i=1 yi-y2 . (ii)对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程 y^ =b ^ x+ a^ 的斜率和 截距的最小二乘估计分别为b ^ = ∑ n i=1 xi-xyi-y ∑ n i=1 xi-x2 , a^ =y-b ^ x- . - 6 - [解析] (1)由题可知 x- =11, y- =3, 将数据代入 r= ∑ n i=1 xi-xyi-y ∑ n i=1 xi-x2 ∑ n i=1 yi-y2 , 得 r≈ 74.5 18.44 × 4.06= 74.5 74.866 4≈0.995. 因为 y 与 x 的相关系数近似为 0.995,说明 y 与 x 的线性相关性很强,从而可以用线性回 归模型拟合 y 与 x 的关系.(需要突出“很强”,“一般”或“较弱”不给分) (2)将数据代入b ^ = ∑ n i=1 xi-xyi-y ∑ n i=1 xi-x2 , 得b ^ = 74.5 340 =0.219, a^ =y-b ^ x- =3-0.219×11≈0.59, 所以 y 关于 x 的回归方程为 y^ =0.22x+0.59. 由 y^ =0.22x+0.59>6,解得 x>24.59, 即至少需要投入促销费用 24.59 万元. 14.(2020·山东潍坊期末)读书可以使人保持思想活力,让人得到智慧启发,让人滋养 浩然正气.书籍是文化的重要载体.读书是承继文化的重要方式.某地区为了解学生课余时 间的读书情况.随机抽取了 n 名学生进行调查,根据调查得到的学生日均课余读书时间绘制 成如图所示的频率分布直方图,将日均课余读书时间不低于 40 分钟的学生称为“读书之星”, 日均课余读书时间低于 40 分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书 时间低于 10 分钟的有 10 人. (1)求 n,p 的值; (2)根据已知条件完成下面的 2×2 列联表,并判断是否有 95%以上的把握认为“读书之星” 与性别有关? - 7 - 非读书之星 读书之星 总计 男 女 10 55 总计 (3)将上述调查所得到的频率视为概率,现从该地区大量学生中,随机抽取 3 名学生,每 次抽取 1 名,已知每个人是否被抽到互不影响,记被抽取的“读书之星”人数为随机变量 X, 求 X 的分布列和期望 E(X). 附:K2= nad-bc2 a+bc+da+cb+d,其中 n=a+b+c+d. P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.706 3.841 5.024 6.635 7.879 10.828 [解析] (1)由频率分布直方图可知,p=0.01, 所以 n= 10 0.1=100. (2)因为 n=100, 所以“读书之星”有 100×0.25=25, 从而 2×2 列联表如下图所示: 非读书之星 读书之星 总计 男 30 15 45 女 45 10 55 总计 75 25 100 将 2×2 列联表中的数据代入公式计算得 K2= 100 × 30 × 10-15 × 452 45 × 55 × 75 × 25 = 100 33 ≈3.030, 因为 3.030<3.841,所以没有 95%以上的把握认为“读书之星”与性别有关. (3)将频率视为概率,即从该地区学生中抽取一名学生是“读书之星”的概率为 1 4, 由题意可知 X~B(3, 1 4), 所以 P(X=0)=C03( 1 4)0×(1- 1 4)3= 27 64, P(X=1)=C13× 1 4×(1- 1 4)2= 27 64, P(X=2)=C23( 1 4)2×(1- 1 4)= 9 64, P(X=3)=C33×( 1 4)3= 1 64, - 8 - 所以 X 的分布列为 X 0 1 2 3 P 27 64 27 64 9 64 1 64 故 E(X)=3× 1 4= 3 4. B 组能力提升 1.(2020·西安模拟)以模型 y=cekx 去拟合一组数据时,为了求出回归方程,则 z=ln y,其变换后得到线性回归方程 z=0.3x+4,则 c=( D ) A.0.3  B.e0.3  C.4  D.e4 [解析] z=ln y=ln(cekx)=ln c+kx,因为 z=0.3x+4,所以 ln c=4,则 c=e4.故选 D. 2.(2019·湖南师大附中模拟)在西非肆虐的“埃博拉病毒”的传播速度很快,已经成为 全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取 100 只小鼠进行试验,得 到如下列联表: 感染 未感染 总计 服用 10 40 50 未服用 20 30 50 总计 30 70 100 参考公式:K2= nad-bc2 a+bc+da+cb+d P(K2>k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 参照附表,在犯错误的概率最多不超过 5% (填百分比)的前提下,可认为“该种疫苗 有预防埃博拉病毒感染的效果”. [解析] 由题意可得,K2= 100 × 10 × 30-20 × 402 50 × 50 × 30 × 70 ≈4.762>3.841,参照附表 可得,在犯错误的概率不超过 5%的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效 果”. 3.(2019·赣州模拟)在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若 所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2- 1 3附近波动,经计算 ∑ 6 i=1xi=11, ∑ 6 i=1yi= 13, ∑ 6 i=1x2i=21,则实数 b 的值为  5 7 . - 9 - [解析] 令 t=x2,则曲线的回归方程变为线性的回归方程,即 y=bt- 1 3,此时t= ∑ 6 i=1x2i 6 = 7 2,y= ∑ 6 i=1yi 6 = 13 6 ,代入 y=bt- 1 3,得 13 6 =b× 7 2- 1 3,解得 b= 5 7. 4.(2019·福建龙岩、漳州模拟)某手机厂商在销售 200 万台某型号手机时开展“手机碎 屏险”活动.活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x 元.若 在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这 200 万台该型号手机全部 销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取 1000 名,每名 用户赠送 1000 元的红包.为了合理确定保费 x 的值,该手机厂商进行了问卷调查,统计后得 到下表(其中 y 表示保费为 x 元时愿意购买该“手机碎屏险”的用户比例): x 10 20 30 40 50 y 0.79 0.59 0.38 0.23 0.01 (1)根据上面的数据求出 y 关于 x 的回归直线方程; (2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为 0.2%.已知更换一次该型号手机屏幕的费用为 2 000 元,若该手机厂商要求在这次活动中因销 售该“手机碎屏险”产生的利润不少于 70 万元,能否把保费 x 定为 5 元? 参 考 公 式 : 回 归 方 程 y = bx + a 中 斜 率 和 截 距 的 最 小 二 乘 估 计 分 别 为 b ^ = ∑n i=1 xi- x- yi- y-  ∑n i=1 xi- x- 2 , a^ = y- -b ^ x- . 参考数据:表中 x 的 5 个值从左到右分别记为 x1,x2,x3,x4,x5,相应的 y 值分别记为 y1,y2,y3,y4,y5,经计算有 5 ∑ i=1 (xi- x- )(yi- y- )=-19.2, 其中 x- = 1 5 5 ∑ i=1 xi, y- = 1 5 5 ∑ i=1 yi. [解析] (1)由 x- =30, y- =0.4, 5 ∑ i=1 (xi- x- )(yi- y- )=-19.2, 5 ∑ i=1 (xi- x- )2=1 000, 得b ^ = ∑5 i=1 xi- x- yi- y-  ∑5 i=1 xi- x- 2 =-0.019 2, a^ = y- -b ^ x- =0.976, - 10 - 所以 y 关于 x 的回归直线方程为 y=-0.019 2x+0.976. (2)能把保费 x 定为 5 元. 理由如下:若保费 x 定为 5 元,则估计 y=-0.019 2×5+0.976=0.88 估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的利润为 2 000 000×0.88×5-2 000 000×0.88×0.2%×2 000-1 000×1 000=0.76×106(元)= 76(万元)>70(万元) 所以能把保费 x 定为 5 元. 5.(2020·百校联盟(全国Ⅰ卷)教质监)为了响应国家号召,某校组织部分学生参与了“垃 圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类, 统计如下所示. (1)是否有 90%以上的把握认为“性别”与“问卷的结果”有关? (2)在成绩合格的学生中,利用性别进行分层抽样,共选取 9 人进行座谈,再从这 9 人中 随机抽取 5 人发送奖品,记拿到奖品的男生人数为 X,求 X 的分布列及数学期望 E(X). 不合格 合格 男生 14 16 女生 10 20 参考公式:K2= nad-bc2 a+bc+da+cb+d,其中 n=a+b+c+d. 参考数据: P(K2≥k0) 0.10 0.05 0.010 0.001 k0 2.706 3.841 6.635 10.828 [解析] (1)完善列联表如下所示: 不合格 合格 男生 14 16 30 女生 10 20 30 合计 24 36 60 ∴K2= 60 × 14 × 20-10 × 162 30 × 30 × 24 × 36 ≈1.111<2.706, 故没有 90%的把握认为“性别”与“问卷的结果”有关. (2)依题意,成绩合格的男生抽取 4 人,成绩合格的女生抽取 5 人, 故 X 的可能取值为 0,1,2,3,4, - 11 - P(X=0)= C55 C59= 1 126, P(X=1)= C45C14 C59 = 20 126= 10 63, P(X=2)= C35C24 C59 = 60 126= 10 21, P(X=3)= C25C34 C59 = 40 126= 20 63, P(X=4)= C15C44 C59 = 5 126, 故 X 的分布列为: X 0 1 2 3 4 P 1 126 10 63 10 21 20 63 5 126 所以 E(X)=0× 1 126+1× 20 126+2× 60 126+3× 40 126+4× 5 126= 20 9 .