• 607.29 KB
  • 2021-07-01 发布

高考数学专题复习练习:第十一章 11_3两个变量的线性相关

  • 16页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它 称为正相关. (2)负相关 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关 关系,这条直线叫做回归直线. 2.回归方程 (1)最小二乘法 求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法. (2)回归方程 方程y ^ =b ^ x+a ^ 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn) 的回归方程,其中a ^ ,b ^ 是待定参数. b ^ = ∑n i=1 xi- x yi- y  ∑n i=1 xi- x 2 = ∑n i=1xiyi-n x y ∑n i=1x2i -n x 2 , a ^ = y -b ^ x . 3.回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中( x , y )称为样本 点的中心. (3)相关系数 当 r>0 时,表明两个变量正相关; 当 r<0 时,表明两个变量负相关. r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的绝对值越接近于 0,表明两个 变量之间几乎不存在线性相关关系.通常|r|大于 0.75 时,认为两个变量有很强的线性相关性. 4.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. (2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量 X 和 Y,它们的 可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为 2×2 列联表 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 构造一个随机变量 K2= nad-bc2 a+bc+da+cb+d ,其中 n=a+b+c+d 为样本容量. (3)独立性检验 利用随机变量 K2 来判断“两个分类变量有关系”的方法称为独立性检验. 【思考辨析】 判断下列结论是否正确(请在括号中打“√”或“×”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( × ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √ ) (4)某同学研究卖出的热饮杯数 y 与气温 x(℃)之间的关系,得回归方程y ^ =-2.352x+147.767, 则气温为 2℃时,一定可卖出 143 杯热饮.( × ) (5)事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的观测值越大.( √ ) (6)由独立性检验可知,有 99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀, 则他有 99%的可能物理优秀.( × ) 1.(2015·湖北)已知变量 x 和 y 满足关系y ^ =-0.1x+1,变量 y 与 z 正相关.下列结论中正确 的是( ) A.x 与 y 正相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关 C.x 与 y 负相关,x 与 z 负相关 D.x 与 y 负相关,x 与 z 正相关 答案 C 解析 因为y ^ =-0.1x+1,-0.1<0,所以 x 与 y 负相关.又 y 与 z 正相关,故可设z ^ =b ^ y +a ^ (b ^ >0),所以z ^ =-0.1b ^ x+b ^ +a ^ ,-0.1b ^ <0,所以 x 与 z 负相关.故选 C. 2.(教材改编)下面是 2×2 列联表:则表中 a,b 的值分别为( ) y1 y2 合计 x1 a 21 73 x2 22 25 47 合计 b 46 120 A.94,72 B.52,50 C.52,74 D.74,52 答案 C 解析 ∵a+21=73,∴a=52.又 a+22=b,∴b=74. 3.(2016·河南八市质检)为了研究某大型超市当天销售额与开业天数的关系,随机抽取了 5 天,其当天销售额与开业天数的数据如下表所示: 开业天数 x 10 20 30 40 50 当天销售额 y/万元 62 75 81 89 根据上表提供的数据,求得 y 关于 x 的线性回归方程为y ^ =0.67x+54.9,由于表中有一个数据 模糊看不清,请你推断出该数据的值为( ) A.67 B.68 C.68.3 D.71 答案 B 解析 设表中模糊看不清的数据为 m,因为 x =10+20+30+40+50 5 =30, 又样本中心点( x , y )在回归直线y ^ =0.67x+54.9 上, 所以 y =m+307 5 =0.67×30+54.9,得 m=68,故选 B. 4.(2017·湖南三校联考)某产品在某零售摊位的零售价 x(单位:元)与每天的销售量 y(单位: 个)的统计资料如下表所示: x 16 17 18 19 y 50 34 41 31 由上表可得线性回归方程y ^ =b ^ x+a ^ 中的b ^ =-4,据此模型预测零售价为 15 元时,每天的销售 量为( ) A.51 个 B.50 个 C.49 个 D.48 个 答案 C 解析 由题意知 x =17.5, y =39,代入线性回归方程得 a ^ =109,109-15×4=49,故选 C. 5.(2016·玉溪一中月考)利用独立性检验来判断两个分类变量 X 和 Y 是否有关系,通过查阅 下表来确定“X 和 Y 有关系”的可信度.为了调查用电脑时间与视力下降是否有关系,现从 某地网民中抽取 100 位居民进行调查.经过计算得 K2≈3.855,那么就有________%的把握认 为用电脑时间与视力下降有关系. P(K2≥k0) 0.05 0.025 0.010 0.005 0.001 k0 3.841 5.024 6.635 7.879 10.828 答案 95 解析 根据表格发现 3.855>3.841,3.841 对应的是 0.05,所以根据独立性检验原理可知有 95% 的把握认为用电脑时间与视力下降有关系. 题型一 相关关系的判断 例 1 (1)四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求得线性回归方程, 分别得到以下四个结论: ①y 与 x 负相关且y ^ =2.347x-6.423; ②y 与 x 负相关且y ^ =-3.476x+5.648; ③y 与 x 正相关且y ^ =5.437x+8.493; ④y 与 x 正相关且y ^ =-4.326x-4.578. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ (2)x 和 y 的散点图如图所示,则下列说法中所有正确命题的序号为________. ①x,y 是负相关关系; ②在该相关关系中,若用 y=c1 拟合时的相关系数的平方为 r21,用y ^ =b ^ x+a ^ 拟合时的相关 系数的平方为 r22,则 r21>r22; ③x、y 之间不能建立线性回归方程. 答案 (1)D (2)①② 解析 (1)由线性回归方程y ^ =b ^ x+a ^ 知当b ^ >0 时,y 与 x 正相关,当b ^ <0 时,y 与 x 负相关,∴①④ 一定错误. (2)①显然正确;由散点图知,用 y=c1 拟合的效果比用y ^ =b ^ x+a ^ 拟合的效果要好,故 ②正确;x,y 之间能建立线性回归方程,只不过预报精度不高,故③不正确. 思维升华 判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角, 两个变量负相关. (2)相关系数:r>0 时,正相关;r<0 时,负相关. (3)线性回归方程中:b ^ >0 时,正相关;b ^ <0 时,负相关. (1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn 不全相 等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线 y=1 2x+1 上,则这组样本数据 的样本相关系数为( ) A.-1 B.0 C.1 2 D.1 (2)变量 X 与 Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量 U 与 V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1 表示变量 Y 与 X 之间的线 性相关系数,r2 表示变量 V 与 U 之间的线性相关系数,则( ) A.r2<r1<0 B.0<r2<r1 C.r2<0<r1 D.r2=r1 答案 (1)D (2)C 解析 (1)所有点均在直线上,则样本相关系数最大,即为 1,故选 D. (2)对于变量 Y 与 X 而言,Y 随 X 的增大而增大,故 Y 与 X 正相关,即 r1>0;对于变量 V 与 U 而言,V 随 U 的增大而减小,故 V 与 U 负相关,即 r2<0,故选 C. 题型二 线性回归分析 2ec x 2ec x 例 2 (2016·全国丙卷)下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折 线图. 注:年份代码 17 分别对应年份 2008-2014. (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明; (2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2016 年我国生活垃圾无害化处理量. 附注: 参考数据:错误!i=9.32,错误!iyi=40.17,错误!=0.55, 7≈2.646. 参考公式:相关系数 r=错误!, 回归方程y ^ =a ^ +b ^ t 中斜率和截距的最小二乘估计公式分别为: b ^ =错误!,a ^ = y -b ^ t . 解 (1)由折线图中数据和附注中参考数据得 t =4,错误!(ti- t )2=28, 错误!=0.55. 错误!(ti- t )(yi- y )=错误!iyi- t 错误!i=40.17-4×9.32=2.89, 所以 r≈ 2.89 0.55×2×2.646 ≈0.99. 因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线性回归 模型拟合 y 与 t 的关系. (2)由 y =9.32 7 ≈1.331 及(1)得b ^ =错误!=2.89 28 ≈0.103, a ^ = y -b ^ t ≈1.331-0.103×4≈0.92. 所以 y 关于 t 的回归方程为y ^ =0.92+0.10t. 将 2016 年对应的 t=9 代入回归方程得y ^ =0.92+0.10×9=1.82. 所以预测 2016 年我国生活垃圾无害化处理量将约为 1.82 亿吨. 思维升华 线性回归分析问题的类型及解题方法 (1)求线性回归方程 ①利用公式,求出回归系数b ^ ,a ^ .②待定系数法:利用回归直线过样本点的中心求系数. (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. (3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b ^ . (4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于 1 时,两变量的线性相关性 越强. (2015·课标全国Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣 传费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响,对近 8 年的年宣传 费 xi 和年销售量 yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. x y w 错误!(xi- x )2 错误!(wi- w )2 错误!(xi- x )·(yi- y ) 错误!(wi- w )·(yi- y ) 46.6 563 6.8 289.8 1.6 1 469 108.8 表中 wi= xi, w =1 8 错误!i. (1)根据散点图判断,y=a+bx 与 y=c+d x哪一个适宜作为年销售量 y 关于年宣传费 x 的回 归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程; (3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y-x.根据(2)的结果回答下列问题: ①年宣传费 x=49 时,年销售量及年利润的预报值是多少? ②年宣传费 x 为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v ^ =α ^ +β ^ u 的斜率和截距的最 小二乘估计分别为 β ^ =错误!,α ^ = v -β ^ u . 解 (1)由散点图可以判断,y=c+d x适宜作为年销售量 y 关于年宣传费 x 的回归方程类型. (2)令 w= x,先建立 y 关于 w 的线性回归方程,由于 d ^ =错误!=108.8 1.6 =68, c ^ = y -d ^ w =563-68×6.8=100.6, 所以y关于w的线性回归方程为y ^ =100.6+68w,因此y关于x的回归方程为y ^ =100.6+68 x. (3)①由(2)知,当 x=49 时, 年销售量 y 的预报值y ^ =100.6+68 49=576.6, 年利润 z 的预报值z ^ =576.6×0.2-49=66.32. ②根据(2)的结果知,年利润 z 的预报值 z ^ =0.2(100.6+68 x)-x=-x+13.6 x+20.12. 所以当 x=13.6 2 =6.8,即 x=46.24 时,z ^ 取得最大值. 故年宣传费为 46.24 千元时,年利润的预报值最大. 题型三 独立性检验 例 3 (2016·福建厦门三中模拟)某大型企业人力资源部为了研究企业员工工作积极性和对待 企业改革的关系,随机抽取了 100 名员工进行调查,其中支持企业改革的调查者中,工作积 极的有 46 人,工作一般的有 35 人,而不太赞成企业改革的调查者中,工作积极的有 4 人, 工作一般的有 15 人. (1)根据以上数据建立一个 2×2 列联表; (2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的 态度与其工作积极性有关系? 参考公式:K2= nad-bc2 a+bc+da+cb+d(其中 n=a+b+c+d) P(K2≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82 8 解 (1)根据题设条件,得 2×2 列联表如下: 支持企业改革 不太赞成企业改革 总计 工作积极 46 4 50 工作一般 35 15 50 总计 81 19 100 (2)提出假设:企业的全体员工对待企业改革的态度与其工作积极性无关. 根据(1)中的数据,可以求得 K2=100×15×46-35×42 50×50×19×81 ≈7.862>6.635,所以有 99%的把握认为抽样员工对待企业改革的 态度与工作积极性有关,从而认为企业的全体员工对待企业改革的态度与其工作积极性有关. 思维升华 (1)比较几个分类变量有关联的可能性大小的方法 ①通过计算 K2 的大小判断:K2 越大,两变量有关联的可能性越大. ②通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大. (2)独立性检验的一般步骤 ①根据样本数据制成 2×2 列联表. ②根据公式 K2= nad-bc2 a+ba+cb+dc+d 计算 K2 的观测值 k. ③比较 k 与临界值的大小关系,作统计推断. (2017·衡阳联考)2016 年 9 月 20 日是第 28 个全国爱牙日,为了迎接此节日,某 地区卫生部门成立了调查小组,调查“常吃零食与患龋齿的关系”,对该地区小学六年级 800 名学生进行检查,按患龋齿和不患龋齿分类,并汇总数据:不常吃零食且不患龋齿的学生有 60 名,常吃零食但不患龋齿的学生有 100 名,不常吃零食但患龋齿的学生有 140 名. (1)能否在犯错误的概率不超过 0.001 的前提下,认为该地区学生常吃零食与患龋齿有关系? (2)4 名卫生部门的工作人员随机分成两组,每组 2 人,一组负责数据收集,另一组负责数据 处理,求工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率. 附:K2= nad-bc2 a+bc+da+cb+d P(K2≥k0) 0.010 0.005 0.001 k0 6.635 7.879 10.828 解 (1)由题意可得 2×2 列联表如下: 不常吃零食 常吃零食 总计 不患龋齿 60 100 160 患龋齿 140 500 640 总计 200 600 800 根据 2×2 列联表中数据,得 K2 的观测值为 k=800×60×500-100×1402 160×640×200×600 ≈16.667>10.828. ∴能在犯错误的概率不超过 0.001 的前提下,认为该地区学生常吃零食与患龋齿有关系. (2)设其他工作人员为丙和丁,4 人分组的所有情况如下表. 小组 1 2 3 4 5 6 收集数据 甲乙 甲丙 甲丁 乙丙 乙丁 丙丁 处理数据 丙丁 乙丁 乙丙 甲丁 甲丙 甲乙 由表可知,分组的情况共有 6 种,工作人员甲负责收集数据且工作人员乙负责处理数据的有 2 种,故工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率为 P=2 6 =1 3. 24.求线性回归方程的方法技巧 典例 (12 分)某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份 2006 2008 2010 2012 2014 需求量/万吨 236 246 257 276 286 (1)利用所给数据求年需求量与年份之间的线性回归方程y ^ =b ^ x+a ^ ; (2)利用(1)中所求出的线性回归方程预测该地 2016 年的粮食需求量. 思想方法指导 回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之 间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变 量的取值及判断变量取值的变化趋势;(3)求出线性回归方程. 规范解答 解 (1)由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将 数据处理如下表. 年份-2010 -4 -2 0 2 4 需求-257 -21 -11 0 19 29 对处理的数据,容易算得 x =0, y =3.2,[4 分] b ^ =-4×-21+-2×-11+2×19+4×29-5×0×3.2 -42+-22+22+42-5×02 =260 40 =6.5, a ^ = y -b ^ x =3.2.[6 分] 由上述计算结果,知所求线性回归方程为 y ^ -257=6.5(x-2010)+3.2, 即y ^ =6.5(x-2010)+260.2.[8 分] (2)利用所求得的线性回归方程,可预测 2016 年的粮食需求量大约为 6.5×(2016-2010)+ 260.2=6.5×6+260.2=299.2(万吨).[12 分] 1.(2016·衡水质检)具有线性相关关系的变量 x,y 满足一组数据如下表所示.若 y 与 x 的线 性回归方程为y ^ =3x-3 2 ,则 m 的值是( ) x 0 1 2 3 y -1 1 m 8 A.4 B.9 2 C.5 D.6 答案 A 解析 由已知得 x =3 2 , y =m 4 +2, 又因为点( x , y )在直线y ^ =3x-3 2 上, 所以m 4 +2=3×3 2 -3 2 ,得 m=4. 2.(2017·武汉质检)根据如下样本数据 x 3 4 5 6 7 8 y 4.0 2.5 -0.5 0.5 -2.0 -3.0 得到的回归方程为y ^ =b ^ x+a ^ ,则( ) A.a ^ >0,b ^ >0 B.a ^ >0,b ^ <0 C.a ^ <0,b ^ >0 D.a ^ <0,b ^ <0 答案 B 解析 作出散点图如下: 观察图象可知,回归直线y ^ =b ^ x+a ^ 的斜率b ^ <0, 当 x=0 时,y ^ =a ^ >0.故a ^ >0,b ^ <0. 3.(2017·泰安月考)为了普及环保知识,增强环保意识,某大学从理工类专业的 A 班和文史 类专业的 B 班各抽取 20 名同学参加环保知识测试.统计得到成绩与专业的列联表: 优秀 非优秀 总计 A 班 14 6 20 B 班 7 13 20 总计 21 19 40 附:参考公式及数据: (1)统计量:K2= nad-bc2 a+bc+da+cb+d(n=a+b+c+d). (2)独立性检验的临界值表: P(K2≥k0) 0.050 0.010 k0 3.841 6.635 则下列说法正确的是( ) A.有 99%的把握认为环保知识测试成绩与专业有关 B.有 99%的把握认为环保知识测试成绩与专业无关 C.有 95%的把握认为环保知识测试成绩与专业有关 D.有 95%的把握认为环保知识测试成绩与专业无关 答案 C 解析 因为 K2=40×14×13-7×62 20×20×21×19 ≈4.912, 3.841b′,a ^ >a′ B.b ^ >b′,a ^ a′ D.b ^ a′. 5.有甲、乙两个班级进行数学考试,按照大于等于 85 分为优秀,85 分以下为非优秀统计成 绩,得到如下所示的列联表: 优秀 非优秀 总计 甲班 10 b 乙班 c 30 合计 附: P(K2≥k0) 0.05 0.025 0.010 0.005 k0 3.841 5.024 6.635 7.879 已知在全部 105 人中随机抽取 1 人,成绩优秀的概率为2 7 ,则下列说法正确的是( ) A.列联表中 c 的值为 30,b 的值为 35 B.列联表中 c 的值为 15,b 的值为 50 C.根据列联表中的数据,若按 97.5%的可靠性要求,能认为“成绩与班级有关系” D.根据列联表中的数据,若按 97.5%的可靠性要求,不能认为“成绩与班级有关系” 答案 C 解析 由题意知,成绩优秀的学生数是 30,成绩非优秀的学生数是 75,所以 c=20,b=45, 选项 A、B 错误. 根据列联表中的数据, 得到 K2=105×10×30-20×452 55×50×30×75 ≈6.109>5.024, 因此有 97.5%的把握认为“成绩与班级有关系”. 6.(2016·合肥二模)某市居民 2010~2014 年家庭年平均收入 x(单位:万元)与年平均支出 y(单 位:万元)的统计资料如下表所示: 年份 2010 2011 2012 2013 2014 收入 x 11.5 12.1 13 13.3 15 支出 y 6.8 8.8 9.8 10 12 根据统计资料,居民家庭年平均收入的中位数是______,家庭年平均收入与年平均支出有 ________相关关系.(填“正”或“负”) 答案 13 正 解析 中位数是 13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支 出也增多,因此两者之间具有正相关关系. 7.以下四个命题,其中正确的序号是________. ①从匀速传递的产品生产流水线上,质检员每 20 分钟从中抽取一件产品进行某项指标检测, 这样的抽样是分层抽样; ②两个随机变量相关性越强,则相关系数的绝对值越接近于 1; ③在线性回归方程y ^ =0.2x+12 中,当解释变量 x 每增加一个单位时,预报变量y ^ 平均增加 0.2 个单位; ④对分类变量 X 与 Y 的随机变量 K2 的观测值 k 来说,k 越小,“X 与 Y 有关系”的把握程度 越大. 答案 ②③ 解析 ①是系统抽样;对于④,随机变量 K2 的观测值 k 越小,说明两个相关变量有关系的把 握程度越小. 8.(2016·长春模拟)在一次考试中,5 名学生的数学和物理成绩如下表:(已知学生的数学和 物理成绩具有线性相关关系) 学生的编号 i 1 2 3 4 5 数学成绩 x 80 75 70 65 60 物理成绩 y 70 66 68 64 62 现已知其线性回归方程为y ^ =0.36x+a ^ ,则根据此线性回归方程估计数学得 90 分的同学的 物理成绩为______(四舍五入到整数). 答案 73 解析 x =60+65+70+75+80 5 =70, y =62+64+66+68+70 5 =66, 所以 66=0.36×70+a ^ ,a ^ =40.8, 即线性回归方程为y ^ =0.36x+40.8. 当 x=90 时,y ^ =0.36×90+40.8=73.2≈73. 9.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零 件为优质品.从两个分厂生产的零件中各抽出了 500 件,量其内径尺寸,得结果如下表: 甲厂: 分组 [29.86, 29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10, 30.14] 频数 12 63 86 182 92 61 4 乙厂: 分组 [29.86, 29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10, 30.14] 频数 29 71 85 159 76 62 18 (1)试分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填下面 2×2 列联表,问是否有 99%的把握认为“两个分厂生产的零件的 质量有差异”? 甲厂 乙厂 合计 优质品 非优质品 合计 附 P(K2≥k0) 0.05 0.01 k0 3.841 6.635 解 (1)甲厂抽查的 500 件产品中有 360 件优质品,从而估计甲厂生产的零件的优质品率为 360 500 ×100%=72%; 乙厂抽查的 500 件产品中有 320 件优质品,从而估计乙厂生产的零件的优质品率为320 500 ×100% =64%. (2)完成的 2×2 列联表如下: 甲厂 乙厂 合计 优质品 360 320 680 非优质品 140 180 320 合计 500 500 1 000 由表中数据计算得 K2 的观测值 k=1 000×360×180-320×1402 500×500×680×320 ≈7.353>6.635, 所以有 99%的把握认为“两个分厂生产的零件的质量有差异”. 10.某百货公司 1~6 月份的销售量 x 与利润 y 的统计数据如下表: 月份 1 2 3 4 5 6 销售量 x(万件) 10 11 13 12 8 6 利润 y(万元) 22 25 29 26 16 12 (1)根据 2~5 月份的数据,画出散点图,求出 y 关于 x 的线性回归方程y ^ =b ^ x+a ^ ; (2)若由线性回归方程得到的估计数据与剩下的检验数据的误差均不超过 2 万元,则认为得到 的线性回归方程是理想的,试问所得线性回归方程是否理想? 解 (1)根据表中 2~5 月份的数据作出散点图,如图所示: 计算得 x =11, y =24, ∑5 i=2xiyi=11×25+13×29+12×26+8×16=1 092, ∑5 i=2x2i =112+132+122+82=498, 则b ^ = ∑5 i=2xiyi-4 x y ∑5 i=2x2i -4 x 2 =1 092-4×11×24 498-4×112 =18 7 , a ^ = y -b ^ x =24-18 7 ×11=-30 7 . 故 y 关于 x 的线性回归方程为y ^ =18 7 x-30 7 . (2)当 x=10 时,y ^ =18 7 ×10-30 7 =150 7 , 此时|150 7 -22|<2; 当 x=6 时,y ^ =18 7 ×6-30 7 =78 7 ,此时|78 7 -12|<2. 故所得的线性回归方程是理想的.