• 141.21 KB
  • 2021-05-14 发布

全国高考数学试题分类汇编114变量间的相关关系与统计案例

  • 12页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
‎11.4变量间的相关关系与统计案例 考点一 变量间的相关关系 ‎1.(2015湖北,4,5分)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(  )‎ A.x与y正相关,x与z负相关 ‎ B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 ‎ D.x与y负相关,x与z正相关 答案 C ‎ ‎8.(2015课标Ⅰ,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.‎ ‎(xi-)2‎ ‎(wi-)2‎ ‎(xi-)(yi-)‎ ‎(wi-)(yi-)‎ ‎46.6‎ ‎563‎ ‎6.8‎ ‎289.8‎ ‎1.6‎ ‎1 469‎ ‎108.8‎ 表中wi=,=wi.‎ ‎(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)‎ ‎(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;‎ ‎(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:‎ ‎(i)年宣传费x=49时,年销售量及年利润的预报值是多少?‎ ‎(ii)年宣传费x为何值时,年利润的预报值最大?‎ 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为 ‎=,=- .‎ 解析 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2分)‎ ‎(2)令w=,先建立y关于w的线性回归方程.‎ 由于===68,‎ ‎=- =563-68×6.8=100.6,‎ 所以y关于w的线性回归方程为=100.6+68w,‎ 因此y关于x的回归方程为=100.6+68.(6分)‎ ‎(3)(i)由(2)知,当x=49时,年销售量y的预报值 ‎=100.6+68=576.6,‎ 年利润z的预报值 ‎=576.6×0.2-49=66.32.(9分)‎ ‎(ii)根据(2)的结果知,年利润z的预报值 ‎=0.2(100.6+68)-x=-x+13.6+20.12.‎ 所以当==6.8,即x=46.24时,取得最大值.‎ 故年宣传费为46.24千元时,年利润的预报值最大.(12分)‎ ‎9.(2015重庆,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:‎ 年份 ‎2010‎ ‎2011‎ ‎2012‎ ‎2013‎ ‎2014‎ 时间代号t ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ 储蓄存款y(千亿元)‎ ‎5‎ ‎6‎ ‎7‎ ‎8‎ ‎10‎ ‎ (1)求y关于t的回归方程=t+;‎ ‎(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.‎ 附:回归方程=t+中,‎ ‎==-.‎ 解析 (1)列表计算如下:‎ i ti yi tiyi ‎1‎ ‎1‎ ‎5‎ ‎1‎ ‎5‎ ‎2‎ ‎2‎ ‎6‎ ‎4‎ ‎12‎ ‎3‎ ‎3‎ ‎7‎ ‎9‎ ‎21‎ ‎4‎ ‎4‎ ‎8‎ ‎16‎ ‎32‎ ‎5‎ ‎5‎ ‎10‎ ‎25‎ ‎50‎ ‎15‎ ‎36‎ ‎55‎ ‎120‎ 这里n=5,=ti==3,=yi==7.2.‎ 又ltt=-n=55-5×32=10,lty=tiyi-n =120-5×3×7.2=12,‎ 从而===1.2,=-=7.2-1.2×3=3.6,‎ 故所求回归方程为=1.2t+3.6.‎ (2) 将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).‎ ‎2017高考理科数学《变量间的相关关系、统计案例》练习题 ‎[A组 基础演练·能力提升]‎ 一、选择题 ‎1.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是(  )‎ A.三维柱形图        B.二维条形图 C.等高条形图 D.独立性检验 解析:前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.‎ 答案:D ‎2.(2014年广州调研)已知x,y的取值如下表:‎ x ‎0‎ ‎1‎ ‎3‎ ‎4‎ y ‎2.2‎ ‎4.3‎ ‎4.8‎ ‎6.7‎ 从所得的散点图分析,y与x线性相关,且=0.95x+,则=(  )‎ A.2.1 B.2.2‎ C.2.4 D.2.6‎ 解析:由题意得=2,=4.5,将(2,4.5)代入=0.95x+可得=2.6.‎ 答案:D ‎3.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:‎ 优秀 非优秀 总计 甲班 ‎10‎ b 乙班 c ‎30‎ 总计 ‎105‎ 已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是(  )‎ A.列联表中c的值为30,b的值为35‎ B.列联表中c的值为15,b的值为50‎ C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”‎ D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”‎ 解析:由题意知,成绩优秀的学生人数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A,B错误.根据列联表中的数据,得到K2的观测值为k=≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确,选项D错误.‎ 答案:C ‎4.(2014年通州一模)对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是(  )‎ A.由样本数据得到的回归方程=x+必过样本点的中心(,)‎ B.残差平方和越小的模型,拟合的效果越好 C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好 D.若变量y和x之间的相关系数r=-0.936 2,则变量y与x之间具有线性相关关系 解析:R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.‎ 答案:C ‎5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:‎ 男 女 总计 爱好 ‎40‎ ‎20‎ ‎60‎ 不爱好 ‎20‎ ‎30‎ ‎50‎ 总计 ‎60‎ ‎50‎ ‎110‎ 由K2=算得,‎ K2=≈7.8.‎ 附表:‎ P(K2≥k)‎ ‎0.050‎ ‎0.010‎ ‎0.001‎ k ‎3.841‎ ‎6.635‎ ‎10.828‎ 参照附表,得到的正确结论是(  )‎ A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”‎ B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”‎ C.有99%以上的把握认为“爱好该项运动与性别有关”‎ D.有99%以上的把握认为“爱好该项运动与性别无关”‎ 解析:根据独立性检验的定义,由K2≈7.8>6.635可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.‎ 答案:C ‎6.某产品的广告费用x与销售额y的统计数据如下表:‎ 广告费用x(万元)‎ ‎4‎ ‎2‎ ‎3‎ ‎5‎ 销售额y(万元)‎ ‎49‎ ‎26‎ ‎39‎ ‎54‎ 根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为(  )‎ A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元 解析:∵==3.5(万元),‎ ==42,‎ 又=x+必过(,),∴42=×9.4+,∴=9.1.‎ ‎∴线性回归方程为=9.4x+9.1,‎ ‎∴当x=6时,=9.4×6+9.1=65.5(万元).‎ 答案:B 二、填空题 ‎7.(2014年韶关模拟)某市居民2008~2012年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:‎ 年份 ‎2008‎ ‎2009‎ ‎2010‎ ‎2011‎ ‎2012‎ 收入x ‎11.5‎ ‎12.1‎ ‎13‎ ‎13.3‎ ‎15‎ 支出y ‎6.8‎ ‎8.8‎ ‎9.8‎ ‎10‎ ‎12‎ 根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.‎ 解析:由中位数的定义知,总体个数为奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.‎ 答案:13 正 ‎8.(2014年甘肃部分示范校模拟)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元.‎ 解析:由题意知0.15(x+1)+0.2-0.15x-0.2=0.15.‎ 答案:0.15‎ ‎9.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:‎ 理科 文科 男 ‎13‎ ‎10‎ 女 ‎7‎ ‎20‎ 已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.‎ 根据表中数据,得到k=≈4.844.‎ 则认为选修文科与性别有关系出错的可能性为________.‎ 解析:∵K2≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.‎ 答案:5%‎ 三、解答题 ‎10.(2013年高考重庆卷)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,x=720.‎ ‎(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;‎ ‎(2)判断变量x与y之间是正相关还是负相关;‎ ‎(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.‎ 附:线性回归方程y=bx+a中,‎ b=,a=-b,‎ 其中,为样本平均值.线性回归方程也可写为=x+.‎ 解析:(1)由题意知n=10,=xi==8,=yi==2,‎ 又lxx=x-n2=720-10×82=80,‎ lxy=xiyi-n =184-10×8×2=24,‎ 由此得b===0.3,a=-b=2-0.3×8=-0.4,‎ 故所求线性回归方程为y=0.3x-0.4.‎ ‎(2)由于变量y的值随x的值增加而增加(b=0.3>0),故x与y之间是正相关.‎ ‎(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).‎ ‎11.一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:‎ 人数xi ‎10‎ ‎15‎ ‎20‎ ‎25‎ ‎30‎ ‎35‎ ‎40‎ 件数yi ‎4‎ ‎7‎ ‎12‎ ‎15‎ ‎20‎ ‎23‎ ‎27‎ 其中i=1,2,3,4,5,6,7.‎ ‎(1)以每天进店人数为横轴,每天商品销售件数为纵轴,画出散点图;‎ ‎(2)求回归直线方程.(结果保留到小数点后两位)‎ ‎(3)预测进店人数为80人时,商品销售的件数.(结果保留整数)‎ 解析:(1)散点图如图.‎ ‎(2)∵xiyi=3 245,=25,=15.43,x=5 075,7()2=4 375,7 =2 695,‎ ‎∴=≈0.79,‎ =-b=-4.32,‎ ‎∴回归直线方程是=0.79x-4.32.‎ ‎(3)进店人数为80人时,商品销售的件数y=0.79×80-4.32≈59.‎ ‎12.(能力提升)(2013年高考福建卷)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.‎ ‎(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;‎ ‎(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?‎ 附:2= P(2≥k)‎ ‎0.100‎ ‎0.050‎ ‎0.010‎ ‎0.001‎ k ‎2.706‎ ‎3.841‎ ‎6.635‎ ‎10.828‎ ‎(注:此公式也可以写成K2=)‎ 解析:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.‎ 所以样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.‎ 从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).‎ 其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.‎ ‎(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:‎ 生产能手 非生产能手 合计 ‎25周岁以上组 ‎15‎ ‎45‎ ‎60‎ ‎25周岁以下组 ‎15‎ ‎25‎ ‎40‎ 合计 ‎30‎ ‎70‎ ‎100‎ 所以得K2==‎ =≈1.79.‎ 因为1.79<2.706,‎ 所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.‎ ‎[B组 因材施教·备选练习]‎ ‎1.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程=x+,则“(x0,y0)满足线性回归方程=x+”是“x0=,y0=”的(  )‎ A.充分不必要条件     B.必要不充分条件 C.充要条件 D.既不充分也不必要条件 解析:x0,y0为这10组数据的平均值,又因为线性回归方程=x+必过样本中心点(,),因此(,)一定满足线性回归方程,但满足线性回归方程的数组除了(,)外,可能还有其他样本点.‎ 答案:B ‎2.(2014年江西重点中学盟校第二次联考)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.‎ 零件数x(个)‎ ‎10‎ ‎20‎ ‎30‎ ‎40‎ ‎50‎ 加工时间y(min)‎ ‎62‎ ‎75‎ ‎81‎ ‎89‎ 现发现表中有一个数据看不清,请你推断出该数据的值为________.‎ 解析:由已知可计算求出=30,而回归直线方程必过点(,),则=0.67×30+54.9=75,设模糊数字为a,则 =75,计算得a=68.‎ 答案:68‎ ‎3.某超市为了了解热茶的销售量y(单位:杯)与气温x(单位:℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:‎ 气温(℃)‎ ‎18‎ ‎13‎ ‎10‎ ‎-1‎ 杯数 ‎24‎ ‎34‎ ‎38‎ ‎64‎ 由表中数据算得线性回归方程=bx+a中的b≈-2,预测当气温为-5 ℃时,热茶销售量为________杯.‎ 解析:根据表格中的数据可得,=×(18+13+10-1)=10,=×(24+34+38+64)=40.‎ 则a=-b=40-(-2)×10=60,故=-2x+60.‎ 当x=-5时,=-2×(-5)+60=70.‎ 答案:70‎