• 172.50 KB
  • 2021-06-22 发布

2019年高考数学总复习检测第68讲 变量的相关性、回归分析、独立性检验

  • 4页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第68讲 变量的相关性、回归分析、独立性检验 ‎1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(D)‎ A.-1 B.0‎ C. D.1‎ ‎ 由题意知,这组样本数据完全正相关,故相关系数为1,选D.‎ ‎2.设某大学的女生的体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y =0.85x-85.71,则下列结论中不正确的是(D)‎ A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(,)‎ C.若该大学某女生的身高增加1 cm,则其体重约增加0.85 kg D.若该大学某女生的身高为170 cm,则可断定其体重必为58.79 kg ‎ A、B、C均正确,是回归方程的性质.D项是错误的,线性回归方程只能预测学生的体重,选项D应改为“若该大学某女生身高为170 cm,则估计其体重大约为58.79 kg”才正确.‎ ‎3.(2015·福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:‎ 收入x(万元)‎ ‎8.2‎ ‎8.6‎ ‎10.0‎ ‎11.3‎ ‎11.9‎ 支出y(万元)‎ ‎6.2‎ ‎7.5‎ ‎8.0‎ ‎8.5‎ ‎9.8‎ 据此估计,该社区一户年收入为15万元家庭的年支出为(B)‎ A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 ‎ 由题意知,==10,‎ ==8,‎ 所以a =8-0.76×10=0.4,‎ 所以当x=15时,y =0.76×15+0.4=11.8(万元).‎ ‎4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:‎ 男 女 总计 爱好 ‎40‎ ‎20‎ ‎60‎ 不爱好 ‎20‎ ‎30‎ ‎50‎ 总计 ‎60‎ ‎50‎ ‎110‎ 由K2=算得,‎ K2=≈7.8.‎ 附表:‎ P(K2≥k)‎ ‎0.050‎ ‎0.010‎ ‎0.001‎ k ‎3.841‎ ‎6.635‎ ‎10.828‎ 参照附表,得到的正确结论是(A)‎ A.有99%以上的把握认为“爱好该项运动与性别有关”‎ B.有99%以上的把握认为“爱好该项运动与性别无关”‎ C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”‎ D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”‎ ‎ 因为7.8>6.635,所以99%以上的把握认为“爱好该项运动与性别有关”,选A.‎ ‎5.对于一组数据的两个函数模型,模型Ⅰ和模型Ⅱ的残差平方和分别为180.2和290.7,若从中选取一个拟合程度较好的函数模型,应选 模型Ⅰ .‎ ‎   残差平方和越小,函数模型对数据的拟合效果越好;残差平方和越大,说明函数模型对数据的拟合效果越差.‎ ‎6.已知x、y的取值如下表所示,‎ x ‎0‎ ‎1‎ ‎3‎ ‎4‎ y ‎2.2‎ ‎4.3‎ ‎4.8‎ ‎6.7‎ 从所得的散点图分析,y与x线性相关,且y=0.95x+a,则a= 2.6 .‎ ‎ 因为回归直线方程必过样本点的中心(,),‎ 解得=2,=4.5,将(2,4.5)代入y=0.95x+a,可得a=2.6.‎ ‎7.(2015·重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:‎ 年份 ‎2010‎ ‎2011‎ ‎2012‎ ‎2013‎ ‎2014‎ 时间代号t ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ 储蓄存款y ‎(千亿元)‎ ‎5‎ ‎6‎ ‎7‎ ‎8‎ ‎10‎ ‎(1)求y关于t的回归方程y =b t+a ;‎ ‎(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.‎ 附:回归方程y =b t+a 中,b =,a =-b .‎ ‎ (1)列表计算如下:‎ i ti yi t tiyi ‎1‎ ‎1‎ ‎5‎ ‎1‎ ‎5‎ ‎2‎ ‎2‎ ‎6‎ ‎4‎ ‎12‎ ‎3‎ ‎3‎ ‎7‎ ‎9‎ ‎21‎ ‎4‎ ‎4‎ ‎8‎ ‎16‎ ‎32‎ ‎5‎ ‎5‎ ‎10‎ ‎25‎ ‎50‎ ‎∑‎ ‎15‎ ‎36‎ ‎55‎ ‎120‎ 这里n=5,=i==3,‎ =i==7.2.‎ 又ltt=-n2=55-5×32=10,‎ lty=iyi-n=120-5×3×7.2=12,‎ 从而b ===1.2,‎ a =-b =7.2-1.2×3=3.6,‎ 故所求回归方程为y =1.2t+3.6.‎ ‎(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y =1.2×‎ ‎6+3.6=10.8(千亿元).‎ ‎8.(2015·湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(C)‎ A.x与y正相关,x与z负相关 ‎ B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 ‎ D.x与y负相关,x与z正相关 ‎ 因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=b y+a ,b >0,则z=b y+a =-0.1b x+b +a ,故x与z负相关.‎ ‎9.某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过这种血清的人与另外500名未使用这种血清的人一年中的感冒记录比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2=3.918,经查临界值表知P(K2≥3.841)≈0.05.下列结论中,正确结论的序号是 ① .‎ ‎①有95%的把握认为“这种血清能起到预防感冒的作用”;‎ ‎②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;‎ ‎③这种血清预防感冒的有效率为95%;‎ ‎④这种血清预防感冒的有效率为5%.‎ ‎ 因为K2=3.918≥3.841,而P(K2≥3.841)≈0.05,‎ 所以有95%的把握认为“这种血清能起到预防感冒的作用”.‎ ‎10.(2016·湖北省八校第二次联考)国内某知名大学有男生14000人,女生10000人.该校体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取120人,统计他们平均每天运动的时间,如下表:(平均每天运动的时间单位:小时,该校学生平均每天运动的时间范围是[0,3])‎ 男生平均每天运动的时间分布情况:‎ 平均每天 运动的时间 ‎[0,‎ ‎0.5)‎ ‎[0.5,‎ ‎1)‎ ‎[1,‎ ‎1.5)‎ ‎[1.5,‎ ‎2)‎ ‎[2,‎ ‎2.5)‎ ‎[2.5,‎ ‎3]‎ 人数 ‎2‎ ‎12‎ ‎23‎ ‎18‎ ‎10‎ x 女生平均每天运动的时间分布情况:‎ 平均每天 运动的时间 ‎[0,‎ ‎0.5)‎ ‎[0.5,‎ ‎1)‎ ‎[1,‎ ‎1.5)‎ ‎[1.5,‎ ‎2)‎ ‎[2,‎ ‎2.5)‎ ‎[2.5,‎ ‎3]‎ 人数 ‎5‎ ‎12‎ ‎18‎ ‎10‎ ‎3‎ y ‎ (1)请根据样本估算该校男生平均每天运动的时间(结果精确到0.1);‎ ‎(2)若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”.‎ ‎①请根据样本估算该校“运动达人”的数量;‎ ‎②请根据上述表格中的统计数据填写下面2×2列联表,并通过计算判断能否在犯错误的概率不超过0.05的前提下认为“是否为'运动达人'与性别有关?”‎ 运动达人 非运动达人 总计 男生 女生 总计 参考公式:K2=,其中n=a+b+c+d.‎ 参考数据:‎ P(K2≥k0)‎ ‎0.10‎ ‎0.05‎ ‎0.025‎ ‎0.010‎ ‎0.005‎ ‎0.001‎ k0‎ ‎2.706‎ ‎3.841‎ ‎5.024‎ ‎6.635‎ ‎7.879‎ ‎10.828‎ ‎   (1)由分层抽样得,男生抽取的人数为120×=70人,女生抽取的人数为120-70=50人,故x=5,y=2,‎ 则该校男生平均每天运动的时间为:‎ (0.25×2+0.75×12+1.25×23+1.75×18+2.25×10+2.75×5)≈1.5, ‎ 故该校男生平均每天运动的时间约为1.5小时.‎ ‎(2)①样本中“运动达人”所占比例是=,故估计该校“运动达人”有 ×(14000+10000)=4000人.‎ ‎②由表格可知:,‎ 运动达人 非运动达人 总计 男生 ‎15‎ ‎55‎ ‎70‎ 女生 ‎5‎ ‎45‎ ‎50‎ 总计 ‎20‎ ‎100‎ ‎120‎ ‎ 故K2的观测值 k==≈2.743<3.841. ‎ 故在犯错误的概率不超过0.05的前提下不能认为“是否为'运动达人'与性别有关”.‎