• 151.00 KB
  • 2021-06-15 发布

2020届二轮复习 变量间的相关关系、统计案例学案(全国通用)

  • 7页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
‎2020届二轮复习  变量间的相关关系、统计案例 学案 五年高考 考点 变量的相关性、统计案例 ‎1.(2018山东,5,5分)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+.已知xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为(  )‎ ‎                     ‎ A.160 B.163 ‎ C.166 D.170‎ 答案 C ‎2.(2018福建,4,5分)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:‎ 收入x(万元)‎ ‎8.2‎ ‎8.6‎ ‎10.0‎ ‎11.3‎ ‎11.9‎ 支出y(万元)‎ ‎6.2‎ ‎7.5‎ ‎8.0‎ ‎8.5‎ ‎9.8‎ 根据上表可得回归直线方程=x+,其中=0.76,=-.‎ 据此估计,该社区一户年收入为15万元家庭的年支出为(  )‎ A.11.4‎万元 B.11.8万元 ‎ C.12.0万元 D.12.2万元 答案 B ‎3.(2018湖北,4,5分)根据如下样本数据 x ‎3‎ ‎4‎ ‎5‎ ‎6‎ ‎7‎ ‎8‎ y ‎4.0‎ ‎2.5‎ ‎-0.5‎ ‎0.5‎ ‎-2.0‎ ‎-3.0‎ 得到的回归方程为=bx+a,则(  )‎ ‎                     ‎ A.a>0,b>0 B.a>0,b<0‎ C.a<0,b>0 D.a<0,b<0‎ 答案 B ‎4.(2018课标Ⅰ,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.‎ ‎(xi-)2‎ ‎(wi-)2‎ ‎(xi-)(yi-)‎ ‎(wi-)(yi-)‎ ‎46.6‎ ‎563‎ ‎6.8‎ ‎289.8‎ ‎1.6‎ ‎1 469‎ ‎108.8‎ ‎(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)‎ ‎(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;‎ ‎(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:‎ ‎(i)年宣传费x=49时,年销售量及年利润的预报值是多少?‎ ‎(ii)年宣传费x为何值时,年利润的预报值最大?‎ 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为 ‎=,=- .‎ 解析 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2分)‎ ‎(2)令w=,先建立y关于w的线性回归方程.由于 ‎===68,‎ ‎=- =563-68×6.8=100.6,‎ 所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.(6分)‎ ‎(3)(i)由(2)知,当x=49时,年销售量y的预报值 ‎=100.6+68=576.6,‎ 年利润z的预报值=576.6×0.2-49=66.32.(9分)‎ ‎(ii)根据(2)的结果知,年利润z的预报值 ‎=0.2(100.6+68)-x=-x+13.6+20.12.‎ 所以当==6.8,‎ 即x=46.24时,取得最大值.‎ 故年宣传费为46.24千元时,年利润的预报值最大.(12分)‎ 教师用书专用(5—6)‎ ‎5.(2018重庆,3,5分)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是(  )‎ A.=0.4x+2.3 B.=2x-2.4‎ C.=-2x+9.5 D.=-0.3x+4.4‎ 答案 A ‎6.(2018课标Ⅱ,19,12分)某地区2018年至2018年农村居民家庭人均纯收入y(单位:千元)的数据如下表:‎ 年 份 ‎2018‎ ‎2018‎ ‎2009‎ ‎2018‎ ‎2018‎ ‎2018‎ ‎2018‎ 年份代号t ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ ‎6‎ ‎7‎ 人均纯收入y ‎2.9‎ ‎3.3‎ ‎3.6‎ ‎4.4‎ ‎4.8‎ ‎5.2‎ ‎5.9‎ ‎(1)求y关于t的线性回归方程;‎ ‎(2)利用(1)中的回归方程,分析2018年至2018年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民家庭人均纯收入.‎ 附:回归直线的斜率和截距的最小二乘估计公式分别为:‎ ‎=,=-.‎ 解析 (1)由所给数据计算得 ‎=×(1+2+3+4+5+6+7)=4,‎ ‎=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,‎ ‎(ti-)2=9+4+1+0+1+4+9=28,‎ ‎(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,‎ ‎===0.5,‎ ‎=-=4.3-0.5×4=2.3,所求回归方程为=0.5t+2.3.‎ ‎(2)由(1)知,=0.5>0,故2018年至2018年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.‎ 将2018年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,‎ 故预测该地区2018年农村居民家庭人均纯收入为6.8千元.‎ 三年模拟 A组 2018—2018年模拟·基础题组 考点 变量的相关性、统计案例 ‎1.(2018云南昆明一中第一次摸底,2)当变量x的取值为3,4,5,6,7时,变量y对应的值依次为4.0,2.5,-0.5,-1,-2;当变量u的取值为1,2,3,4时,变量v对应的值依次为2,3,4,6,则变量x和y,变量u和v的相关关系是(  )‎ A.变量x和y是正相关,变量u和v是正相关 B.变量x和y是正相关,变量u和v是负相关 C.变量x和y是负相关,变量u和v是负相关 D.变量x和y是负相关,变量u和v是正相关 答案 D ‎2.(2018湖南邵阳二模,3)假设有两个分类变量X和Y的2×2列联表:‎ y1‎ y2‎ 总计 x1‎ a ‎10‎ a+10‎ x2‎ c ‎30‎ c+30‎ 总计 ‎60‎ ‎40‎ ‎100‎ 对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为(  )‎ ‎                     ‎ A.a=45,c=15 B.a=40,c=20‎ C.a=35,c=25 D.a=30,c=30‎ 答案 A ‎3.(2018湖南益阳调研,4)某公司2018~2018年的年利润(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:‎ 年份 ‎2018‎ ‎2018‎ ‎2018‎ ‎2018‎ ‎2018‎ ‎2018‎ 利润x(百万元)‎ ‎12.2‎ ‎14.6‎ ‎16‎ ‎18‎ ‎20.4‎ ‎22.3‎ 支出y(百万元)‎ ‎0.62‎ ‎0.74‎ ‎0.81‎ ‎0.89‎ ‎1.00‎ ‎1.11‎ 根据统计资料,则(  )‎ A.年利润中位数是16,y与x具有正的线性相关关系 B.年利润中位数是17,y与x具有正的线性相关关系 C.年利润中位数是17,y与x具有负的线性相关关系 D.年利润中位数是18,y与x具有负的线性相关关系 答案 B ‎4.(2018江西鹰潭一模,3)以下四个命题:‎ ‎①从匀速传送的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样.‎ ‎②两个随机变量相关性越强,则相关系数的绝对值越接近于1.‎ ‎③在回归直线方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位.‎ ‎④对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大 其中正确的是(  )‎ A.①④ B.②③‎ C.①③ D.②④‎ 答案 B ‎5.(2018广东惠州第三次调研,14)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):‎ 零件数x(个)‎ ‎10‎ ‎20‎ ‎30‎ ‎40‎ ‎50‎ 加工时间y(分钟)‎ ‎62‎ ‎68‎ ‎75‎ ‎81‎ ‎89‎ 由最小二乘法求得回归方程为=0.67x+,则的值为    .  ‎ 答案 54.9‎ B组 2018—2018年模拟·提升题组 ‎(满分:40分 时间:50分钟)‎ 一、选择题(每小题5分,共15分)‎ ‎1.(2018山东实验中学上学期第二次诊断,11)某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下列联表:‎ 男 女 总计 爱好 ‎40‎ ‎20‎ ‎60‎ 不爱好 ‎20‎ ‎30‎ ‎50‎ 总计 ‎60‎ ‎50‎ ‎110‎ 由K2=并参照附表,得到的正确结论是 (  )‎ 附表:‎ P(K2≥k)‎ ‎0.050‎ ‎0.010‎ ‎0.001‎ k ‎3.841‎ ‎6.635‎ ‎10.828‎ A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”‎ B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”‎ C.有99.9%的把握认为“爱好游泳运动与性别有关”‎ D.有99.9%的把握认为“爱好游泳运动与性别无关”‎ 答案 A ‎2.(2018江西南城一中、高安中学等九校3月联考,7)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.‎ 非一线 一线 总计 愿生 ‎45‎ ‎20‎ ‎65‎ 不愿生 ‎13‎ ‎22‎ ‎35‎ 总计 ‎58‎ ‎42‎ ‎100‎ 由K2=,‎ 得K2=≈9.616.‎ 参照下表,‎ P(K2≥k)‎ ‎0.050‎ ‎0.010‎ ‎0.001‎ k ‎3.841‎ ‎6.635‎ ‎10.828‎ 正确的结论是(  )‎ A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”‎ B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”‎ C.有99%以上的把握认为“生育意愿与城市级别有关”‎ D.有99%以上的把握认为“生育意愿与城市级别无关”‎ 答案 C ‎3.(2018福建福州外国语学校适应性考试(一),5)如下表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归方程为=0.8x-155,后因某未知原因第5组数据的y值模糊不清,此位置数据记为m(如表所示),则利用回归方程可求得实数m的值为(  )‎ ‎                     ‎ x ‎196‎ ‎197‎ ‎200‎ ‎203‎ ‎204‎ y ‎1‎ ‎3‎ ‎6‎ ‎7‎ m A.8.3 ‎B.‎8.2 ‎C.8.1 D.8‎ 答案 D 二、解答题(共25分)‎ ‎4.(2018广东东莞模拟,19)某城市随机抽取一年(365天)内100天的空气质量指数AQI的监测数据,结果统计如下:‎ AQI ‎[0,‎ ‎50]‎ ‎(50,‎ ‎100]‎ ‎(100,‎ ‎150]‎ ‎(150,‎ ‎200]‎ ‎(200,‎ ‎250]‎ ‎(250,‎ ‎300]‎ ‎>300‎ 空气 质量 优 良 轻微 污染 轻度 污染 中度 污染 中度 重污染 重度 污染 天数 ‎4‎ ‎13‎ ‎18‎ ‎30‎ ‎9‎ ‎11‎ ‎15‎ 记某企业每天由空气污染造成的经济损失为S(单位:元),空气质量指数AQI为ω.在区间[0,100]对企业没有造成经济损失;在区间(100,300]对企业造成经济损失成直线模型(当AQI为150时,造成的经济损失为500元,当AQI为200时,造成的经济损失为700元);当AQI大于300时,造成的经济损失为2 000元.‎ ‎(1)试写出S(ω)的表达式;‎ ‎(2)试估计在本年内随机抽取一天,该天经济损失S大于200元且不超过600元的概率;‎ ‎(3)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面2×2列联表,并判断能否有95%的把握认为该城市本年空气重度污染与供暖有关.‎ 非重度污染 重度污染 合计 供暖季 非供暖季 合计 ‎100‎ 附:‎ P(K2≥k0)‎ ‎0.25‎ ‎0.15‎ ‎0.10‎ ‎0.05‎ ‎0.025‎ ‎0.010‎ ‎0.005‎ ‎0.001‎ k0‎ ‎1.32‎ ‎2.07‎ ‎2.70‎ ‎3.84‎ ‎8.02‎ ‎6.63‎ ‎7.87‎ ‎10.82‎ K2=.‎ 解析 (1)由已知可得S(ω)=‎ ‎(2)设“在本年内随机抽取一天,该天经济损失S大于200元且不超过600元”为事件A,‎ 由2003.84,‎ 所以有95%的把握认为该城市本年空气重度污染与供暖有关.‎ ‎5.(2018河南百校联盟4月模拟,18)国内某知名连锁店分店开张营业期间,在固定的时间段内消费达到一定标准的顾客可参加一次抽奖活动,随着抽奖活动的有效开展,参与抽奖活动的人数越来越多,该分店经理对开业前7天参加抽奖活动的人数进行统计,y表示开业第x天参加抽奖活动的人数,得到统计表格如下:‎ x ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ ‎6‎ ‎7‎ y ‎5‎ ‎8‎ ‎8‎ ‎10‎ ‎14‎ ‎15‎ ‎17‎ 经过进一步统计分析,发现y与x具有线性相关关系.‎ ‎(1)根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;‎ ‎(2)若该分店此次抽奖活动自开业起,持续10天,参加抽奖的每位顾客抽到一等奖(奖品价值200元)的概率为,抽到二等奖(奖品价值100元)的概率为,抽到三等奖(奖品价值10元)的概率为.试估计该分店在此次抽奖活动结束时共送出价值多少元的奖品.‎ 参考公式:=,=-.‎ 解析 (1)依题意知=×(1+2+3+4+5+6+7)=4,‎ ‎=×(5+8+8+10+14+15+17)=11,‎ ‎===2,=-=11-2×4=3,‎ 则y关于x的线性回归方程为=2x+3.‎ ‎(2)设一位参加抽奖的顾客获得的奖品价值X元,则X的分布列为 X ‎200‎ ‎100‎ ‎10‎ P EX=200×+100×+10×=.‎ 由y关于x的线性回归方程为=2x+3,‎ 得x=8时,=19,x=9时,=21,x=10时,=23,‎ 则此次活动参加抽奖的人数约为5+8+8+10+14+15+17+19+21+23=140,又140×=8 800,‎ 所以估计该分店在此次抽奖活动结束时共送出价值8 800元的奖品.‎ C组 2018—2018年模拟·方法题组 ‎ ‎ 方法1 回归直线方程的求解 ‎                     ‎ ‎1.(2018陕西汉中一模,3)已知两个随机变量x,y之间的相关关系如表所示:‎ x ‎-4‎ ‎-2‎ ‎1‎ ‎2‎ ‎4‎ y ‎-5‎ ‎-3‎ ‎-1‎ ‎-0.5‎ ‎1‎ 根据上述数据得到的回归方程为=x+,则大致可以判断(  )‎ A.>0,>0 B.>0,<0‎ C.<0,>0 D.<0,<0‎ 答案 C ‎2.(2018重庆南开二诊模拟,18)某品牌新款夏装即将上市,为了对夏装进行合理定价,在该地区的三家连锁店各进行了两天试销售,得到如下数据:‎ 连锁店 A店 B店 C店 售价x(元)‎ ‎80‎ ‎86‎ ‎82‎ ‎88‎ ‎84‎ ‎90‎ 销售量y(件)‎ ‎88‎ ‎78‎ ‎85‎ ‎75‎ ‎82‎ ‎66‎ ‎(1)以三家连锁店分别的平均售价和平均销量为样本数据,求出售价与销量的回归直线方程=x+;‎ ‎(2)在大量投入市场后,销售量与单价仍然服从(1)中的关系,且该夏装成本价为40元/件,为使该款夏装在销售上获得最大利润,该款夏装的单价应定为多少元?(保留整数)‎ 附:==-.‎ 解析 (1)A,B,C三家连锁店平均售价和销量分别为(83,83),(85,80),(87,74),∴=85,=79,∴==-2.25,‎ ‎∴=-=270.25,∴=-2.25x+270.25.‎ ‎(2)设该款夏装的单价为x元,利润为f(x)元,则f(x)=(x-40)(-2.25x+270.25)=-2.25x2+360.25x-10 810,∴当x≈80时, f(x)取得最大值.故该款夏装的单价应定为80元.‎ 方法2 独立性检验 ‎3.(2018湖南师大附中月考(三),14)在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:‎ 感染 未感染 总计 服用 ‎10‎ ‎40‎ ‎50‎ 未服用 ‎20‎ ‎30‎ ‎50‎ 总计 ‎30‎ ‎70‎ ‎100‎ 参照附表,在犯错误的概率不超过    (填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”. ‎ 参考公式:K2=.‎ P(K2≥k0)‎ ‎0.10‎ ‎0.05‎ ‎0.025‎ ‎0.010‎ ‎0.005‎ ‎0.001‎ k0‎ ‎2.706‎ ‎3.841‎ ‎5.024‎ ‎6.635‎ ‎7.879‎ ‎10.828‎ 答案 5%‎ ‎4.(2018安徽合肥二模,18)某校计划面向高一年级1 200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类,自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.‎ ‎(1)分别计算抽取的样本中男生及女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生数;‎ ‎(2)根据抽取的180名学生的调查结果,完成下列列联表,并判断能否在犯错误的概率不超过0.025的前提下认为课程的选择与性别有关.‎ 选择自然科学类 选择社会科学类 合计 男生 ‎45‎ ‎105‎ 女生 ‎45‎ 合计 ‎180‎ 附:K2=,其中n=a+b+c+d.‎ P(K2≥k0)‎ ‎0.50‎ ‎0.40‎ ‎0.25‎ ‎0.15‎ ‎0.10‎ ‎0.05‎ ‎0.025‎ ‎0.010‎ ‎0.005‎ ‎0.001‎ k0‎ ‎0.455‎ ‎0.708‎ ‎1.323‎ ‎2.072‎ ‎2.706‎ ‎3.841‎ ‎5.024‎ ‎6.635‎ ‎7.879‎ ‎10.828‎ 解析 (1)由条件知,抽取的男生为105人,女生为180-105=75人,‎ 男生选择社会科学类的频率为,女生选择社会科学类的频率为,‎ 由题意知,高一年级的男生总数为1 200×=700,女生总数为1 200×=500,所以估计实际选课中选择社会科学类的学生数为700×+500×=600人.‎ ‎(2)根据统计数据,可得列联表如下:‎ 选择自然科学类 选择社会科学类 合计 男生 ‎60‎ ‎45‎ ‎105‎ 女生 ‎30‎ ‎45‎ ‎75‎ 合计 ‎90‎ ‎90‎ ‎180‎ K2==≈5.1429>5.024,‎ 所以在犯错误的概率不超过0.025的前提下认为课程的选择与性别有关.‎