• 124.87 KB
  • 2021-07-01 发布

【数学】2020一轮复习北师大版(理)54 相关性、最小二乘估计与统计案例作业

  • 9页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
课时规范练54 相关性、最小二乘估计与统计案例 ‎                  ‎ 基础巩固组 ‎1.(2018福建莆田模拟,3)设一个线性回归方程y=3+1.2x,当变量x每增加一个单位时,则y的变化情况正确的是(  )‎ A.y平均增加约1.2个单位 B.y平均增加约3个单位 C.y平均减少约1.2个单位 D.y平均减少约3个单位 ‎2.(2018黑龙江模拟十,6)下列表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归直线方程为y=0.8x-155,后因某未知原因使第5组数据的y值模糊不清,此位置数据记为m(如下表所示),则利用回归方程可求得实数m的值为(  )‎ x ‎196‎ ‎197‎ ‎200‎ ‎203‎ ‎204‎ y ‎1‎ ‎3‎ ‎6‎ ‎7‎ m A.8.3 B.8.2 C.8.1 D.8‎ ‎3.(2018广东佛山二模,5)某同学用收集到的6组数据对(xi,yi)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l的方程为y=bx+a,相关系数为r.现给出以下3个结论:①r>0;②直线l恰好过点D;③b>1.其中正确结论是(  )‎ A.①② B.①③‎ C.②③ D.①②③‎ ‎4.(2018辽南协作校一模,3)根据如下样本数据得到回归直线方程y=bx+a,其中a=10.5,则当x=6时,y的估计值是(  )‎ x ‎4‎ ‎2‎ ‎3‎ ‎5‎ y ‎49‎ ‎26‎ ‎39‎ ‎54‎ A.57.5 B.61.5‎ C.64.5 D.67.5‎ ‎5.(2018黑龙江仿真模拟十一,5)某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:‎ 使用智能手机 不使用智能手机 总计 学习成绩优秀 ‎4‎ ‎8‎ ‎12‎ 学习成绩不优秀 ‎16‎ ‎2‎ ‎18‎ 总 计 ‎20‎ ‎10‎ ‎30‎ 附表:‎ P(χ2>k0)‎ ‎0.10‎ ‎0.05‎ ‎0.010‎ k0‎ ‎2.706‎ ‎3.841‎ ‎6.635‎ 经计算χ2=10,则下列选项正确的是(  )‎ A.有99%的把握认为使用智能手机对学习有影响 B.有99%的把握认为使用智能手机对学习无影响 C.有95%的把握认为使用智能手机对学习有影响 D.有95%的把握认为使用智能手机对学习无影响 ‎6.(2018河南洛阳质检,13)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟订的价格进行试销,得到如下数据.‎ 单价x/元 ‎4‎ ‎5‎ ‎6‎ ‎7‎ ‎8‎ ‎9‎ 销量y/件 ‎90‎ ‎84‎ ‎83‎ ‎80‎ ‎75‎ ‎68‎ 由表中数据求得线性回归方程y=-4x+a,则x=10元时预测销量为     件. ‎ ‎7.(2018河南商丘模拟,19)已知具有线性相关关系的两个变量x,y之间的几组数据如下表所示:‎ x ‎2‎ ‎4‎ ‎6‎ ‎8‎ ‎10‎ y ‎3‎ ‎6‎ ‎7‎ ‎10‎ ‎12‎ ‎(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a,并估计当x=20时,y的值;‎ ‎(2)将表格中的数据看作五个点的坐标,则从这五个点中随机抽取2个点,求恰有1个点落在直线2x-y-4=0右下方的概率.‎ 参考公式:b=‎∑‎i=1‎nxiyi‎-nx ‎y‎∑‎i=1‎nxi‎2‎‎-n(‎x‎)‎‎2‎,a=y-bx.‎ 综合提升组 ‎8.(2018河北保定一模,3)已知具有线性相关的变量x,y,设其样本点为Ai(xi,yi)(i=1,2,…,8),回归直线方程为y=‎1‎‎2‎x+a,若OA‎1‎‎+‎OA‎2‎+…+OA‎8‎=(6,2),(O为原点),则a=(  )‎ A.‎1‎‎8‎ B.-‎1‎‎8‎ C.‎1‎‎4‎ D.-‎‎1‎‎4‎ ‎9.(2018安徽合肥一中最后1卷,文13)为了研究某班学生的脚长x(单位:cm)和身高y(单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y=bx+a.已知‎∑‎i=1‎‎10‎xi=225,‎∑‎i=1‎‎10‎yi=1 600,b=4.该班某学生的脚长为24 cm,据此估计其身高为      cm. ‎ ‎10.(2018安徽蚌埠一模,文19)某图书公司有一款图书的历史收益率(收益率=利润÷每本收入)的频率分布直方图如图所示:‎ ‎(1)试估计平均收益率;(用区间中点值代替每一组的数值)‎ ‎(2)根据经验,若每本图书的收入在20元的基础上每增加x元,对应的销量y(万本)与x(元)有较强线性相关关系,从历史销售记录中抽样得到如下5组x与y的对应数据:‎ x元 ‎25‎ ‎30‎ ‎38‎ ‎45‎ ‎52‎ 销量y万本 ‎7.5‎ ‎7.1‎ ‎6.0‎ ‎5.6‎ ‎4.8‎ 据此计算出的回归方程为y=10.0-bx.‎ ‎①求参数b的估计值;‎ ‎②若把回归方程y=10.0-bx当作y与x的线性关系,x取何值时,此产品获得最大收益?求出该最大收益.‎ ‎11.(2018山东日照5月校际联考,19)为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是:①“盲拍”,即所有参与竞拍的人都要网络报价一次,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加2018年5月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的数据,统计了最近5个月参与竞拍的人数(见下表):‎ 月 份 ‎2017.12‎ ‎2018.01‎ ‎2018.02‎ ‎2018.03‎ ‎2018.04‎ 月份编号t ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ 竞拍人数 y(万人)‎ ‎0.5‎ ‎0.6‎ ‎1‎ ‎1.4‎ ‎1.7‎ ‎(1)由收集数据的散点图发现,可用线性回归模型拟合竞拍人数y(万人)与月份编号t之间的相关关系.请用最小二乘法求出y关于t的线性回归方程:y=bt+a,并预测2018年5月份参与竞拍的人数.‎ ‎(2)某市场调研机构从拟参加2018年5月份车牌竞拍人员中,随机抽取了200人,对他们的拟报价价格进行了调查,得到如下频数分布表和频率分布直方图:‎ 报价区间 ‎(万元)‎ ‎[1,2)‎ ‎[2,3)‎ ‎[3,4)‎ ‎[4,5)‎ ‎[5,6)‎ ‎[6,7)‎ ‎[7,8)‎ 频数 ‎10‎ ‎30‎ a ‎60‎ ‎30‎ ‎20‎ ‎10‎ ‎①求a,b的值及这200位竞拍人员中报价大于5万元的人数;‎ ‎②若2018年5月份车牌配额数量为3 000,假设竞拍报价在各区间分布是均匀的,请你根据以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价.‎ 参考公式及数据:①y=bx+a,其中b=‎∑‎i=1‎nxiyi‎-nx ‎y‎∑‎i=1‎nxi‎2‎‎-nx‎2‎,a=y-bx;②‎∑‎i=1‎‎5‎ti‎2‎=55,‎∑‎i=1‎‎5‎tiyi=18.8.‎ 创新应用组 ‎12.(2018黑龙江哈尔滨三中一模,10)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,哈三中积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:‎ 年份(届)‎ ‎2014‎ ‎2015‎ ‎2016‎ ‎2017‎ 学科竞赛获省级一等奖 及以上学生人数x ‎51‎ ‎49‎ ‎55‎ ‎57‎ 被清华、北大等世界名校 录取的学生人数y ‎103‎ ‎96‎ ‎108‎ ‎107‎ 根据上表可得回归方程y=bx+a中的b为1.35,我校2018届同学在学科竞赛中获省级一等奖以上学生人数为63人,据此模型预报我校今年被清华、北大等世界名校录取的学生人数为(  )‎ A.111 B.115 C.117 D.123‎ ‎13.(2018湖北七校联盟2月联考,19)已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度x(单位:℃),对某种鸡的时段产蛋量y(单位:t)和时段投入成本z(单位:万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度xi和产蛋量yi(i=1,2,…,7)的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.‎ x y k ‎∑‎i=1‎‎7‎‎(xi-x)‎‎2‎ ‎17.40‎ ‎82.30‎ ‎3.6‎ ‎140‎ ‎∑‎i=1‎‎7‎‎(ki-k)‎‎2‎ ‎∑‎i=1‎‎7‎‎(xi-x)(yi-y)‎ ‎∑‎i=1‎‎7‎‎(xi-x)(ki-k)‎ ‎9.7‎ ‎2 935.1‎ ‎35.0‎ 其中ki=ln yi,k‎=‎‎1‎‎7‎‎∑‎i=1‎‎7‎ki.‎ ‎(1)根据散点图判断,y=bx+a与y=c1ec‎2‎x哪一个更适宜作为该种鸡的时段产蛋量y关于鸡舍时段控制温度x的回归方程类型?(给判断即可,不必说明理由)‎ ‎(2)若用y=c1ec‎2‎x作为回归方程模型,根据表中数据,建立y关于x的回归方程;‎ ‎(3)已知时段投入成本z与x,y的关系为z=e-2.5y-0.1x+10,当时段控制温度为28 ℃时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?‎ 附:①对于一组具有有线性相关关系的数据(μi,vi)(i=1,2,3,…,n),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为β=‎∑‎i=1‎n‎(ui-u)(vi-v)‎‎∑‎i=1‎n‎(ui-u)‎‎2‎,α=v-βu ‎②‎ e-2.5‎ e-0.75‎ e e3‎ e7‎ ‎0.08‎ ‎0.47‎ ‎2.72‎ ‎20.09‎ ‎1 096.63‎ ‎                  ‎ 参考答案 课时规范练54 相关性、最小二乘估计与统计案例 ‎1.A 令x=a,y=3+1.2a,令x=a+1,则y=3+1.2(a+1)=4.2+1.2a,所以当变量x每增加一个单位时,则y平均增加约1.2个单位,故选A.‎ ‎2.D 由题意可得:x=‎196+197+200+203+204‎‎5‎=200,y=‎1+3+6+7+m‎5‎=‎17+m‎5‎,回归方程过样本中心点,则:‎17+m‎5‎=0.8×200-155,解得m=8,故选D.‎ ‎3.A 由题图可知这些点分布在一条斜率大于零的直线附近,所以为正相关,即相关系数r>0;‎ 因为x=‎0+1+2+3+5+7‎‎6‎=3,y=‎1.5+2+2.3+3+5+4.2‎‎6‎=3,‎ 所以回归直线l的方程必过点(3,3),即直线l恰好过点D.因为直线l斜率接近于AD斜率,而kAD=‎3-1.5‎‎3‎=‎1‎‎2‎<1,所以③错误,综上正确结论是①②,故选A.‎ ‎4.C 自变量x的平均数x=‎4+2+3+5‎‎4‎=3.5,自变量y的平均数y=‎49+26+39+54‎‎4‎=42.‎ ‎∵线性回归直线方程y=bx+a过样本中心点(x,y),其中a=10.5,∴42=b×3.5+10.5,即b=9.‎ ‎∴当x=6时,y=9×6+10.5=64.5,故选C.‎ ‎5.A 由于χ2=10>6.635,据此结合独立性检验的思想可知:有99%的把握认为使用智能手机对学习有影响,故选A.‎ ‎6.66 由已知得x=‎1‎‎6‎(4+5+6+7+8+9)=‎13‎‎2‎,y=‎1‎‎6‎(90+84+83+80+75+68)=80,‎ ‎∴a=80+4×‎13‎‎2‎=106,∴当x=10时,y=106-40=66,故答案为66.‎ ‎7.解 (1)x=‎1‎‎5‎(2+4+6+8+10)=6,y=‎1‎‎5‎(3+6+7+10+12)=7.6,‎ ‎∑‎i=1‎‎5‎xi‎2‎‎=4+16+36+64+100=220,‎∑‎i=1‎‎5‎xiyi=6+24+42+80+120=272,‎ b=‎∑‎i=1‎‎5‎xiyi‎-5x ‎y‎∑‎i=1‎‎5‎xi‎2‎‎-5(‎x‎)‎‎2‎=‎272-5×6×7.6‎‎220-5×‎‎6‎‎2‎=‎44‎‎40‎=1.1,∴a=7.6-6×1.1=1,‎ ‎∴回归直线方程为y=1.1x+1,故当x=20时,y=23.‎ ‎(2)可以判断,落在直线2x-y-4=0右下方的点满足2x-y-4>0,‎ 故符合条件的点的坐标为(6,7),(8,10),(10,12),共有10种取法,满足条件的有6种,所以P=‎6‎‎10‎=‎3‎‎5‎.‎ ‎8.B 因为OA‎1‎+OA‎2‎+…+OA‎8‎=(x1+x2+…+x8,y1+y2+…+y8)=(8x,8y)=(6,2),所以8x=6,8y=2⇒x=‎3‎‎4‎,y=‎1‎‎4‎,因此‎1‎‎4‎=‎1‎‎2‎×‎3‎‎4‎+a,即a=-‎1‎‎8‎,故选B.‎ ‎9.166 由‎∑‎i=1‎‎10‎xi=225,‎∑‎i=1‎‎10‎yi=1 600,利用平均值公式求得x=22.5,y=160,‎ ‎∵b=4,∴a=160-4×22.5=70,从而当x=24时,y=4×24+70=166,故答案为166.‎ ‎10.解 (1)区间中值依次为:0.05,0.15,0.25,0.35,0.45,0.55,取值的估计概率依次为:0.1,0.2,0.25,0.3,0.1,0.05,故平均收益率为 ‎0.05×0.10+0.15×0.20+0.25×0.25+0.35×0.30+0.45×0.10+0.55×0.05=0.275.‎ ‎(2)①x=‎25+30+38+45+52‎‎5‎=‎190‎‎5‎=38,y=‎7.5+7.1+6.0+5.6+4.8‎‎5‎=‎31‎‎5‎=6.2,‎ 将(38,6.2)代入y=10-bx,得b=‎10.0-6.2‎‎38‎=0.10.‎ ‎②设每本图书的收入是20+x元,则销量为y=10-0.1x,则图书总收入为 f(x)=(20+x)(10-0.1x)=200+8x-0.1x2=360-0.1(x-40)2(万元),‎ 当x=40时,图书公司总收入最大为360万元,预计获利为360×0.275=99万元.‎ ‎11.解 (1)易知t=‎1+2+3+4+5‎‎5‎=3,y=‎0.5+0.6+1+1.4+1.7‎‎5‎=1.04,b=‎∑‎i=1‎‎5‎tiyi‎-5t ‎y‎∑‎i=1‎‎5‎ti‎2‎‎-5‎t‎2‎=‎18.8-5×3×1.04‎‎55-5×‎‎3‎‎2‎=0.32,a=y-bt=1.04-0.32×3=0.08,‎ 则y关于t的线性回归方程为y=0.32t+0.08,当t=6时,y=2.00,即2018年5月份参与竞拍的人数估计为2万人.‎ ‎(2)①由a‎200‎=0.20解得a=40.由频率和为1,得(0.05×2+0.10+2b+0.20+0.30)×1=1,解得b=0.15,200位竞拍人员报价大于5万元的人数为(0.05+0.10+0.15)×200=60人.‎ ‎②2018年5月份实际发放车牌数量为3 000,根据竞价规则,报价在最低成交价以上人数占总人数比例为‎3 000‎‎20 000‎×100%=15%;又由频率分布直方图知竞拍报价大于6万元的频率为0.05+0.10=0.15,‎ 所以,根据统计思想(样本估计总体)可预测2018年5月份竞拍的最低成交价为6万元.‎ ‎12.C 由题意得x=‎51+49+55+57‎‎4‎=53,y=‎103+96+108+107‎‎4‎=103.5.‎ ‎∵数据的样本中心点在线性回归直线上,y=bx+a中的b为1.35,∴103.5=1.35×53+a,即a=31.95,∴线性回归方程是y=1.35x+31.95.‎ ‎∵2018届同学在学科竞赛中获省级一等奖以上学生人数为63人,‎ ‎∴今年被清华、北大等世界名校录取的学生人数为1.35×63+31.95=117,故选C.‎ ‎13.解 (1)y=c1ec‎2‎x适宜.‎ ‎(2)由y=c1ec‎2‎x得ln y=c2x+ln c1,令ln y=k,c2=β,α=ln c1,由图表中的数据可知β=‎35‎‎140‎=‎1‎‎4‎,α=-‎3‎‎4‎,∴k=‎1‎‎4‎x-‎3‎‎4‎,∴y关于x的回归方程为y=ex‎4‎‎-‎‎3‎‎4‎=0.47ex‎4‎.‎ ‎(3)当x=28时,由回归方程得y=0.47×1 096.63=515.4,z=0.08×515.4-2.8+10=48.432.‎ 即鸡舍的温度为28 ℃时,鸡的时段产量的预报值为515.4,投入成本的预报值为48.432.‎