- 366.62 KB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
专题5 相关性与回归直线方程
1.两个变量线性相关
(1)散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.
(2)正相关与负相关
①正相关:散点图中的点散布在从左下角到右上角的区域.
②负相关:散点图中的点散布在从左上角到右下角的区域.
2.回归直线的方程
(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程.
(3)回归方程的推导过程:
①假设已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn).
②设所求回归方程为=x+,其中,是待定参数.
③由最小二乘法得
.
其中,是回归方程的斜率,是截距.
例1 在下列两个变量的关系中,哪些是相关关系?
①正方形边长与面积之间的关系;
②作文水平与课外阅读量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
变式1 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?有人认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?
例2 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:
画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.
变式2 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:
(1)画出散点图;
(2)关于加工零件的个数与加工时间,你能得出什么结论?
例3 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;
(3)求回归方程;
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.
变式3 下表为某地近几年机动车辆数与交通事故数的统计资料.
(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;
(2)如果具有线性相关关系,求出回归直线方程.
A级
1.下列两个变量之间的关系:
①角度和它的余弦值;
②正n边形的边数与内角和;
③家庭的支出与收入;
④某户家庭用电量与电价间的关系.
其中是相关关系的有( )
A.1个 B.2个 C.3个 D.4个
2.回归直线方程 = x+ 必过( )
A.点(0,0) B.点(,0)
C.点(0,) D.点(,)
3.在对两个变量x,y进行线性回归分析时有下列步骤:
①用所求出的回归方程作出估计;②收集数据(xi,yi),i=1,2,…,n;③求回归直线方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可靠性要求能够作出变量x,y具有线性相关结论,则正确的操作顺序是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
4.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的回归直线(如图),以下结论中正确的是( )
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同
D.直线l过点(,)
5.若对某个地区人均工资x与该地区人均消费y进行调查统计得y与x具有相关关系,且回归方程 =0.7x+2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为________.
6.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的回归方程为 =6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差________分.
7.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程 = x+ ,其中 =0.76, =- .据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
B级
8.某产品的广告费用x与销售额y的统计数据如下表:
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
9.工人月工资(元)依劳动生产率(千元)变化的回归方程为 =60+90x,下列判断正确的是( )
A.劳动生产率为1千元时,工资为50元
B.劳动生产率提高1千元时,工资提高150元
C.劳动生产率提高1千元时,工资约提高90元
D.劳动生产率为1千元时,工资为90元
10.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A. =-10x+200 B. =10x+200
C. =-10x-200 D. =10x-200
11.如图所示,有5组(x,y)数据,去掉数据________后,剩下的4组数据的线性相关性变强( )
A.E B.D C.B D.A
12.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm.
13.下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程= x+ ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
详解答案
典型例题
例1 解 两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系.
变式1 解 从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.
例2 解 散点图如下:
由上图可看出,销售价格与房屋面积这两个变量正相关.
变式2 解 (1)散点图如下:
(2)加工零件的个数与所花费的时间呈正线性相关关系.
例3 解 (1)散点图如图所示:
(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.
(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.利用计算器容易求得回归方程=-2.352x+147.767.
(4)当x=2时,=143.063.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.
变式3 解 (1)在直角坐标系中画出数据的散点图,如下图.
直观判断散点在一条直线附近,故具有线性相关关系.
(2)计算相应的数据之和:
i=1 031,i=71.6,
=137 835,iyi=9 611.7.
将它们代入公式计算得≈0.077 4,≈-1.024 9,
所以,所求回归方程为=0.077 4x-1.024 9.
强化提高
1.A 2.D
3.D [本题考查具有线性相关关系的两个变量的研究步骤,应先收集数据,再作散点图,求相关系数,求回归方程,最后应用回归方程作出估计,则顺序为②⑤④③①.]
4.D [相关系数r的计算公式与l斜率的计算公式不一样,故A错;由|r|<1知B错;分布在l两侧的点的个数没有什么规律,故C错;(,)为样本点的中心,回归直线过样本的中心,故D正确.]
5.87.5%
解析 设该地区人均工资收入为,则=0.7+2.1,当=10.5时,==12.×100%=87.5%.
6.20
解析 令两人的总成绩分别为x1,x2.
则对应的数学成绩估计为
1=6+0.4x1, 2=6+0.4x2,所以| 1- 2|=|0.4(x1-x2)|=0.4×50=20.
7.B [先求 ,再利用回归直线方程预测.
由题意知,
==10,
==8,
∴ =8-0.76×10=0.4,
∴当x=15时, =0.76×15+0.4=11.8(万元).]
8.B [由题意可知=3.5,=42,则42=9.4×3.5+,=9.1,=9.4×6+9.1=65.5,答案应选B.]
9.C [因工人月工资与劳动生产率变化的回归方程为 =60+90x,当x由a提高到a+1时, 2- 1=60+90(a+1)-60-90a=90.]
10.A 11.B
12.185
解析 根据题中所提供的信息,可知父亲与儿子的对应数据可列表如下:
=173,=176,∴===1,=-=176-173=3,∴回归方程为=x+3,从而可预测他孙子的身高为182+3=185(cm).
13.解 (1)散点图如下图所示:
(2)==4.5,
==3.5,
xiyi=3×2.5+4×3+5×4+6×4.5=66.5,x=32+42+52+62=86,
∴ ==
=0.7,
=- =3.5-0.7×4.5=0.35.
∴所求的回归方程为=0.7x+0.35.
(3)现在生产100吨甲产品用煤
=0.7×100+0.35=70.35,
∴90-70.35=19.65.
∴生产能耗比技改前降低约19.65吨标准煤.