- 356.00 KB
- 2021-05-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
学案58 变量间的相关关系
导学目标: 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
自主梳理
1.两个变量的线性相关
(1)正相关
在散点图中,点散布在从__________到________的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关
在散点图中,点散布在从________到________的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
2.回归方程
(1)最小二乘法
求回归直线使得样本数据的点到它的________________________的方法叫做最小二乘法.
(2)回归方程
方程 = x+ 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中 , 是待定参数.
自我检测
1.下列有关线性回归的说法,不正确的是( )
A.相关关系的两个变量不一定是因果关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任一组数据都有回归直线方程
2.(2009·海南,宁夏)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
3.(2011·银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
由散点图可知,用水量y与月份x之间有较好的线性相关关系,其回归直线方程是 =-0.7x+ ,则 等于( )
A.10.5 B.5.15 C.5.2 D.5.25
4.(2010·广东)某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份
2005
2006
2007
2008
2009
收入x
11.5
12.1
13
13.3
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭年平均收入的中位数是_________________________________,
家庭年平均收入与年平均支出有______线性相关关系.
5.(2011·金陵中学模拟)已知三点(3,10),(7,20),(11,24)的横坐标x与纵坐标y具有线性关系,则其回归方程是________________.
探究点一 利用散点图判断两个变量的相关性
例1 有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出热饮杯数与当天气温的对比表:
温度
(℃)
-5
0
4
7
12
15
19
23
27
31
36
热饮
杯数
156
150
132
128
130
116
104
89
93
76
54
(1)画出散点图;
(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗?
变式迁移1 某班5个学生的数学和物理成绩如表:
学生
学科
A
B
C
D
E
数学
80
75
70
65
60
物理
70
66
68
64
62
画出散点图,并判断它们是否有相关关系?
探究点二 求回归直线方程
例2 假设关于某设备的使用年限x和所支出的维修费用y(万元)有以下统计资料:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知y对x呈线性相关关系.试求回归方程 = x+ .
变式迁移2 已知变量x与变量y有下列对应数据:
x
1
2
3
4
y
2
3
且y对x呈线性相关关系,求y对x的回归直线方程.
探究点三 利用回归方程对总体进行估计
例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程 = x+ ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
变式迁移3 (2011·盐城期末)某单位为了了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得回归方程 = x+ 中 =-2,预测当气温为-4℃时,用电量的度数约为________.
1.相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.回归直线方程:设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:
= x+ .其中
我们称这个方程为y对x的回归直线方程.其中=xi,=yi,(,)称为样本点的中心.
3.求回归直线方程的步骤:(1)计算出、、x、xiyi的值;(2)计算回归系数 、 ;(3)写出回归直线方程 = x+ .
(满分:75分)
一、选择题(每小题5分,共25分)
1.下列命题:
①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
③通过回归直线 = x+ 及回归系数 ,可以估计和预测变量的取值和变化趋势.
其中正确的命题是( )
A.①② B.①③ C.②③ D.①②③
2.设有一个回归直线方程为 =2-1.5x,则变量x增加一个单位时( )
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
D.y平均减少2个单位
3.(2011·陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同
D.直线l过点(,)
4.(2011·山东)某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得线性回归方程 = x+ 中的 为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
5.(2011·青岛模拟)为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别是s、t,那么下列说法中正确的是( )
A.直线l1和l2一定有公共点(s,t)
B.直线l1和l2相交,但交点不一定是(s,t)
C.必有l1∥l2
D.l1与l2必定重合
二、填空题(每小题4分,共12分)
6.下列关系中,是相关关系的为________.(填序号)
①学生的学习态度与学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
7.已知回归直线的斜率的估计值是0.73,样本点的中心为(12.5,8.25),则回归直线的回归方程是______________.
8.(2011·茂名月考)在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下表:
温度(x)
0
10
20
50
70
溶解度(y)
66.7
76.0
85.0
112.3
128.0
则由此得到回归直线的斜率为________.
三、解答题(共38分)
9.(12分)(2011·威海模拟)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的回归方程 = x+ ,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少时间?
(注: =, =- )
10.(12分)(2010·许昌模拟)某种产品的宣传费支出x与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)求回归直线方程;
(3)试预测宣传费支出为10万元时,销售额多大?
11.(14分)某企业上半年产品产量与单位成本资料如下:
月份
产量(千件)
单位成本(元)
1
2
73
2
3
72
3
4
71
4
3
73
5
4
69
6
5
68
(1)求出回归方程;
(2)指出产量每增加1 000件时,单位成本平均变动多少?
(3)假定产量为6 000件时,单位成本为多少元?
学案58 变量间的相关关系
自主梳理
1.(1)左下角 右上角 (2)左上角 右下角 2.(1)距离的平方和最小 (2)
-
自我检测
1.D 2.C 3.D
4.13 正 5. =x+
课堂活动区
例1 解题导引 判断变量间是否线性相关,一种常用的简便可行的方法就是作散点图.
散点图是由大量数据点分布构成的,是定义在具有相关关系的两个变量基础之上的,对于性质不明确的两组数据可先作散点图,直观地分析它们有无关系及关系的密切程度.
解 (1)以x轴表示温度,以y轴表示热饮杯数,可作散点图,如图所示.
(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间是负相关关系,即气温越高,卖出去的热饮杯数越少.
从散点图可以看出,这些点大致分布在一条直线附近.
变式迁移1 解 以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如下图所示:
由散点图可见,两者之间具有相关关系.
例2 解题导引 根据题目给出的数据,利用公式求回归系数,然后获得回归方程.
解 制表如下:
i
1
2
3
4
5
合计
xi
2
3
4
5
6
20
yi
2.2
3.8
5.5
6.5
7.0
25
xiyi
4.4
11.4
22.0
32.5
42.0
112.3
x
4
9
16
25
36
90
=4;=5; x2i=90;xiyi=112.3
于是有 ===1.23;
=-=5-1.23×4=0.08.
∴回归直线方程为 =1.23x+0.08.
变式迁移2 解 ==,
==,
x=12+22+32+42=30,
xiyi=1×+2×+3×2+4×3=,
∴ ===0.8,
=-=-0.8×=-0.25,
∴ =0.8x-0.25.
例3 解题导引 利用描点法得到散点图,按求回归方程的步骤和公式,写出回归方程,最后对总体进行估计.
利用回归方程可以进行预测,回归方程将部分观测值所反映的规律进行延伸,是我们对有线性相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量值的基础和依据,有广泛的应用.
解 (1)散点图:
(2)==4.5,==3.5,
xiyi=3×2.5+4×3+5×4+6×4.5=66.5.
x=32+42+52+62=86,
∴ =
==0.7,
=- =3.5-0.7×4.5=0.35.
∴所求的回归方程为 =0.7x+0.35.
(3)现在生产100吨甲产品用煤
=0.7×100+0.35=70.35,
∴降低90-70.35=19.65(吨标准煤).
变式迁移3 68
解析 =10,=40,回归方程过点(,),
∴40=-2×10+ .∴ =60.
∴ =-2x+60.
令x=-4,=(-2)×(-4)+60=68.
课后练习区
1.D [根据线性回归的含义、方法、作用分析这三个命题都是正确的.]
2.C [设(x1,y1),(x2,y2)在直线上,若x2=x1+1,则y2-y1=(2-1.5x2)-(2-1.5x1)=1.5(x1-x2)=-1.5,y平均减少1.5个单位.]
3.D [因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以A、B错误.C中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以C错误.根据线性回归方程一定经过样本中心点可知D正确.所以选D.]
4.B [∵==,==42,
又 = x+ 必过(,),∴42=×9.4+ ,∴ =9.1.
∴线性回归方程为 =9.4x+9.1.
∴当x=6时, =9.4×6+9.1=65.5(万元).]
5.A [回归直线方程为 = x+ .而 =- ,
即 =t- s,t= s+ .∴(s,t)在回归直线上.
∴直线l1和l2一定有公共点(s,t).]
6.①②
解析 ①中学生的学习态度与学习成绩之间不是因果关系,但具有相关性,是相关关系.②教师的执教水平与学生的学习成绩之间的关系是相关关系.③④都不具备相关关系.
7. =0.73x-0.875
解析 =- =8.25-0.73×12.5=-0.875.
8.0.880 9
解析 =30,=93.6,
x=7 900,xiyi=17 035,
∴回归直线的斜率为
==≈0.880 9.
9.解
(1)散点图如图所示.(4分)
(2)由表中数据得xiyi=52.5,
=3.5,=3.5,x=54,
∴ =0.7.∴ =- =1.05.
∴ =0.7x+1.05.回归直线如图中所示.(10分)
(3)将x=10代入回归直线方程,
得y=0.7×10+1.05=8.05(小时),
∴预测加工10个零件需要8.05小时.(12分)
10.解 (1)根据表中所列数据可得散点图如图所示:
(4分)
(2)计算得:==5,==50,
x=145,xiyi=1 380.
于是可得 ===6.5,
=-=50-6.5×5=17.5,
因此,所求回归直线方程是 =6.5x+17.5.(10分)
(3)由上面求得的回归直线方程可知,当宣传费支出为10万元时, =6.5×10+17.5=82.5(万元),
即这种产品的销售大约为82.5万元.(12分)
11.解 (1)n=6,xi=21,yi=426,=3.5,=71,
x=79,xiyi=1 481,
==≈-1.82.
(3分)
=- =71+1.82×3.5=77.37.(5分)
∴回归方程为 = +x=77.37-1.82x.(6分)
(2)因为单位成本平均变动 =-1.82<0,且产量x的计量单位是千件,所以根据回归系数b的意义有:
产量每增加一个单位即1 000件时,单位成本平均减少1.82元.(10分)
(3)当产量为6 000件时,即x=6,代入回归方程:
=77.37-1.82×6=66.45(元).
∴当产量为6 000件时,单位成本为66.45元.
(14分)