- 282.50 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
§2.3 变量的相关性
课时目标 1.通过收集现实问题中两个有关联变量的数据,作出散点图,并利用散点
图直观认识变量间的相关关系.2.经历用不同估算方法描述两个变量线性相关的过程.知
道最小二乘法的思想,能根据给出的回归直线方程系数公式建立回归直线方程.
1.两个变量间的相互关系
变量与变量之间的关系常见的有两类:一类是确定性的______关系,另一类是带有随机
性的______关系.
2.相关关系的分类
(1)正相关:如果一个变量的值由小变大时,另一个变量的值也____________,这种相
关称为正相关.
(2)负相关:如果一个变量的值由小变大时,另一个变量的值____________,这种相关
称为负相关.
3.散点图
在一个统计数表中,为了更清楚地看出 x 和 y 是否具有相关关系,常将 x 的取值作为_
_________,将 y 的相应取值作为________,在直角坐标中描点___,这样的图形叫散
点图.
4.回归直线方程
一般地,设 x 和 y 是具有相关关系的两个变量,且对应于 n 个观测值的 n 个点大致分布
在一条直线的附近,若所求的直线方程y
^
=a
^
+b
^
x,则
b
^
=
a
^
= .
我们将这个方程叫做 y 对 x 的________________,b
^
叫做__________,相应的直线叫做
回归直线.
5.最小二乘法
设 x、y 的一组观察值为(xi,yi),i=1,2,…,n,且回归直线方程为y
^
=a+bx,当 x 取
值 xi(i=1,2,…,n)时,Y 的观察值为 yi,差 yi-y
^
i(i=1,2,…,n)刻画了实际观察值
yi 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即 Q=
______________________作为总离差,并使之达到______.这样,回归直线就是所有直
线中 Q 取__________的那一条,由于平方又叫二乘方,所以这种使“________________”
的方法,叫最小二乘法.
一、选择题
1.下列两个变量之间的关系,哪个不是函数关系?( )
A.匀速行驶车辆的行驶距离与时间
B.圆半径与圆的面积
C.正 n 边形的边数与内角度数之和
D.人的年龄与身高
2.下列有关线性回归的说法,不正确的是( )
A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关
系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的
图形叫做散点图
C.回归直线方程最能代表观测值 x、y 之间的关系
D.任何一组观测值都能得到具有代表意义的回归直线方程
3.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为y
^
=60+90x,下列判断
正确的是( )
A.劳动生产率为 1 千元时,工资为 50 元
B.劳动生产率提高 1 千元时,工资提高 150 元
C.劳动生产率提高 1 千元时,工资约提高 90 元
D.劳动生产率为 1 千元时,工资 90 元
4.某商品销售量 y(件)与销售价格 x(元/件)负相关,则其回归直线方程可能是( )
A.y
^
=-10x+200 B.y
^
=10x+200
C.y
^
=-10x-200 D.y
^
=10x-200
5.给出两组数据 x、y 的对应值如下表,若已知 x、y 是线性相关的,且回归直线方程:
y
^
=a
^
+b
^
x,经计算知:b
^
=-1.4,则a
^
为( )
x 4 5 6 7 8
y 12 10 9 8 6
A. 17.4 B.-1.74
C.0.6 D.-0.6
6.回归直线方程表示的直线y
^
=a
^
+b
^
x 必经过点( )
A.(0,0) B.( x ,0)
C.( x , y ) D.(0, y )
题 号 1 2 3 4 5 6
答 案
二、填空题
7.若对某个地区人均工资 x 与该地区人均消费 y 进行调查统计得 y 与 x 具有相关关系,
且回归直线方程y
^
=0.7x+2.1(单位:千元),若该地区人均消费水平为 10.5,则估计该
地区人均消费额占人均工资收入的百分比约为________.
8.设有一个回归直线方程y
^
=3-2.5x,当变量 x 增加一个单位时,变量 y________个
单位.
9.期中考试后,某校高三(9)班对全班 65 名学生的成绩进行分析,得到数学成绩 y 对
总成绩 x 的回归直线方程为y
^
=6+0.4x.由此可以估计:若两个同学的总成绩相差 50
分,则他们的数学成绩大约相差________分.
三、解答题
10.下表是某旅游区游客数量与平均气温的对比表:
平均气温(℃) -1 4 10 13 18 26
数量(百个) 20 24 34 38 50 64
若已知游客数量与平均气温是线性相关的,求回归直线方程.
11.5 个学生的数学和物理成绩(单位:分)如下表:
学生
学科 A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
画出散点图,判断它们是否具有相关关系,若相关,求出回归直线方程.
能力提升
12.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如
下:
温度 x(℃) 0 10 20 50 70
溶解度 y 66.7 76.0 85.0 112.3 128.0
则由此得到回归直线的斜率约为________.
13.20 世纪初的一项关于 16 艘轮船的研究显示,轮船的吨位从 192~3246 吨,船员的
数目从 5~32 人,对船员人数关于轮船的吨位数的回归分析得:船员人数=9.5+0.006
2×轮船吨位.(不足 1 人的舍去)
(1)假设两轮船吨位相差 1 000 吨,船员人数平均相差多少?
(2)对于最小的轮船估计的船员人数是多少?对于最大的轮船估计的船员人数是多少?
1. 由最小二乘法得
b
^
=
∑n
i=1 xi- x yi- y
∑n
i=1 xi- x 2
=
∑n
i=1xiyi-n x y
∑n
i=1x2i -n x 2
a
^
= y -b
^ x
其中:b
^
是回归直线方程的斜率,a
^
是截距.
2. 回归直线方程的求解过程
计算 x , y ,∑n
i=1x2i ,∑n
i=1xiyi
计算b
^
=
∑n
i=1xiyi-n x y
∑n
i=1x2i -n x 2
,a
^
= y -b
^ x
y
^
=b
^
x+a
^
3.在回归直线方程y
^
=b
^
x+a
^
中,当回归系数b
^
>0 时,说明两个变量呈正相关关系,
它的意义是:当 x 每增加一个单位时 y 就增加b
^
个单位;当b
^
<0 时,说明两个变量呈负
相关关系,它的意义是:当 x 每增加一个单位时,y 就减少|b
^
|个单位.
§2.3 变量的相关性
知识梳理
1.函数 相关 2.(1)由小变大 (2)由大变小
3.横坐标 纵坐标 (xi,yi)(i=1,2,…,n)
4.
∑n
i=1xiyi-n x y
∑n
i=1x2i -n x 2
y -b
^ x 回归直线方程 回归系数
5.∑n
i=1 (yi-a-bxi)2 最小 最小值 离差平方和为最小
作业设计
1.D [人的年龄与身高具有相关关系.]
2.D [只有所有的数据点都分布在一条直线附近时,才能得到具有代表意义的回归直
线.]
3.C [因工人月工资与劳动生产率变化的回归直线方程为y
^
=60+90x,当 x 由 a 提高
到 a+1 时,y
^
2-y
^
1=60+90(a+1)-60-90a=90.]
4.A [∵y 与 x 负相关,∴排除 B、D,又∵C 项中 x>0 时y
^
<0 不合题意,∴C 错.]
5.A [ x =1
5(4+5+6+7+8)=6,
y =1
5(12+10+9+8+6)=9.
a
^
= y -b
^ x =9+1.4×6=9+8.4=17.4.]
6.C [由a
^
= y -b
^ x 得 y =b
^ x +a
^
,即点( x , y )适合方程y
^
=b
^
x+a
^
.]
7.87.5%
解析 设该地区人均工资收入为 y ,则 y =0.7 x +2.1,
当 y =10.5 时, x =10.5-2.1
0.7
=12. 10.5
12
×100%=87.5%.
8.减少 2.5
解析 y
^
′=3-2.5(x+1)=3-2.5x-2.5=y
^
-2.5,
因此,y 的值平均减少 2.5 个单位.
9.20
解析 令两人的总成绩分别为 x1,x2. 则对应的数学成绩估计为
y
^
=6+0.4x1,y
^
2=6+0.4x2,
所以|y
^
1-y
^
2|=|0.4(x1-x2)|=0.4×50=20.
10.解 x =70
6
=35
3
, y =230
6
=115
3
,∑6
i=1x2i =1+16+100+169+324+676=1 286,
∑6
i=1xiyi=-20+96+340+13×38+18×50+26×64=3 474.
b
^
=
∑6
i=1xiyi-6 x y
∑6
i=1x2i -6 x 2
=
3 474-6×35
3
×115
3
1 286-6×35
3
2
≈1.68,
a
^
= y -b
^ x ≈18.73,
即所求的回归直线方程为y
^
=1.68x+18.73.
11.解 以 x 轴表示数学成绩,y 轴表示物理成绩,可得到相应的散点图如图所示:
由散点图可知,两者之间具有相关关系,且为线性相关.
列表,计算
i 1 2 3 4 5
xi 80 75 70 65 60
yi 70 66 68 64 62
xiyi 5 600 4 950 4 760 4 160 3 720
x2i 6 400 5 625 4 900 4 225 3 600
x =70, y =66,∑5
i=1x2i =24 750,∑5
i=1xiyi=23 190
设所求回归直线方程为y
^
=b
^
x+a
^
,则由上表可得
b
^
=
∑5
i=1xiyi-5 x y
∑5
i=1x2i -5 x 2
= 90
250
=0.36,
a
^
= y -b
^ x =40.8.
∴所求回归直线方程为y
^
=0.36x+40.8.
12.解析 x =30, y =93.6,∑5
i=1x2i =7 900,
∑5
i=1xiyi=17 035,
所以回归直线的斜率
b
^
=
∑5
i=1xiyi-5 x y
∑5
i=1x2i -5 x 2
=17 035-5×30×93.6
7 900-4 500
≈0.880 9.
13.解 (1)由y
^
=9.5+0.006 2x 可知,当 x1 与 x2 相差 1 000 吨时,船员平均人数相差y
^
1-y
^
2=(9.5+0.006 2x1)-(9.5+0.006 2x2)=0.006 2×1000≈6(人).
(2)当取最小吨位 192 时,预计船员人数为y
^
=9.5+0.006 2×192≈10(人).
当取最大吨位 3 246 时,预计船员人数为y
^
=9.5+0.006 2×3 246≈29(人).