- 997.38 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
文数
课标版
第五节 变量的相关关系
1.两个变量的线性相关
(1)正相关
在散点图中,点散布在从①
左下角
到②
右上角
的区域,对于两
个变量的这种相关关系,我们将它称为正相关.
(2)负相关
教材研读
在散点图中,点散布在从③
左上角
到④
右下角
的区域,对于两
个变量的这种相关关系,我们将它称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在⑤
一条直线附近
,就称这
两个变量之间具有线性相关关系,这条直线叫做回归直线.
(4)最小二乘法
求回归直线,使得样本数据的点到它的⑥
距离的平方和最小
的方法
叫做最小二乘法.
(5)回归方程
方程
=
x
+
是两个具有线性相关关系的变量的一组数据(
x
1
,
y
1
),(
x
2
,
y
2
),
…
,(
x
n
,
y
n
)的回归方程,其中
,
是待定参数.
2.回归分析
(1)回归分析是对具有⑧
相关关系
的两个变量进行统计分析的一种
常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(
x
1
,
y
1
),(
x
2
,
y
2
),
…
,(
x
n
,
y
n
),我们知道
=
⑨
(
,
)
称为样本点的中心.
(3)相关系数:
.
当
r
>0时,表明两个变量⑩
正相关
;
当
r
<0时,表明两个变量
负相关
.
r
的绝对值越接近于1,表明两个变量的线性相关性
越强
.
r
的绝对
值越接近于0,表明两个变量之间
几乎不存在线性相关关系
.通
|
r
|大于或等于
0.75
时,认为两个变量有很强的线性相关性.
3.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的
不同类别
,像这
类变量称为分类变量.
(2)列联表:列出两个分类变量的
频数表
,称为列联表.假设有两个
分类变量
X
和
Y
,它们的可能取值分别为{
x
1
,
x
2
}和{
y
1
,
y
2
},其样本频数列联
表(称为2
×
2列联表)为
y
1
y
2
总计
x
1
a
b
a
+
b
x
2
c
d
c
+
d
总计
a
+
c
b
+
d
a
+
b
+
c
+
d
则可构造一个随机变量
K
2
=
,其中
n
=
a
+
b
+
c
+
d
为样本容量.
(3)独立性检验
利用独立性假设、随机变量
K
2
来确定是否有一定把握认为“两
个分类变量
有关系
”的方法称为两个分类变量的独立性检验.
1.观察下列各图:
其中两个变量
x
,
y
具有线性相关关系的图是
( )
A.①② B.①④ C.③④ D.②③
答案
C 由散点图知③④中
x
,
y
具有线性相关关系.
2.(2015湖北,4,5分)已知变量
x
和
y
满足关系
y
=-0.1
x
+1,变量
y
与
z
正相关.下
列结论中正确的是
( )
A.
x
与
y
正相关,
x
与
z
负相关
B.
x
与
y
正相关,
x
与
z
正相关
C.
x
与
y
负相关,
x
与
z
负相关
D.
x
与
y
负相关,
x
与
z
正相关
答案
C 由
y
=-0.1
x
+1,知
x
与
y
负相关,即
y
随
x
的增大而减小,又
y
与
z
正相
关,所以
z
随
y
的增大而增大,减小而减小,所以
z
随
x
的增大而减小,
x
与
z
负
相关,故选C.
3.已知
x
,
y
的对应取值如下表,从散点图可以看出
y
与
x
线性相关,且回归方
程为
=0.95
x
+
,则
=
( )
A.3.25 B.2.6
C.2.2 D.0
答案
B
=2,
=4.5,因为回归直线经过点(
,
),所以
=4.5-0.95
×
2=2.6,
故选B.
x
0
1
3
4
y
2.2
4.3
4.8
6.7
考点一 相关关系的判断
典例1
(1)下列四个散点图中,变量
x
与
y
之间具有负的线性相关关系的
是
( )
(2)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,
考点突破
正确的是
( )
A.
r
2
<
r
4
<0<
r
3
<
r
1
B.
r
4
<
r
2
<0<
r
1
<
r
3
C.
r
4
<
r
2
<0<
r
3
<
r
1
D.
r
2
<
r
4
<0<
r
1
<
r
3
解析
(1)观察散点图可知,只有D选项的散点图表示的是变量
x
与
y
之间
具有负的线性相关关系.
(2)由相关系数的意义,结合散点图可知
r
2
<
r
4
<0<
r
3
<
r
1
,故选A.
答案
(1)D (2)A
方法技巧
对两个变量的相关关系的判断有两种方法:一是根据散点图,若具有很
强的直观性,则可直接得出两个变量是正相关或负相关;二是计算相关
系数,这种方法能比较准确地反映其相关程度,相关系数的绝对值越接
近于1,相关性就越强,相关系数就是描述相关性强弱的.
1-1
为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某
班学生的两科成绩得到如图所示的散点图(
x
轴、
y
轴的单位长度相同),
用回归直线方程
=
bx
+
a
近似地刻画其相关关系,根据图形,以下结论最
有可能成立的是
( )
A.线性相关关系较强,
b
的值为1.25
B.线性相关关系较强,
b
的值为0.83
C.线性相关关系较强,
b
的值为-0.87
D.线性相关关系较弱,无研究价值
答案
B 由散点图可以看出两个变量所构成的点在一条直线附近,所
以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正
数,且从散点图观察,回归直线的斜率应该比直线
y
=
x
的斜率要小一些,综
上可知应选B.
考点二 回归方程的求法及回归分析
典例2
(2016课标全国Ⅲ,18,12分)下图是我国2008年至2014年生活垃
圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合
y
与
t
的关系,请用相关系数加
以说明;
(2)建立
y
关于
t
的回归方程(系数精确到0.01),预测2016年我国生活垃圾
无害化处理量.
附注:
参考数据:
y
i
=9.32,
t
i
y
i
=40.17,
=0.55,
≈
2.646.
参考公式:相关系数
r
=
,
回归方程
=
+
t
中斜率和截距最小二乘估计公式分别为:
=
,
=
-
.
解析
(1)由折线图中数据和附注中参考数据得
=4,
(
t
i
-
)
2
=28,
=0.55,
(
t
i
-
)(
y
i
-
)=
t
i
y
i
-
y
i
=40.17-4
×
9.32=2.89,
r
≈
≈
0.99.
因为
y
与
t
的相关系数近似为0.99,说明
y
与
t
的线性相关程度相当高,从而
可以用线性回归模型拟合
y
与
t
的关系.
(2)由
=
≈
1.331及(1)得
=
=
≈
0.10,
=
-
=1.331-0.10
×
4
≈
0.93.
所以
y
关于
t
的回归方程为
=0.93+0.10
t
.
将2016年对应的
t
=9代入回归方程得:
=0.93+0.10
×
9=1.83.
所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.
方法技巧
(1)回归直线
=
x
+
必过样本点的中心(
,
).
(2)正确运用计算
,
的公式进行准确的计算是求线性回归方程的关键.
(3)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,
则可通过线性回归方程预测变量的值.
2-1
从某居民区随机抽取10个家庭,获得第
i
个家庭的月收入
x
i
(单位:千
元)与月储蓄
y
i
(单位:千元)的数据资料,算得
x
i
=80,
y
i
=20,
x
i
y
i
=184,
=720.
(1)求家庭的月储蓄
y
对月收入
x
的线性回归方程
y
=
bx
+
a
;
(2)判断变量
x
与
y
之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程
y
=
bx
+
a
中,
其中
,
为样本平均
值.线性回归方程也可写为
=
x
+
.
解析
(1)由题意知
n
=10,
=
x
i
=
=8,
=
y
i
=
=2,
又
-
n
=720-10
×
8
2
=80,
x
i
y
i
-
n
=184-10
×
8
×
2=24,
由此得
b
=
=0.3,
a
=
-
b
=2-0.3
×
8=-0.4,
故所求回归方程为
y
=0.3
x
-0.4.
(2)由于变量
y
的值随
x
值的增加而增加(
b
=0.3>0),故
x
与
y
之间是正相关.
(3)将
x
=7代入回归方程可以预测该家庭的月储蓄为
y
=0.3
×
7-0.4=1.7(千元).
考点三 独立性检验
典例3
(2016辽宁沈阳模拟)为考察某种疫苗预防疾病的效果,进行动
物试验,得到统计数据如下:
未发病
发病
合计
未注射疫苗
20
x
A
注射疫苗
30
y
B
合计
50
50
100
现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为
.
(1)求
x
,
y
,
A
,
B
的值;
(2)绘制发病率的条形统计图;
(3)能够有多大把握认为疫苗有效?
附:
χ
2
=
,
n
=
a
+
b
+
c
+
d
P
(
χ
2
≥
k
0
)
0.05
0.01
0.005
0.001
k
0
3.841
6.635
7.879
10.828
解析
(1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物”
为事件
A
,
由已知得
P
(
A
)=
=
,所以
y
=10,则
B
=40,
x
=40,
A
=60.
(2)未注射疫苗的发病率为
=
,注射疫苗的发病率为
=
.
发病率的条形统计图如图所示.
(3)
χ
2
=
=
=
≈
16.67>10.828,
所以至少有99.9%的把握认为疫苗有效.
规律总结
(1)独立性检验的关键是正确列出2
×
2列联表,并计算出
K
2
的值.(2)应弄
清判定两变量有关的把握性与犯错误概率的关系,根据题目要求作出正
确的回答.
3-1
通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还
是愿意走人行天桥进行抽样调查,得到如下所示的2
×
2列联表:
由
K
2
=
,
算得
K
2
=
≈
7.8.
附表:
男
女
合计
走人行天桥
40
20
60
走斑马线
20
30
50
合计
60
50
110
P
(
K
2
≥
k
0
)
0.050
0.010
0.001
k
0
3.841
6.635
10.828
参照附表,得到的正确结论是
( )
A.有99%以上的把握认为“选择过马路的方式与性别有关”
B.有99%以上的把握认为“选择过马路的方式与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性
别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与
性别无关”
答案
A ∵
K
2
≈
7.8>6.635,∴有99%以上的把握认为“选择过马路的
方式与性别有关”.
则可构造一个随机变量
K
2
=
,其中
n
=
a
+
b
+
c
+
d
为样本容量.
(3)独立性检验
利用独立性假设、随机变量
K
2
来确定是否有一定把握认为“两
个分类变量
有关系
”的方法称为两个分类变量的独立性检验.
判断下列结论的正误(正确的打“√”,错误的打“
×
”)
(1)相关关系与函数关系都是一种确定性的关系.
(
×
)
(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性
关系去表示.
(√)
(3)事件
X
,
Y
关系越密切,则由观测数据计算得到的
K
2
的观测值越小.
(
×
)
1.观察下列各图:
其中两个变量
x
,
y
具有线性相关关系的图是
( )
A.①② B.①④ C.③④ D.②③
答案
C 由散点图知③④中
x
,
y
具有线性相关关系.
2.(2015湖北,4,5分)已知变量
x
和
y
满足关系
y
=-0.1
x
+1,变量
y
与
z
正相关.下
列结论中正确的是
( )
A.
x
与
y
正相关,
x
与
z
负相关
B.
x
与
y
正相关,
x
与
z
正相关
C.
x
与
y
负相关,
x
与
z
负相关
D.
x
与
y
负相关,
x
与
z
正相关
答案
C 由
y
=-0.1
x
+1,知
x
与
y
负相关,即
y
随
x
的增大而减小,又
y
与
z
正相
关,所以
z
随
y
的增大而增大,减小而减小,所以
z
随
x
的增大而减小,
x
与
z
负
相关,故选C.
3.已知
x
,
y
的对应取值如下表,从散点图可以看出
y
与
x
线性相关,且回归方
程为
=0.95
x
+
,则
=
( )
A.3.25 B.2.6
C.2.2 D.0
答案
B
=2,
=4.5,因为回归直线经过点(
,
),所以
=4.5-0.95
×
2=2.6,
故选B.
x
0
1
3
4
y
2.2
4.3
4.8
6.7
考点一 相关关系的判断
典例1
(1)下列四个散点图中,变量
x
与
y
之间具有负的线性相关关系的
是
( )
(2)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,
考点突破
正确的是
( )
A.
r
2
<
r
4
<0<
r
3
<
r
1
B.
r
4
<
r
2
<0<
r
1
<
r
3
C.
r
4
<
r
2
<0<
r
3
<
r
1
D.
r
2
<
r
4
<0<
r
1
<
r
3
解析
(1)观察散点图可知,只有D选项的散点图表示的是变量
x
与
y
之间
具有负的线性相关关系.
(2)由相关系数的意义,结合散点图可知
r
2
<
r
4
<0<
r
3
<
r
1
,故选A.
答案
(1)D (2)A
方法技巧
对两个变量的相关关系的判断有两种方法:一是根据散点图,若具有很
强的直观性,则可直接得出两个变量是正相关或负相关;二是计算相关
系数,这种方法能比较准确地反映其相关程度,相关系数的绝对值越接
近于1,相关性就越强,相关系数就是描述相关性强弱的.
1-1
为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某
班学生的两科成绩得到如图所示的散点图(
x
轴、
y
轴的单位长度相同),
用回归直线方程
=
bx
+
a
近似地刻画其相关关系,根据图形,以下结论最
有可能成立的是
( )
A.线性相关关系较强,
b
的值为1.25
B.线性相关关系较强,
b
的值为0.83
C.线性相关关系较强,
b
的值为-0.87
D.线性相关关系较弱,无研究价值
答案
B 由散点图可以看出两个变量所构成的点在一条直线附近,所
以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正
数,且从散点图观察,回归直线的斜率应该比直线
y
=
x
的斜率要小一些,综
上可知应选B.
1-2
四名同学根据各自的样本数据研究变量
x
,
y
之间的相关关系,并求
得回归直线方程,分别得到以下四个结论:
①
y
与
x
负相关且
=2.347
x
-6.423;
②
y
与
x
负相关且
=-3.476
x
+5.648;
③
y
与
x
正相关且
=5.437
x
+8.493;
④
y
与
x
正相关且
=-4.326
x
-4.578.
其中一定
的结论的序号是
( )
A.①② B.②③ C.③④ D.①④
答案
D 由回归直线方程
=
x
+
,知当
>0时,
y
与
x
正相关;当
<0时,
y
与
x
负相关.∴①④一定不正确.故选D.
考点二 回归方程的求法及回归分析
典例2
(2016课标全国Ⅲ,18,12分)下图是我国2008年至2014年生活垃
圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合
y
与
t
的关系,请用相关系数加
以说明;
(2)建立
y
关于
t
的回归方程(系数精确到0.01),预测2016年我国生活垃圾
无害化处理量.
附注:
参考数据:
y
i
=9.32,
t
i
y
i
=40.17,
=0.55,
≈
2.646.
参考公式:相关系数
r
=
,
回归方程
=
+
t
中斜率和截距最小二乘估计公式分别为:
=
,
=
-
.
解析
(1)由折线图中数据和附注中参考数据得
=4,
(
t
i
-
)
2
=28,
=0.55,
(
t
i
-
)(
y
i
-
)=
t
i
y
i
-
y
i
=40.17-4
×
9.32=2.89,
r
≈
≈
0.99.
因为
y
与
t
的相关系数近似为0.99,说明
y
与
t
的线性相关程度相当高,从而
可以用线性回归模型拟合
y
与
t
的关系.
(2)由
=
≈
1.331及(1)得
=
=
≈
0.10,
=
-
=1.331-0.10
×
4
≈
0.93.
所以
y
关于
t
的回归方程为
=0.93+0.10
t
.
将2016年对应的
t
=9代入回归方程得:
=0.93+0.10
×
9=1.83.
所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.
方法技巧
(1)回归直线
=
x
+
必过样本点的中心(
,
).
(2)正确运用计算
,
的公式进行准确的计算是求线性回归方程的关键.
(3)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,
则可通过线性回归方程预测变量的值.
2-1
从某居民区随机抽取10个家庭,获得第
i
个家庭的月收入
x
i
(单位:千
元)与月储蓄
y
i
(单位:千元)的数据资料,算得
x
i
=80,
y
i
=20,
x
i
y
i
=184,
=720.
(1)求家庭的月储蓄
y
对月收入
x
的线性回归方程
y
=
bx
+
a
;
(2)判断变量
x
与
y
之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程
y
=
bx
+
a
中,
其中
,
为样本平均
值.线性回归方程也可写为
=
x
+
.
解析
(1)由题意知
n
=10,
=
x
i
=
=8,
=
y
i
=
=2,
又
-
n
=720-10
×
8
2
=80,
x
i
y
i
-
n
=184-10
×
8
×
2=24,
由此得
b
=
=0.3,
a
=
-
b
=2-0.3
×
8=-0.4,
故所求回归方程为
y
=0.3
x
-0.4.
(2)由于变量
y
的值随
x
值的增加而增加(
b
=0.3>0),故
x
与
y
之间是正相关.
(3)将
x
=7代入回归方程可以预测该家庭的月储蓄为
y
=0.3
×
7-0.4=1.7(千元).
考点三 独立性检验
典例3
(2016辽宁沈阳模拟)为考察某种疫苗预防疾病的效果,进行动
物试验,得到统计数据如下:
未发病
发病
合计
未注射疫苗
20
x
A
注射疫苗
30
y
B
合计
50
50
100
现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为
.
(1)求
x
,
y
,
A
,
B
的值;
(2)绘制发病率的条形统计图;
(3)能够有多大把握认为疫苗有效?
附:
χ
2
=
,
n
=
a
+
b
+
c
+
d
P
(
χ
2
≥
k
0
)
0.05
0.01
0.005
0.001
k
0
3.841
6.635
7.879
10.828
解析
(1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物”
为事件
A
,
由已知得
P
(
A
)=
=
,所以
y
=10,则
B
=40,
x
=40,
A
=60.
(2)未注射疫苗的发病率为
=
,注射疫苗的发病率为
=
.
发病率的条形统计图如图所示.
(3)
χ
2
=
=
=
≈
16.67>10.828,
所以至少有99.9%的把握认为疫苗有效.
规律总结
(1)独立性检验的关键是正确列出2
×
2列联表,并计算出
K
2
的值.(2)应弄
清判定两变量有关的把握性与犯错误概率的关系,根据题目要求作出正
确的回答.
3-1
通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还
是愿意走人行天桥进行抽样调查,得到如下所示的2
×
2列联表:
由
K
2
=
,
算得
K
2
=
≈
7.8.
附表:
男
女
合计
走人行天桥
40
20
60
走斑马线
20
30
50
合计
60
50
110
P
(
K
2
≥
k
0
)
0.050
0.010
0.001
k
0
3.841
6.635
10.828
参照附表,得到的正确结论是
( )
A.有99%以上的把握认为“选择过马路的方式与性别有关”
B.有99%以上的把握认为“选择过马路的方式与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性
别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与
性别无关”
答案
A ∵
K
2
≈
7.8>6.635,∴有99%以上的把握认为“选择过马路的
方式与性别有关”.
相关文档
- 高考文科数学复习备课课件:第八节 2021-06-1626页
- 高考文科数学复习备课课件:第九节 2021-06-1625页
- 高考文科数学复习备课课件:第三节 2021-06-1526页
- 高考文科数学复习备课课件:第一节 2021-06-1524页
- 高考文科数学复习备课课件:第三节 2021-06-1527页
- 高考文科数学复习备课课件:第四节 2021-06-1226页
- 高考文科数学复习备课课件:第三节 2021-06-1224页
- 高考文科数学复习备课课件:第六节 2021-06-1127页
- 高考文科数学复习备课课件:第一节 2021-06-1123页
- 高考文科数学复习备课课件:第六节 2021-06-1123页