- 920.17 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
知
识
梳
理
1.
变量间的相关关系
(1)
常见的两变量之间的关系有两类:一类是函数关系,另一类是
___________
;与函数关系不同,
___________
是一种非确定性关系
.
(2)
从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为
______
,点散布在左上角到右下角的区域内,两个变量的相关关系为
______
.
相关关系
相关关系
正相关
负相关
2.
回归分析
对具有
__________
的两个变量进行统计分析的方法叫回归分析
.
其基本步骤是:
(
ⅰ
)
画散点图;
(
ⅱ
)
求
_____________
;
(
ⅲ
)
用回归直线方程作预报
.
(1)
回归直线:如果散点图中点的分布从整体上看大致在
_________
附近,就称这两个变量之间具有线性相关关系,这条直线叫作回归直线
.
相关关系
回归直线方程
一条直线
中心
(3)
相关系数
当
r
>
0
时,表明两个变量
;
当
r
<
0
时,表明两个变量
.
r
的绝对值越接近于
1
,表明两个变量的线性相关性
.
r
的绝对值越接近于
0
,表明两个变量之间几乎不存在线性相关关系.通常
|
r
|
大于
0.75
时,认为两个变量有很强的线性相关性.
正相关
负相关
越强
B
A
B
1
B
2
总计
A
1
a
b
a
+
b
A
2
c
d
c
+
d
总计
a
+
c
b
+
d
a
+
b
+
c
+
d
a
+
b
+
c
+
d
有关联
[
微点提醒
]
基
础
自
测
1.
判断下列结论正误
(
在括号内打
“√”
或
“×”
)
(1)
“
名师出高徒
”
可以解释为教师的教学水平与学生的水平成正相关关系
.(
)
(3)
因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验
.(
)
(4)
事件
X
,
Y
关系越密切,则由观测数据计算得到的
χ
2
值越大
.(
)
答案
(1)
√
(2)
√
(3)
×
(4)
√
2.
(
选修
1
-
2P21
问题提出
改编
)
为调查中学生近视情况,测得某校男生
150
名中有
80
名近视,在
140
名女生中有
70
名近视
.
在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力
(
)
A.
回归分析
B.
均值与方差
C.
独立性检验
D.
概率
解析
“
近视
”
与
“
性别
”
是两类变量,其是否有关,应用独立性检验判断
.
答案
C
3.
(
选修
1
-
2P7
讲解改编
)
两个变量
y
与
x
的回归模型中,分别选择了
4
个不同模型,它们的相关
系
数
r
如下,其中拟合效果最好的模型是
(
)
A.
模型
1
的相关
系
数
r
为
0.98
B.
模型
2
的相关
系
数
r
为
0.80
C.
模型
3
的相关
系
数
r
为
0.50
D.
模型
4
的相关
系
数
r
为
0.25
解析
在两个变量
y
与
x
的回归模型中,它们的相关
系
数
r
越近于
1
,模拟效果越好,在四个选项中
A
的相关
系
数最大,所以拟合效果最好的是模型
1.
答案
A
4.
(2019·
焦作模拟
)
已知变量
x
和
y
的统计数据如下表:
x
3
4
5
6
7
y
2.5
3
4
4.5
6
答案
C
5.
(2015·
全国
Ⅱ
卷
)
根据下面给出的
2004
年至
2013
年我国二氧化硫年排放量
(
单位:万吨
)
柱形图,以下结论不正确的是
(
)
A.
逐年比较,
2008
年减少二氧化硫排放量的效果最显著
B.2007
年我国治理二氧化硫排放显现成效
C.2006
年以来我国二氧化硫年排放量呈减少趋势
D.2006
年以来我国二氧化硫年排放量与年份正相关
解析
对于
A
选项,由图知从
2007
年到
2008
年二氧化硫排放量下降得最多,故
A
正确
.
对于
B
选项,由图知,由
2006
年到
2007
年矩形高度明显下降,因此
B
正确
.
对于
C
选项,由图知从
2006
年以后除
2011
年稍有上升外,其余年份都是逐年下降的,所以
C
正确
.
由图知
2006
年以来我国二氧化硫年排放量与年份负相关,
D
不正确
.
答案
D
6.
(2019·
丹东教学质量监测
)
某校为了研究学生的性别和对待某一活动的态度
(
支持与不支持
)
的关系,运用
2
×
2
列联表进行独立性检验,经计算
χ
2
=
6.705
,则所得到的统计学结论是:有
________
的把握认为
“
学生性别与支持该活动有关系
”
(
)
A.99% B.95% C.1% D.5%
解析
因为
6.705>6.635
,因此有
99%
的把握认为
“
学生性别与支持该活动有关系
”
,故选
A.
答案
A
考点一 相关关系的判断
【例
1
】
(1)
观察下列各图形,
其中两个变量
x
,
y
具有相关关系的图是
(
)
A.
①②
B.
①④
C.
③④
D.
②③
(2)
甲、乙、丙、丁四位同学各自对
A
,
B
两变量的线性相关性做试验,并用回归分析方法分别求得相关系数
r
与残差平方和
m
如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则哪位同学的试验结果体现
A
,
B
两变量有更强的线性相关性
(
)
A.
甲
B.
乙
C.
丙
D.
丁
解析
(1)
由散点图知
③
中的点都分布在一条直线附近
.
④
中的点都分布在一条曲线附近,所以
③④
中的两个变量具有相关关系
.
(2)
在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于
1
,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了
A
,
B
两变量有更强的线性相关性
.
答案
(1)C
(2)D
【训练
1
】
(1)
已知变量
x
和
y
满足关系
y
=-
0.1
x
+
1
,变量
y
与
z
正相关
.
下列结论中正确的是
(
)
A.
x
与
y
正相关,
x
与
z
负相关
B.
x
与
y
正相关,
x
与
z
正相关
C.
x
与
y
负相关,
x
与
z
负相关
D.
x
与
y
负相关,
x
与
z
正相关
(2)
x
和
y
的散点图如图所示,则下列说法中所有正确命题的序号为
________.
解析
(1)
由
y
=-
0.1
x
+
1
,知
x
与
y
负相关,即
y
随
x
的增大而减小,又
y
与
z
正相关,所以
z
随
y
的增大而增大,减小而减小,所以
z
随
x
的增大而减小,
x
与
z
负相关
.
答案
(1)C
(2)
①②
考点二 线性回归方程及应用
【例
2
】
(2018·
西安
调研
)
某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款
(
年底余额
)
,如下表
1
:
年份
x
2013
2014
2015
2016
2017
储蓄存款
y
(
千亿元
)
5
6
7
8
10
表
1
为了研究计算的方便,工作人员将上表的数据进行了处理,
t
=
x
-
2 012
,
z
=
y
-
5
得到下表
2
:
时间代号
t
1
2
3
4
5
z
0
1
2
3
5
表
2
(1)
求
z
关于
t
的线性回归方程;
(2)
通过
(1)
中的方程,求出
y
关于
x
的回归方程;
(3)
用所求回归方程预测到
2022
年年底,该地储蓄存款额可达多少?
所以预测到
2022
年年底,该地储蓄存款额可达
15.6
千亿元
.
【训练
2
】
(2018·
全国
Ⅱ
卷
)
如图是某地区
2000
年至
2016
年环境基础设施投资额
y
(
单位:亿元
)
的折线图
.
(2)
利用模型
②
得到的预测值更可靠
.
理由如下:
(
ⅰ
)
从折线图可以看出,
2000
年至
2016
年的数据对应的点没有随机散布在直线
y
=-
30.4
+
13.5
t
上下,这说明利用
2000
年至
2016
年的数据建立的线性模型
①
不能很好地描述环境基础设施投资额的趋势
.2010
年相对
2009
年的环境基础设施投资额有明显增加,
2010
年至
2016
年的数据对应的点位于一条直线的附近,这说明从
2010
年开始环境基础设施投资额的变化规律呈线性增长趋势,
(
ⅱ
)
从计算结果看,相对于
2016
年的环境基础设施投资额
220
亿元,由模型
①
得到的预测值
226.1
亿元的增幅明显偏低,而利用模型
②
得到的预测值的增幅比较合理,说明利用模型
②
得到的预测值更可靠
.
以上给出了
2
种理由,考生答出其中任意一种或其他合理理由均可得分
.
考点三 独立性检验
【例
3
】
(2019·
湖南长沙雅礼中学、河南省实验中学联考
)
环境问题是当今世界共同关注的问题,我国环保总局根据空气污染指数
PM2.5
浓度,制定了空气质量标准:
空气污染指数
(0
,
50]
(50
,
100]
(100
,
150]
(150
,
200]
(200
,
300]
(300
,+
∞
)
空气质量等级
优
良
轻度污染
中度污染
重度污染
严重污染
某市政府为了打造美丽城市,节能减排,从
2010
年开始考察了连续六年
11
月份的空气污染指数,绘制了频率分布直方图,经过分析研究,决定从
2016
年
11
月
1
日起在空气质量重度污染和严重污染的日子对机动车辆限号出行,即车牌尾号为单号的车辆单号出行,车牌尾号为双号的车辆双号出行
(
尾号是字母的,前
13
个视为单号,后
13
个视为双号
).
王先生有一辆车,若
11
月份被限行的概率为
0.05.
(1)
求频率分布直方图中
m
的值;
(2)
若按分层抽样的方法,从空气质量良好与中度污染的天气中抽取
6
天,再从这
6
天中随机抽取
2
天,求至少有一天空气质量是中度污染的概率;
(3)
该市环保局为了调查汽车尾气排放对空气质量的影响,对限行两年来的
11
月份共
60
天的空气质量进行统计,其结果如下表:
空气质量
优
良
轻度污染
中度污染
重度污染
严重污染
天数
11
27
11
7
3
1
根据限行前
6
年
180
天与限行后
60
天的数据,计算并填写
2
×
2
列联表,并回答是否有
90%
的把握认为空气质量的优良与汽车尾气的排放有关
.
空气质量优、良
空气质量污染
总计
限行前
限行后
总计
解
(1)
因为限行分单双号,王先生的车被限行的概率为
0.05
,
所以空气重度污染和严重污染的概率应为
0.05
×
2
=
0.1
,
由频率分布直方图可知
(0.004
+
0.006
+
0.005
+
m
)
×
50
+
0.1
=
1
,解得
m
=
0.003.
(2)
因为空气质量良好与中度污染的天气的概率之比为
0.3
∶
0.15
=
2
∶
1
,
按分层抽样的方法从中抽取
6
天,则空气质量良好的天气被抽取的有
4
天,记作
A
1
,
A
2
,
A
3
,
A
4
,空气中度污染的天气被抽取的有
2
天,记作
B
1
,
B
2
,
记事件
A
为
“
至少有一天空气质量是中度污染
”
,则事件
A
所包含的事件有
(
A
1
,
B
1
)
,
(
A
1
,
B
2
)
,
(
A
2
,
B
1
)
,
(
A
2
,
B
2
)
,
(
A
3
,
B
1
)
,
(
A
3
,
B
2
)
,
(
A
4
,
B
1
)
,
(
A
4
,
B
2
)
,
(
B
1
,
B
2
)
,共
9
个,
从这
6
天中随机抽取
2
天,所包含的基本事件有
(
A
1
,
A
2
)
,
(
A
1
,
A
3
)
,
(
A
1
,
A
4
)
,
(
A
1
,
B
1
)
,
(
A
1
,
B
2
)
,
(
A
2
,
A
3
)
,
(
A
2
,
A
4
)
,
(
A
2
,
B
1
)
,
(
A
2
,
B
2
)
,
(
A
3
,
A
4
)
,
(
A
3
,
B
1
)
,
(
A
3
,
B
2
)
,
(
A
4
,
B
1
)
,
(
A
4
,
B
2
)
,
(
B
1
,
B
2
)
,共
15
个,
(3)2
×
2
列联表如下:
空气质量优、良
空气质量污染
总计
限行前
90
90
180
限行后
38
22
60
总计
128
112
240
所以有
90%
的把握认为空气质量的优良与汽车尾气的排放有关
.
【训练
3
】
为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取
50
名学生,得到如下
2
×
2
列联表:
理科
文科
男
13
10
女
7
20
解析
χ
2
≈
4.844>3.841
,
则有
95%
的把握认为
是否选修文科与性别之间有关系
.
答案
9
5%