- 1.85 MB
- 2021-06-11 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第三节
变量的相关性与统计案例
内容索引
必备知识
·
自主学习
核心考点
·
精准研析
核心素养
·
微专题
核心素养测评
【教材
·
知识梳理】
1.
变量间的相关关系
(1)
常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;
与函数关系不同,相关关系是一种
_____________
关系
.
(2)
从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相
关关系称为
___________
,点散布在从左上角到右下角的区域内,两个变量的相
关关系为
___________.
非确定性
正相关
负相关
2.
两个变量的线性相关
(1)
从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的
_____________
附近,称两个变量之间具有
_________________
,这条直线叫做
回归直线
.
(2)
回归方程为
=bx+a
,其中
(3)
通过求
Q=
的最小值而得到回归直线的方法,即使得样本数
据的点到回归直线的距离的离差平方和最小,这一方法叫做最小二乘法
.
一条直线
线性相关关系
(4)
相关系数:
当
r>0
时,表明两个变量
___________
;当
r<0
时,表明两个变量
___________.
r
的绝对值越接近于
1
,表明两个变量的线性相关性
_________
;
r
的绝对值越接
近于
0
,表明两个变量之间
___________________________.
3.
独立性检验
(1)2×2
列联表:假设有两个分类变量
X
和
Y
,它们的值域分别为
{x
1
,
x
2
}
和
{y
1
,
y
2
}
,其样本频数列联表
(
称
2×2
列联表
)
为:
正相关
负相关
越强
几乎不存在线性相关关系
y
1
y
2
合计
x
1
n
11
n
12
n
1+
x
2
n
21
n
22
n
2+
合计
n
+1
n
+2
n
(2)χ
2
统计量
χ
2
= (
其中
n=n
11
+n
12
+n
21
+n
22
为样本容量
).
【常用结论】
1.
函数关系与相关关系的区别与联系
(1)
区别:
①
函数关系是一种确定性关系,相关关系是一种非确定性关系
.
②
函数关系是一种因果关系,相关关系不一定是一种因果关系,也可能是伴随关系
.
(2)
联系:对于线性相关关系,求出线性回归方程后,可以通过确定的函数关系进行两个变量取值的预测
.
2.
回归直线及其方程的性质
(1)
回归直线不一定过样本点,但是一定过样本中心点
( ).
(2)
在回归直线方程
=bx+a
中,
>0
时,两个变量呈正相关关系;
<0
时,两个变量呈负相关关系
.
【知识点辨析】
(
正确的打“
√”,
错误的打“
×”)
(1)“
名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系
.
(
)
(2)
散点图是判断两个变量是否相关的一种重要方法和手段
. (
)
(3)
通过回归直线方程 可以估计预报变量的取值和变化趋势
.(
)
(4)
回归直线方程 至少经过点
(x
1
,y
1
),(x
2
,y
2
),
…
,(x
n
,y
n
)
中的一个点
.
(
)
(5)
因为由任何一组观测值都可以求得一个线性回归方程
,
所以没有必要进行相关性检验
. (
)
(6)
事件
X
,
Y
关系越密切,则由数据计算得到的
χ
2
的值越大
. (
)
提示
:
(1)√.
名师出高徒显示的是正相关关系
.
(2)√.
散点图可以直观反映是否相关
.
(3)√.
由回归直线方程的意义可知其正确
.
(4)×.
回归直线可能不经过任意一个数据点
.
(5)×.
由任何一组观测值都可以求得一个线性回归方程
,
但可能没有任何意义
.
(6)√.
χ
2
的值越大,有关的可能性越大
.
【易错点索引】
序号
易错警示
典题索引
1
相关系数
r
与相关性强弱的关系
考点一、
T2
,
3
2
χ
2
的值越大,相关的可能性越大
.
考点二、典例
3
先由散点图、相关系数确定相关性,再计算回归方程,预测才有意义
考点三、角度
2
【教材
·
基础自测】
1.
(
必修
3P74
例
1
改编
)
某研究机构对高三学生的记忆力
x
和判断力
y
进行统计分析
,
所得数据如表
:
x
6
8
10
12
y
2
3
5
6
则
y
对
x
的线性回归直线方程为
(
)
A. =2.3x-0.7 B. =2.3x+0.7
C. =0.7x-2.3 D. =0.7x+2.3
【解析】
选
C.
易求
=9, =4,
样本点的中心
(9,4)
代入验证
,
满足
=0.7x-2.3.
2.(
选修
2-3P86
例
2
改编
)
两个变量
y
与
x
的回归模型中,分别选择了
4
个不同模型,
它们的相关系数
r
如下,其中拟合效果最好的模型是
(
)
A.
模型
1
的相关系数
r
为
0.98
B.
模型
2
的相关系数
r
为
0.80
C.
模型
3
的相关系数
r
为
0.50
D.
模型
4
的相关系数
r
为
0.25
【解析】
选
A.
在两个变量
y
与
x
的回归模型中,它们的相关系数
r
越接近于
1
,
拟合效果越好,在四个选项中
A
的相关系数最大,所以拟合效果最好的是模型
1.
3.(
必修
3P76
例
2
改编
)
设某大学的女生体重
y(
单位
:kg)
与身高
x(
单位
:cm)
具有
线性相关关系
,
根据一组样本数据
(x
i
,y
i
)(i=1,2,
…
,n),
用最小二乘法建立的回
归方程为
=0.85x-85.71,
则下列结论中不正确的是
(
)
A.y
与
x
具有正的线性相关关系
B.
回归直线过样本点的中心
( , )
C.
若该大学某女生身高增加
1 cm,
则其体重约增加
0.85 kg
D.
若该大学某女生身高为
170 cm,
则可断定其体重必为
58.79 kg
【解析】
选
D.
由于线性回归方程中
x
的系数为
0.85,
因此
y
与
x
具有正的线性相关
关系
,
故
A
正确
;
又线性回归方程必过样本点的中心
( , ),
故
B
正确
;
由线性回
归方程中系数的意义知
,x
每增加
1 cm,
其体重约增加
0.85 kg,
故
C
正确
;
当某女生
的身高为
170 cm
时
,
其体重估计值是
58.79 kg,
而不是具体值
,
故
D
不正确
.
4.(
选修
2-3P81
习题
3-1AT1
改编
)
为了判断高中三年级学生是否选修文科与性别的关系
,
现随机抽取
50
名学生
,
得到如下
2×2
列联表
:
理科
文科
男
13
10
女
7
20
已知
P(χ
2
≥3.841)≈0.05.
根据表中数据,得到
χ
2
= ≈4.844.
则认为选修文科与性别有关系出错的可能性为
_________.
【解析】
χ
2
≈4.844
,这表明小概率事件发生
.
根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为
5%.
答案:
5%
核心素养 数据分析
——
线性回归方程应用中的数据分析能力
【素养诠释】
在现实生活中有许多问题应当先做调查研究
,
收集数据
,
通过分析作出判断
,
体会数据中蕴涵的信息
;
对于同样的数据可以有多种分析的方法
,
需要根据问题的背景选择合适的方法
;
通过数据分析体验随机性
,
一方面
,
对于同样的事情每次收集到的数据可能不同
;
另一方面
,
只要有足够的数据就可能从中发现规律
.
数据分析是统计的核心
.
【典例】
某电视厂家准备在五一举行促销活动
,
现在根据近七年的广告费与销售量的数据确定此次广告费支出
.
广告费支出
x(
万元
)
和销售量
y(
万台
)
的数据如下
:
年份
2012
2013
2014
2015
2016
2017
2018
广告
费支
出
x
1
2
4
6
11
13
19
销售
量
y
1.9
3.2
4.0
4.4
5.2
5.3
5.4
(1)
若用线性回归模型拟合
y
与
x
的关系
,
求出
y
关于
x
的线性回归方程
(
其中
x
i
y
i
=279.4; )
(2)
若用模型
y=c+d
拟合
y
与
x
的关系
,
可得回归方程
=1.63+0.99 ,
经计算线性回归模型和该模型的相关系数
r
分别约为
0.75
和
0.88
,请用
r
说
明选择哪个回归模型更好
.
(3)
已知利润
z
与
x,y
的关系为
z=200y-x.
根据
(2)
的结果回答
:
当广告费
x=20
时
,
销售量及利润的预测值是多少
?(
精确到
0.01)
参考数据
: ≈2.236.
【素养立意】
将数据代入相关公式计算,运用获得的结果结合相关系数的意义进行解释,通过回归方程进行预测
.
【解析】
(1)
由题意有
=8, =4.2, x
i
y
i
=279.4, =708,
所以
=0.17,
所以
y
关于
x
的线性回归方程为
=0.17x+2.84;
(2)
r
越接近于
1,
模型的拟合效果越好
,
故选用
=1.63+0.99
更好
;
(3)
广告费
x=20
时
,
销售量预测值为
=1.63+0.99 ≈6.057≈6.06(
万台
),
故利润的预测值为
相关文档
- 2021高考数学一轮复习第九章统计与2021-06-1145页
- 2019届二轮复习解题技巧 统计与统2021-06-1119页
- 专题10-2 统计与统计案例(讲)-2018年2021-06-1117页
- 2021高考数学一轮复习第10章算法初2021-06-1012页
- 2017届高考文科数学(全国通用)二轮适2021-06-1010页
- 2018届二轮复习统计与统计案例学案2021-06-1018页
- 【数学】2019届一轮复习北师大版统2021-06-1012页
- 【数学】2019届一轮复习人教A版统2021-06-109页
- 2020高考数学二轮复习练习:第二部分2021-06-1031页
- 2018届二轮复习专题7第1讲统计与统2021-06-1084页