- 1.43 MB
- 2021-06-24 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第三节 变量的相关性
与统计案例
内容索引
必备知识
·
自主学习
核心考点
·
精准研析
核心素养
·
微专题
核心素养测评
【
教材
·
知识梳理
】
1.
独立性检验
一般地
,
对于两个研究对象
Ⅰ
和
Ⅱ,Ⅰ
有两类取值
,
即类
A
和类
B(
如吸烟与不吸烟
);Ⅱ
也有两类取值
,
即类
1
和类
2(
如患呼吸道疾病和未患呼吸道疾病
).
我们得到如下列联表所示的抽样数据
:
Ⅱ
类
1
类
2
合计
Ⅰ
类
A
a
b
a+b
类
B
c
d
c+d
合 计
a+c
b+d
a+b+c+d
要推断“
Ⅰ
与
Ⅱ
有关系”
,
可按下面的步骤进行
:
(1)
提出假设
H
0
;Ⅰ
与
Ⅱ
没有关系
.
(2)
根据
2×2
列联表与公式
χ
2
=
计算
χ
2
的值
.
(3)
参照表中临界值
,
作出判断
.
2.
回归分析
(1)
线性回归方程
直线 称为线性回归方程
.
(2)
样本相关系数
r.
①
计算公式
r=
②
性质
:
A.|r|≤1;B.|r|
越接近于
1,x,y
的线性相关程度越强
;C.|r|
越接近于
0,x,y
的线
性相关程度越弱
.
③
基本步骤
:
A.
提出统计假设
H
0
:
变量
x,y
不具有线性相关关系
;
B.
如果以
95%
的把握作出推断
,
那么可以根据
1-0.95=0.05
与
n-2
在附录
2
中查出一个
r
的临界值
r
0.05
(
其中
1-0.95=0.05
称为检验水平
);
C.
计算样本相关系数
r;
D.
作出统计推断
:
若
|r|>r
0.05
,
则否定
H
0
,
表明有
95%
的把握认为
x
与
y
之间具有线性相关关系
;
若
|r|≤r
0.05
,
则没有理由拒绝原来的假设
H
0
,
即就目前数据而言
,
没有充分理由认为
y
与
x
之间有线性相关关系
.
【
知识点辨析
】
(
正确的打“√”
,
错误的打“
×”)
(1)“
名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系
.
(
)
(2)
散点图是判断两个变量是否相关的一种重要方法和手段
. (
)
(3)
通过回归直线方程 可以估计预报变量的取值和变化趋势
.
(
)
(4)
回归直线方程 至少经过点
(x
1
,y
1
),(x
2
,y
2
),…,(x
n
,y
n
)
中的一个点
.
(
)
(5)
因为由任何一组观测值都可以求得一个线性回归方程
,
所以没有必要进行相
关性检验
. (
)
(6)
事件
X,Y
关系越密切
,
则由数据计算得到的
χ
2
的值越大
. (
)
提示
:
(1)√.
名师出高徒显示的是正相关关系
.
(2)√.
散点图可以直观反映是否相关
.
(3)√.
由回归直线方程的意义可知其正确
.
(4)
×
.
回归直线可能不经过任意一个数据点
.
(5)
×
.
由任何一组观测值都可以求得一个线性回归方程
,
但可能没有任何意义
.
(6)√.
χ
2
的值越大
,
相关的可能性越大
.
【
易错点索引
】
序号
易错警示
典题索引
1
相关系数
r
与相关性强弱的关系
考点一、
T2,3
2
χ
2
的值越大
,
相关的可能性越大
.
考点二、典例
3
先由散点图、相关系数确定相关性
,
再计算回归方程
,
预测才有意义
考点三、
角度
2
【
教材
·
基础自测
】
1.(
必修
3P76
例
1
改编
)
某研究机构对高三学生的记忆力
x
和判断力
y
进行统计分析
,
所得数据如表
:
x
6
8
10
12
y
2
3
5
6
则
y
对
x
的线性回归直线方程为
(
)
A. =2.3x-0.7 B. =2.3x+0.7
C. =0.7x-2.3 D. =0.7x+2.3
【
解析
】
选
C.
易求
=9, =4,
样本点的中心
(9,4)
代入验证
,
满足
=0.7x-2.3.
2.(
选修
2-3P109
练习
T1
改编
)
设某大学的女生体重
y(
单位
:kg)
与身高
x(
单位
:cm)
具有线性相关关系
,
根据一组样本数据
(x
i
,y
i
)(i=1,2,…,n),
用最小二乘法建立
的回归方程为
=0.85x-85.71,
则下列结论中不正确的是
(
)
A.y
与
x
具有正的线性相关关系
B.
回归直线过样本点的中心
(
,
)
C.
若该大学某女生身高增加
1 cm,
则其体重约增加
0.85 kg
D.
若该大学某女生身高为
170 cm,
则可断定其体重必为
58.79 kg
【
解析
】
选
D.
由于线性回归方程中
x
的系数为
0.85,
因此
y
与
x
具有正的线性相关
关系
,
故
A
正确
;
又线性回归方程必过样本点的中心
( , ),
故
B
正确
;
由线性回
归方程中系数的意义知
,x
每增加
1 cm,
其体重约增加
0.85 kg,
故
C
正确
;
当某女生
的身高为
170 cm
时
,
其体重估计值是
58.79 kg,
而不是具体值
,
故
D
不正确
.
3.(
选修
2-3P97
练习
T2
改编
)
为了判断高中三年级学生是否选修文科与性别的关系
,
现随机抽取
50
名学生
,
得到如下
2×2
列联表
:
理科
文科
男
13
10
女
7
20
已知
P(χ
2
≥3.841)≈0.05,P(χ
2
≥5.024)≈0.025.
根据表中数据
,
得到
χ
2
=
≈4.844.
则有
________
的把握认为选修文科与性别有关系
.
【
解析
】
χ
2
≈4.844,
这表明小概率事件发生
.
根据假设检验的基本原理
,
应该断定有
95%
的把握认为选修文科与性别之间有关系
.
答案
:
95%
核心素养 数据分析
——
线性回归方程应用中的数据分析能力
【
素养诠释
】
在现实生活中有许多问题应当先做调查研究
,
收集数据
,
通过分析作出判断
,
体会数据中蕴涵的信息
;
对于同样的数据可以有多种分析的方法
,
需要根据问题的背景选择合适的方法
;
通过数据分析体验随机性
,
一方面
,
对于同样的事情每次收集到的数据可能不同
;
另一方面
,
只要有足够的数据就可以从中发现规律
.
数据分析是统计的核心
.
【
典例
】
某电视厂家准备在五一举行促销活动
,
现在根据近七年的广告费与销售量的数据确定此次广告费支出
.
广告费支出
x(
万元
)
和销售量
y(
万台
)
的数据如下
:
年份
2012
2013
2014
2015
2016
2017
2018
广告
费支
出
x
1
2
4
6
11
13
19
销售
量
y
1.9
3.2
4.0
4.4
5.2
5.3
5.4
(1)
若用线性回归模型拟合
y
与
x
的关系
,
求出
y
关于
x
的线性回归方程
(
其中
x
i
y
i
=279.4;
)
(2)
若用模型
y=c+d
拟合
y
与
x
的关系
,
可得回归方程
=1.63+0.99
,
经计算线性回归模型和该模型的
R
2
分别约为
0.75
和
0.88,
请用
R
2
说明选择哪
个回归模型更好
.
(3)
已知利润
z
与
x,y
的关系为
z=200y-x.
根据
(2)
的结果回答
:
当广告费
x=20
时
,
销售量及利润的预测值是多少
?(
精确到
0.01)
参考数据
:
≈2.236.
【
素养立意
】
将数据代入相关公式计算
,
运用获得的结果结合相关指数的意义进行解释
,
通过回归方程进行预测
.
【
解析
】
(1)
由题意有
=8, =4.2, x
i
y
i
=279.4, =708,
所以
=0.17,
所以
y
关于
x
的线性回归方程为
=0.17x+2.84;
(2)R
2
越接近于
1,
模型的拟合效果越好
,
故选用
=1.63+0.99
更好
;
(3)
广告费
x=20
时
,
销售量预测值为
=1.63+0.99 ≈6.057≈6.06(
万台
),
故利润的预测值为
相关文档
- 2021版高考数学一轮复习第十章统计2021-06-2414页
- 2019届二轮复习解题技巧 统计与统2021-06-2419页
- 2016届高考数学(理)大一轮复习达标训2021-06-249页
- 2021版高考数学一轮复习第十章统计2021-06-2420页
- 2021版高考数学一轮复习第十一章统2021-06-2415页
- 高中数学分章节训练试题:24统计与统2021-06-244页
- 高考数学一轮复习第十一章统计与统2021-06-2313页
- 高三数学(理数)总复习练习专题十八 2021-06-2344页
- 专题17+统计与统计案例(命题猜想)-202021-06-2314页
- 2020届高考数学一轮复习单元检测(理2021-06-239页