- 933.50 KB
- 2021-06-21 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
2021/2/11
1
3.1
回归分析的基本思想及其初步应用(一)
高二数学 选修
2-3
2021/2/11
2
数学3
——
统计内容
画散点图
了解最小二乘法的思想
求回归直线方程
y
=
bx
+
a
用回归直线方程解决应用问题
2021/2/11
3
问题
1
:正方形的面积
y
与正方形的边长
x
之间
的
函数关系
是
y = x
2
确定性关系
问题
2
:某水田水稻产量
y
与施肥量
x
之间是否
有一个确定性的关系?
例如:在
7
块并排、形状大小相同的试验田上
进行施肥量对水稻产量影响的试验,得
到如下所示的一组数据:
施化肥量
x
15 20 25 30 35 40 45
水稻产量
y
330 345 365 405 445 450 455
复习 变量之间的两种关系
2021/2/11
4
10 20 30 40 50
500
450
400
350
300
·
·
·
·
·
·
·
施化肥量
x
15 20 25 30 35 40 45
水稻产量
y
330 345 365 405 445 450 455
x
y
施化肥量
水稻产量
2021/2/11
5
自变量取值一定时,因变量的取值
带有一定随机性
的两个变量之间的关系叫做
相关关系
。
1
、定义
:
1
):
相关关系
是一种
不确定性
关系;
注
对具有相关关系的两个变量进行
统计分析
的方法
叫
回归分析
。
2
):
2021/2/11
6
现实生活中存在着大量的相关关系。
如:人的身高与年龄;
产品的成本与生产数量;
商品的销售额与广告费;
家庭的支出与收入。等等
探索:水稻产量
y
与施肥量
x
之间大致有何规律?
2021/2/11
7
10 20 30 40 50
500
450
400
350
300
·
·
·
·
·
·
·
发现:图中各点,
大致分布在某条直线附近。
探索
2
:在这些点附近可画直线不止一条,
哪条直线最能代表
x
与
y
之间的关系呢?
施化肥量
x
15 20 25 30 35 40 45
水稻产量
y
330 345 365 405 445 450 455
x
y
散点图
施化肥量
水稻产量
2021/2/11
8
10 20 30 40 50
500
450
400
350
300
·
·
·
·
·
·
·
x
y
施化肥量
水稻产量
2021/2/11
9
探究
对于一组具有线性相关关系的数据
我们知道其
回归方程的截距和斜率
的
最小二乘估计公式
分别为:
称为样本点的中心。
你能推导出这个公式吗?
2021/2/11
10
假设我们已经得到两个具有相关关系的变量的一组数据
且回归方程是:
y=bx+a,
^
其中,
a,b
是待定参数。
当变量
x
取 时
它与实际收集到的 之间的
偏差
是
o
x
y
2021/2/11
11
易知,截距 和斜率 分别是使
取
最小值
时 的值。由于
2021/2/11
12
这正是我们所要推导的公式。
在上式中,后两项和 无关,而前两项为非负数,因此要使
Q
取得最小值,当且仅当前两项的值均为
0
,即有
2021/2/11
13
1
、所求直线方程叫做
回归直线方程
;
相应的直线叫做
回归直线
。
2
、对两个变量进行的线性分析叫做
线性回归分析
。
1
、回归直线方程
2021/2/11
14
最小二乘法:
称为样本点的中心
。
2021/2/11
15
2
、求回归直线方程的步骤:
(
3
)代入公式
(
4
)写出直线方程为
y=bx+a,
即为所求的回归直线方程。
^
2021/2/11
16
例
1
、观察两相关量得如下数据
:
x
-1
-2
-3
-4
-5
5
3
4
2
1
y
-9
-7
-5
-3
-1
1
5
3
7
9
求两变量间的回归方程
.
解:列表:
i
1
2
3
4
5
6
7
8
9
10
x
i
-1
-2
-3
-4
-5
5
3
4
2
1
y
i
-9
-7
-5
-3
-1
1
5
3
7
9
x
i
y
i
9
14
15
12
5
5
15
12
14
9
2021/2/11
17
所求回归直线方程为
2021/2/11
18
例
2
:已知
10
只狗的血球体积及血球的测量值如下:
x
45
42
46
48
42
35
58
40
39
50
y
6.53
6.30
9.52
7.50
6.99
5.90
9.49
9.20
6.55
8.72
x(
血球体积
,mm), y(
血球数,百万
)
(
1
)画出上表的散点图;
(
2
)求出回归直线并且画出图形;
(
3
)回归直线必经过的一点是哪一点?
2021/2/11
19
3
、利用回归直线方程对总体进行线性相关性的检验
例
3
、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握
钢水含碳量和冶炼时间的关系。如果已测得炉料熔化完毕时,钢水的含碳量
x
与冶炼时间
y
(从炉料熔化完毕到出刚的时间)的一列数据,如下表所示:
(白色解读
106
页例
2
)
x
(
0.01%
)
104
180
190
177
147
134
150
191
204
121
y
(
min
)
100
200
210
185
155
135
170
205
235
125
(
1
)
y
与
x
是否具有线性相关关系;
(
2
)如果具有线性相关关系,求回归直线方程;
(
3
)预测当钢水含碳量为
160
个
0.01%
时,应冶炼多少分钟?
2021/2/11
20
(1)
列出下表
,
并计算
i
1
2
3
4
5
6
7
8
9
10
x
i
104
180
190
177
147
134
150
191
204
121
y
i
100
200
210
185
155
135
170
205
235
125
x
i
y
i
10400
36000
39900
32745
22785
18090
25500
39155
47940
15125
2021/2/11
21
所以回归直线的方程为
=1.267x-30.51
(3)
当
x=160
时
, 1.267.160-30.51=172
(2)
设所求的回归方程为
2021/2/11
22
例题
4
从某大学中随机选出
8
名女大学生,其身高和体重数据如下表
:(白色解读
109
页例
9
)
编号
1
2
3
4
5
6
7
8
身高
165
165
157
170
175
165
155
170
体重
48
57
50
54
64
61
43
59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为
172
cm的女大学生的体重。
2021/2/11
23
分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量.
2.
回归方程:
1.
散点图;
2021/2/11
24
相关系数
r>0正相关;r<0负相关.通常,
r>0.75
,认为两个变量有很强的相关性.
本例中
,
由上面公式
r=0.798>0.75
.
2021/2/11
25
探究?
身高为
172
cm
的女大学生的体重一定是
60.316kg
吗?如果不是
,
其原因是什么
?
2021/2/11
26
如何描述两个变量之间线性相关关系的强弱?
在
《
数学
3》
中,我们学习了用相关系数
r
来衡量两个变量
之间线性相关关系的方法。
相关系数
r
2021/2/11
27
相关关系的测度
(相关系数取值及其意义)
-1.0
+1.0
0
-0.5
+0.5
完全负相关
无线性相关
完全正相关
负相关程度增加
r
正相关程度增加