- 678.50 KB
- 2021-06-24 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
3.1
回归分析的基本思想及初步应用
(2)
y=bx+a
+
e其中a和b为模型的
未知参数
,
e
是
y
与 之间的误差
,
通常
e称为
随机误差
。
y=bx+a
+
e
所求直线方程 叫做
回归直线方程
;其中
线性回归模型
预报精度
1.
相关指数
R
2
2.
残差
e
在含有一个解释
变量的线性 模型
中
R
2
=r
2
(
相关关系
)
判断
x
i
确定差异百分数
随机误差
,
它的估计值为
.
对于样本点 它们随机误
差的估计值 称相应残差
.
方差
1)
衡量预报精度
2)
确定样本的异常点
.
1)
确定解释变量和预报变量
;
2)
画出散点图
;
3)
确定回归方程类型
;
4)
求出回归方程
;
5)
利用相关指数或残差进行分析
.
建立回归模型的基本步骤
问题:
一只红铃虫的产卵数
y
与温度
x
有关
,
现收集了
7
组观测数据
,
试建立
y
与
x
之间的回归方程
解
:1)
作散点图
;
从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似。这些散点更像是集中在一条指数曲线或二次曲线的附近。
解
:
令
则
z=bx+a,(a=lnc
1
,b=c
2
),
列出变换后数据表并画 出
x
与
z
的散点图
x
和
z
之间的关系可以用线性回归模型来拟合
x
21
23
25
27
29
32
35
z
1.946
2.398
3.045
3.178
4.19
4.745
5.784
2)
用
y=c
3
x
2
+c
4
模型
,
令
,
则
y=c
3
t+c
4
,
列出变换后数据表并画出
t
与
y
的散点图
散点并不集中在一条直线的附近,因此用线性回归模型拟合他们的效果不是最好的。
t
441
529
625
729
841
1024
1225
y
7
11
21
24
66
115
325
残
差
表
编号
1
2
3
4
5
6
7
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
e(1)
0.52
-0.167
1.76
-9.149
8.889
-14.153
32.928
e(2)
47.7
19.397
-5.835
-41.003
-40.107
-58.268
77.965
非线性回归方程
二次回归方程
残差公式
在此处可以引导学生体会应用统计方法解决实际问题需要注意的问题:
对于同样的数据,有不同的统计方法进行分析,我们要用最有效的方法分析数据。
现在有三个不同的回归模型可供选择来拟合红铃虫的产卵数与温度数据,他们分别是:
可以利用直观(散点图和残差图)、相关指数来确定哪一个模型的拟合效果更好。
小 结
实际问题
样本分析
回归模型
抽样
回归分析
预报精度
预报
作业
:P
104
习题
3.1 3