- 1.11 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
温馨提示:
此套题为 Word 版,请按住 Ctrl,滑动鼠标滚轴,调节合
适的观看比例,答案解析附后。关闭 Word 文档返回原板块。
课时提升作业(一)
回归分析的基本思想及其初步应用
(25 分钟 60 分)
一、选择题(每小题 5分,共 25 分)
1.下列三个说法:
(1)残差平方和越小的模型,拟合的效果越好;
(2)用 R
2
来刻画回归的效果时,R
2
的值越小,说明模型拟合的效果越
好;
(3) 直 线 y = b x+ a 和 各 点 (x1,y1),(x2,y2), … ,(xn,yn) 的 偏 差
[yi-( b xi+ a )]2
是该坐标平面上所有直线中与这些点的偏差最小的
直线.
其中正确的个数为 ( )
A.1 个 B.2 个 C.3 个 D.4 个
【解析】选 B.由 R
2
的定义可知:R
2
越接近于 1,表明两个随机变量线性
相关性越强,所以(2)不正确,其余说法正确.
2.某单位为了了解用电量 y(度)与气温 x(℃)之间的关系,随机统计
了某 4 天的用电量与当天气温,并制作了对照表:
气温 x(℃) 18 13 10 -1
用电量 y(度) 24 34 38 64
由表中数据得回归直线方程 y= b x+a中 b≈-2,预测当气温为-4℃时,
用电量的度数约为 ( )
A.68℃ B.67℃ C.66℃ D.65℃
【解析】选 A.由表格得( , )为(10,40),
又( , )在回归方程 y= b x+a上且 b≈-2,
所以 40=10×(-2)+ a ,解得: a =60,所以 y=-2x+60.
当 x=-4 时, y=-2×(-4)+60=68.
3.(2014·重庆高考)已知变量 x与 y 正相关,且由观测数据算得样本
平均数 =3, =3.5,则由该观测数据测算的线性回归方程可能是
( )
A. y=0.4x+2.3 B. y=2x-2.4
C. y=-2x+9.5 D. y=-0.3x+4.4
【解题指南】根据正相关可知斜率为正,再根据线性回归方程经过点
( , )可求出结果.
【解析】选 A.由正相关可知斜率为正,故可排除 C,D 两项,又因为
y=0.4x+2.3 经过点(3,3.5),故 A项正确.
【补偿训练】(2015·临沂高二检测)某饮料店的日销售收入 y(单位:
百元)与当天平均气温 x(单位:度)之间有下列数据关系:
x -2 -1 0 1 2
y 5 4 2 2 1
甲、乙、丙三位同学对上述数据进行了研究,分别得到了 x 与 y 之间
的三个线性回归方程:①y=-x+2.8,②y=-x+3,③y=-1.2x+2.6;其中正
确的是 ( )
A.① B.② C.③ D.①③
【解析】选 A.回归方程 y = b x+ a表示的直线必过点( , ),即必过点
(0,2.8),而给出的三个线性回归方程中,只有①表示的直线过点
(0,2.8),故正确的是①.
4.(2015·泰安高二检测)在回归分析中,R
2
的值越大,说明残差平方和
( )
A.越大 B.越小
C.可能大也可能小 D.以上均错
【解析】选 B.因为 R
2
=
n
2
i i
i 1
n
2
i
i 1
(y y )
1
(y y)
,
所以当 R
2
越大时, (yi- iy )
2
越小,即残差平方和越小.
5.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,
随机调查了该社区 5 户家庭,得到如下统计数据表:
收入 x(万元) 8.2 8.6 10.0 11.3 11.9
支出 y(万元) 6.2 7.5 8.0 8.5 9.8
根据上表可得回归直线方程 y = b x+ a ,其中 b =0.76, a = - b .据此估
计,该社区一户年收入为 15万元家庭的年支出为 ( )
A.11.4 万元 B.11.8 万元
C.12.0 万元 D.12.2 万元
【解题指南】样本中心点( , )一定在回归直线上.
【解析】选 B.由题意得
= =10,
= =8,
所以a =8-0.76×10=0.4,
所以 y=0.76x+0.4,把 x=15 代入得到 y=11.8.
二、填空题(每小题 5分,共 15 分)
6.在研究身高和体重的关系时,求得相关指数 R
2
≈ ,可以叙
述为“身高解释了 64%的体重变化,而随机误差贡献了剩余的 36%”,
所以身高对体重的效应比随机误差的效应大得多.
【解析】结合 R
2
的计算公式 R
2
=
n
2
i i
i 1
n
2
i
i 1
(y y )
1
(y y)
可知,当 R
2
=0.64 时,身高
解释了 64%的体重变化.
答案:0.64
7.若根据10名儿童的年龄x(岁)和体重y(kg)数据用最小二乘法得到
用年龄预报体重的回归方程是 y=2x+7,已知这 10 名儿童的年龄分别
是 2,3,3,5,2,6,7,3,4,5,则这 10 名儿童的平均体重是 .
【解析】由题意可得 =2 +7,又 =4,所以 =15.
答案:15kg
8.(2015·扬州高二检测)某校高二(8)班学生每周用于数学学习的时
间 x(单位:小时)与数学成绩 y(单位:分)构成如下数据
(15,79),(23,97),(16,64),
(24,92),(12,58),求得的回归直线方程为 y=2.5x+a ,则某同学每周
学习 20小时,估计数学成绩约为 分.
【解析】 = ×(15+23+16+24+12)=18,
= ×(79+97+64+92+58)=78,
把( , )代入 y=2.5x+a ,可求得 a =33,
把 x=20 代入 y=2.5x+33 得 y=2.5×20+33=83.
答案:83
三、解答题(每小题 10 分,共 20 分)
9.关于 x 与 y 有如下数据关系:
x 2 4 5 6 8
y 30 40 60 50 70
为了对 x,y 两个变量进行统计分析,现有以下两种线性模型:甲模型
y=6.5x+17.5,乙模型 y=7x+17,试比较哪一个模型拟合的效果更好.
【解析】 =
5
2
i i
i 1
5
2
i
i 1
(y y )
1
(y y)
=1- =0.845,
=
5
2
i i
i 1
5
2
i
i 1
(y y )
1
(y y)
=1- =0.82,
84.5%>82%,所以甲模型拟合效果更好.
【拓展延伸】R
2
=1-
n
2
i
i 1
n
2
i
i 1
(y y)
1
(y y)
的意义
R
2
越大,残差平方和越小,从而回归模型的拟合效果越好.在线性回归
模型中,R
2
表示解释变量对于预报变量变化的贡献率,R
2
越接近 1,表
示回归的效果越好(因为R
2
越接近1,表示解释变量和预报变量的线性
相关性越强).
10.(2015·深圳高二检测)PM2.5 是指大气中直径小于或等于 2.5 微
米的颗粒物(也称可入肺颗粒物).为了探究车流量与 PM2.5 的浓度是
否相关,现采集到某城市周一至周五某一时间段车流量与 PM2.5 的数
据如表:
时间 周一 周二 周三 周四 周五
车流量 x(万辆) 50 51 54 57 58
PM2.5 的浓度 y(微克/立方米) 69 70 74 78 79
(1)根据上表数据,请在下列坐标系中画出散点图.
(2)根据上表数据,用最小二乘法求出 y 关于 x 的线性回归方程
y= b x+a .
(3)若周六同一时间段车流量是 25 万辆,试根据(2)求出的线性回归
方程预测,此时 PM2.5 的浓度为多少(保留整数).
【解析】(1)散点图如图所示.
(2)因为 = =54,
= =74,
(xi- )(yi- )=4×5+3×4+3×4+4×5=64,
(xi- )
2
=(-4)
2
+(-3)
2
+3
2
+4
2
=50,
b =
5
i i
i 1
5
2
i
i 1
(x x) y y
(x x)
( )
= =1.28,
a = - b =74-1.28×54=4.88,
故 y关于 x的线性回归方程是 y=1.28x+4.88.
(3)当 x=25 时, y=1.28×25+4.88=36.88≈37,
所以可以预测此时 PM2.5 的浓度约为 37微克/立方米.
(20 分钟 40 分)
一、选择题(每小题 5分,共 10 分)
1.(2015·眉山高二检测)已知样本点散落在某一条曲线 y=
a bxe 附近,
作变换 z=
lny,利用线性回归模型来求其中的参数 a,b,则拟合其变换后的样本
点的直线
方程为 ( )
A.z bx a B.z bx ea C.z bx lna D.z bxln a
【解析】选 A.对方程 y=
a bxe 两边取以 e为底的对数即得.
2.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归直线方程为
y=2x+a,若样本点(r,1)与(1,s)的残差相同,则有 ( )
A. r=s B.s=2r C.s=3-2r D.s=2r+1
【解析】选 C.由残差的定义可得,
1-(2r+a)=s-(2+a),化简得 s=3-2r.
【延伸探究】若将题中的“ y=2x+a”改为“ y=bx+a”,同时将“样本
点(r,1)与(1,s)”改为“样本点(1,1)与(2,4)”,则 b= .
【解析】由残差的定义可得 1-(b+a)=4-(2b+a),
化简得 b=3.
答案:3
二、填空题(每小题 5分,共 10 分)
3. 已 知 回 归 方 程 为 y =2x+1, 而 实 验 得 到 的 一 组 数 据 为
(2,4.9),(3,7.1),(4,9.1),则残差平方和为 .
【解析】 (yi- y i)
2
=(4.9-5)
2
+(7.1-7)
2
+(9.1-9)
2
=0.03.
答案:0.03
4.(2015·石家庄高二检测)已知一组具有线性相关关系的数据
(x1,y1),(x2,y2),
…,(xn,yn),其样本点的中心为(2,3),若其回归直线的斜率估计值为
-1.2,则该回归直线方程为 .
【解析】由题意可设回归直线为 y=-1.2x+a ,由于回归直线过样本点
的中心(2,3),故有 3=-1.2×2+a ,解得 a =5.4,故回归直线方程为
y=-1.2x+5.4.
答案: y=-1.2x+5.4
【补偿训练】(2014·渭南高二检测)已知 x与 y 之间的几组数据如下
表:
x 0 1 3 4
y 1 4 6 9
则 y与 x 的线性回归方程 y= b x+a过点 ( )
A.(0,1) B.(1,4) C.(2,5) D.(5,9)
【解析】选 C.因为 = =2, = =5,所以根据线性回归方程必过
样本中心点,可得 y= b x+a必过(2,5).
三、解答题(每小题 10 分,共 20 分)
5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟
定的价格进行试销,得到如下数据:
单价 x(元) 8 8.2 8.4 8.6 8.8 9
销量 y(件) 90 84 83 80 75 68
(1)求回归直线方程 y= b x+a ,其中 b =-20, a = - b .
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产
品的成本是 4 元/件,为使工厂获得最大利润,该产品的单价应定为多
少元?(利润=销售收入-成本)
【解题指南】(1)利用线性回归系数公式求出 a , b的值,从而可确定回
归直线方程.
(2)利用二次函数求最值.
【解析】(1)由于 = ×(8+8.2+8.4+8.6+8.8+9)=8.5,
= ×(90+84+83+80+75+68)=80,
又 b =-20,所以a = - b =80+20×8.5=250,从而回归直线方程为
y=-20x+250.
(2)设工厂获得的利润为 L 元,依题意得
L=x(-20x+250)-4(-20x+250)
=-20x
2
+330x-1000
=-20(x-8.25)
2
+361.25.
当且仅当 x=8.25 时,L 取得最大值.
故当单价定为 8.25 元时,工厂可获得最大利润.
【拓展延伸】建立回归模型的基本步骤
(1)确定解释变量和预报变量.
(2)画散点图,观察是否存在线性相关关系.
(3)确定回归方程的类型,如 y= b x+a .
(4)按最小二乘法估计回归方程中的参数.
(5)得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,
或模型是否合适.
6.(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.
设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份 2010 2011 2012 2013 2014
时间代号 t 1 2 3 4 5
储蓄存款 y(千亿元) 5 6 7 8 10
(1)求 y关于 t的回归方程 = t+ .
(2)用所求回归方程预测该地区 2015 年(t=6)的人民币储蓄存款.
附:回归方程 = t+ 中,
n
i i
i 1
n 22
i
i 1
t y nty
b a y bt.
t nt ,
【解题指南】(1)直接利用回归系数公式求解即可.(2)利用回归方程
代入直接进行计算即可.
【解析】(1)列表计算如下:
i ti yi tiyi
1 1 5 1 5
2 2 6 4 12
3 3 7 9 21
4 4 8 16 32
5 5 10 25 50
∑ 15 36 55 120
n n
i i
i 1 i 1
n n22 2
tt i ty i i
i 1 i 1
ty
tt
1 15 1 36n 5, t t 3, y y 7.2.
n 5 n 5
t nt 55 5 3 10, t y nty 120 5 3 7.2 12,
12 1.2,
10
a y t 7.2 1.2 3 3.6,
这里
又
从而b
-b -
l l
l
l
故所求回归方程为 =1.2t+3.6.
(2)将 t=6 代入回归方程可预测该地区 2015 年的人民币储蓄存款为
=1.2×6+3.6=10.8(千亿元).
【补偿训练】(2015·西安高二检测)下表是某年美国旧轿车价格的调
查资料,以x(年)表示轿车的使用年数,y(美元)表示相应的年均价格,
求 y关于 x的非线性回归方程.
使用年数 x 1 2 3 4 5 6 7 8 9 10
平均价格 y 2 651 1 943 1 494 1 087 765 538 484 290 226 204
【解题指南】画出散点图或进行相关性检验,确定两变量 x,y是否线
性相关.由散点图得 x,y 之间的回归模型.然后转化为线性回归模型
进行拟合,预报回归模型,求回归方程.
【解析】画散点图如图 1所示,
看出 y 与 x呈指数关系,于是令 z=lny.变换后得数据:
x 1 2 3 4 5 6 7 8 9 10
z 7.88
3
7.57
2
7.30
9
6.99
1
6.64
0
6.28
8
6.18
2
5.67
0
5.42
1
5.31
8
画散点图如图 2 所示,由图可知各点基本处于一条直线,
由于 = =5.5,
= =6.5274,
10
i i
i 1
10 22
i
i 1
x z 10xz
b 0.298,a z bx 6.527 4 0.298 5.5 8.166,
x 10x
所以由表中数据可得线性回归方程为 z =8.166-0.298x,因此旧轿车的
平均价格对使用年数的非线性回归方程为 y=e8.166-0.298x
.
关闭 Word 文档返回原板块
相关文档
- 高中数学选修2-3教学课件:2_1_2离散2021-06-1614页
- 高中数学选修2-2课时练习第一章 2_2021-06-1611页
- 高中数学必修4教案:5_备课资料(2_3_22021-06-162页
- 北师大版高中数学选修1-1同步练习2021-06-155页
- 高中数学人教版选修1-2课时提升作2021-06-159页
- 新教材高中数学第三章指数运算与指2021-06-1522页
- 高中数学新人教版选修2-2课时作业:2021-06-1512页
- 高中数学选修2-3公开课课件2_2_2事2021-06-1521页
- 高中数学必修4教案:4_示范教案(1_2_22021-06-156页
- 高中数学必修五知识点总结【经典】2021-06-1519页