- 1.39 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
温馨提示:
此套题为 Word 版,请按住 Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。
关闭 Word 文档返回原板块。
课时提升作业 一
回归分析的基本思想及其初步应用
一、选择题(每小题 5 分,共 25 分)
1.下列四个命题中正确的是( )
①在线性回归模型中,e 是 b x+a 预报真实值 y 的随机误差,它是一个观测的量;②残差平
方和越小的模型,拟合的效果越好;③用 R2 来刻画回归方程,R2 越小,拟合的效果越好;④
在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区
域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.
A.①③ B.②④ C.①④ D.②③
【解析】选 B.e 是预报变量 y 的随机误差,故①不正确;R2 越接近 1,拟合的效果越好,故
③不正确.
2.甲、乙、丙、丁 4 位同学各自对 A,B 两个变量进行回归分析,分别得到散点图与残差平
方和 (yi- iy )2 如表:
甲 乙 丙 丁
散点图
残差
平方和
115 106 124 103
哪位同学的试验结果体现拟合 A,B 两变量关系的模型拟合精度高?( )
A.甲 B.乙 C.丙 D.丁
【解析】选 D.根据线性相关的知识,散点图中各样本点带状分布越均匀,同时保持残差平
方和越小,回归分析建立的线性回归模型的拟合效果越好.由试验结果知,丁拟合效果较好
些.
3.关于残差的叙述正确的是( )
A.残差就是随机误差
B.残差就是方差
C.残差都是正数
D.残差可以用来判断模型拟合的效果
【解析】选 D.根据残差的意义及作用知,D 正确.
4.(2016·大连高二检测)在一次试验中,测得(x,y)的 4 组值分别为 A(1,2),B(2,3),
C(3,4),D(4,5),则 y 与 x 之间的回归直线方程为( )
A. y =x+1 B. y =x+2
C. y =2x+1 D. y =x-1
【解析】选 A.由已知条件可知 = , = ,而回归直线必经过样本点的中心 ,故选
项 A 符合题意.
5.(2016·济南高二检测)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相
关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为
y =0.85x-85.71,则下列结论中不正确的是( )
A.y 与 x 具有正的线性相关关系
B.回归直线过样本点的中心( , )
C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg
D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg
【解题指南】根据线性相关、回归直线、样本点的中心等相关概念判断.
【解析】选 D.
选项 具体分析 结论
A x 的系数大于零,正相关 正确
B 由回归直线方程的计算公式 a = - b 可知直线 l 必过点( , ) 正确
C
由一次函数的单调性知,x 每增加 1cm,体重平均增加 0.85kg,是估
计变量
正确
D 体重应约为 58.79kg,估计变量 不正确
二、填空题(每小题 5 分,共 15 分)
6.对于回归方程 y =257+4.75x,当 x=28 时,y 的估计值是________.
【解析】当 x=28 时, y =257+4.75×28=390,
所以 y 的估计值为 390.
答案:390
7.若对于变量 y 与 x 的 10 组数据的回归模型中,R2=0.95,又知残差平方和为 120.53.那么
(yi- )2=________.
【解析】由公式 R2=1-
得 0.95=1- 得 (yi- )2=2410.6.
答案:2410.6
8.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某
白酒酿造企业市场部对该企业 9 月份的产品销量 x(单位:千箱)与单位成本 y(单位:元)的
资料进行线性回归分析,结果如下:
= , =71, =79, xiyi=1481.
则销量每增加 1000 箱,单位成本下降________元.
【解析】由题意知 b = ≈-1.8182,
a =71-(-1.8182)× ≈77.36, y =-1.8182x+77.36,销量每增加 1 千箱,则单位成本下降
1.8182 元.
答案:1.8182
三、解答题(每小题 10 分,共 20 分)
9.(2016·武汉高二检测)某公司有 6 名推销员,其工作年限与年推销金额数据如下:
推销员编号 1 2 3 4 5
工作年限 x(年) 3 5 6 7 9
年推销金额 y(万元) 2 3 3 4 5
(1)求年推销金额 y 关于工作年限 x 的线性回归方程.
(2)若第 6 名推销员工作年限为 11 年,试估计他的年推销金额.
【解析】(1)设所求的回归方程为 y = b x+ a ,
则 b = = =0.5,
a = - b =0.4.
所以年推销金额 y 关于工作年限 x 的线性回归方程为 y =0.5x+0.4.
(2)当 x=11 时, y =0.5×11+0.4=5.9(万元),
所以可以估计第 6 名推销员的年推销金额为 5.9 万元.
10.已知某校在一次考试中,5 名学生的数学和地理成绩如表:
学生的编号 i 1 2 3 4 5
数学成绩 x 80 75 70 65 60
地理成绩 y 70 66 68 64 62
(1)根据上表,利用最小二乘法,求出 y 关于 x 的线性回归方程 y = b x+ a (其中 b =0.36).
(2)利用(1)中的线性回归方程,试估计数学 90 分的同学的地理成绩(四舍五入到整数).
(3)若从 5 人中选 2 人参加数学竞赛,其中 1、2 号不同时参加的概率是多少?
【解析】(1) = (80+75+70+65+60)=70,
= (70+66+68+64+62)=66,
b =0.36,所以 a = - b =40.8,
所以 y 关于 x 的线性回归方程为 y =0.36x+40.8.
(2)若 x=90,则 y=0.36×90+40.8≈73,
即数学 90 分的同学的地理成绩估计为 73 分.
(3)五人中选两人的不同选法有(1,2),(1,3),(1,4), (1,5),(2,3),(2,4),(2,
5),(3,4),(3,5),(4,5)共 10 种不同选法.其中 1,2 号不同时参加的有 9 种,
所以 1,2 号不同时参加的概率 P= .
一、选择题(每小题 5 分,共 10 分)
1.(2016·石家庄高二检测)为了研究两个变量 x 和 y 之间的线性相关关系,甲、乙两位同学
分别独立做了 100 次和 150 次试验,并且利用最小二乘法求得回归直线分别为 l1,l2.已知
两人在试验中发现变量 x 的观察数据的平均值都是 s,变量 y 的观察数据的平均值都是 t.
下列说法中正确的是( )
A. l1 和 l2 有交点(s,t)
B. l1 与 l2 相交,但交点不一定是(s,t)
C. l1 与 l2 必平行
D. l1 与 l2 必重合
【解析】选 A.由题意知,(s,t)是甲、乙两位同学所做试验的样本点的中心,而回归直线
恒过样本点的中心,故 A 正确.
2.在某种新型材料的研制中,试验人员获得了下列一组试验数据,现准备用下列四个函数中
的一个近似地表示这些数据的规律,其中最接近的一个是( )
x 1.95 3.00 3.94 5.10 6.12
y 0.97 1.59 1.98 2.35 2.61
A.y=2x B.y=log2x
C.y= (x2-1) D.y=2.61cosx
【解析】选 B.作散点图,从图中观察可知,应为对数函数模型.
二、填空题(每小题 5 分,共 10 分)
3.(2016·福州高二检测)某人收集统计近几年来春节期间的平均气温 x 与某取暖商品销售额
y 的有关数据(如表):
平均气温(℃) -2 -3 -5 -6
销售额(万元) 20 23 27 30
根据上述数据,用线性回归的方法,求得销售额 y 与平均气温 x 之间的线性回归方程为
y = x+ 中系数 =-2.4,预测平均气温为-8℃时,该商品的销售额大约为________万元.
【解析】 =-4, =25,即这组数据的样本点的中心为(-4,25),将 =-2.4 代入回归直线方
程且回归直线过样本点中心得 =15.4.故回归直线方程为 y =-2.4x+15.4.当 x=-8 时,
y =-2.4×(-8)+15.4=34.6.
答案:34.6
4.对具有线性相关关系的变量 x 和 y,由测得的一组数据已求得回归直线的斜率为 6.5,且
恒过(2,3)点,则这条回归直线的方程为________.
【解析】由题意知 =2, =3, a =6.5,所以 a = - b =3-6.5×2=-10,即回归直线的方程
为 y =-10+2x.
答案: y =-10+2x
三、解答题
5.(10 分)(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传
费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响,对近 8 年的年宣
传费 xi 和年销售量 yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量
的值.
(xi-
)2
(wi-
)2
(xi-
)(yi- )
(wi-
)(yi- )
46.6 563 6.8 289.8 1.6 1 469 108.8
表中 wi= , = wi.
(1)根据散点图判断,y=a+bx 与 y=c+d 哪一个适宜作为年销售量 y 关于年宣传费 x 的回
归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程.
(3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费 x=49 时,年销售量及年利润的预报值是多少?
②年宣传费 x 为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线 v=α+βu 的斜率和截距的
最小二乘估计分别为: = , = - .
【解析】(1)由散点图的变化趋势可以判断,y=c+d 适宜作为年销售量 y 关于年宣传费 x
的回归方程类型.
(2)令 w= ,先建立 y 关于 w 的线性回归方程.
由于 = = =68,
= - =563-68×6.8=100.6,
所以 y 关于 w 的线性回归方程为 y =100.6+68w,因此 y 关于 x 的回归方程为 y =100.6+68 .
(3)①由(2)知,当 x=49 时,年销售量 y 的预报值 y =100.6+68 =576.6,
年利润 z 的预报值 =576.6×0.2-49=66.32.
②根据(2)的结果知,年利润 z 的预报值
=0.2(100.6+68 )-x=-x+13.6 +20.12.
所以当 = =6.8,即 x=46.24 时, 取得最大值.
故年宣传费为 46.24 千元时,年利润的预报值最大.
【补偿训练】(2016·济宁高二检测)假定小麦基本苗数 x 与成熟期有效穗 y 之间存在相关关
系,现测得 5 组数据如下:
x 15.0 25.8 30.0 36.6 44.4
y 39.4 42.9 42.9 43.1 49.2
(1)以 x 为解释变量,y 为预报变量作出散点图.
(2)求 y 与 x 之间的回归方程,对基本苗数 56.7 预报有效穗.
(3)计算各组残差,并计算残差平方和.
(4)求 R2,说明回归模型的拟合效果.
【解析】(1)散点图如图所示:
(2)由(1)中的图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此
可以用线性回归方程刻画它们之间的关系.
设回归方程为 y = x+ , =30.36, =43.5,
=5101.56,
=1320.66, 2=921.7296,
xiyi=6746.76.
由 = ≈0.29, = - ≈34.70,
故所求的回归直线方程为 y =34.70+0.29x.
当 x=56.7 时, y =34.70+0.29×56.7=51.143.
估计成熟期有效穗为 51.143.
(3)由于 iy = xi+ ,可以算得 ie =yi- iy ,分别为 1e =0.35, 2e =0.718, 3e =-0.5,
4e =-2.214, 5e =1.624,
残差平方和: ≈8.43.
(4) (yi- )2=50.18,
故 R2=1- ≈0.832.
故回归模型拟合效果较好.
关闭 Word 文档返回原板块
相关文档
- 高中数学第三章3-1数系的扩充和复2021-06-163页
- 人教A版高中数学选修4-5全册试卷课2021-06-166页
- 人教版高中数学必修二检测:第一章空2021-06-167页
- 高中数学人教a版必修4课时达标检测2021-06-163页
- 高中数学第2章点、直线、平面之间2021-06-165页
- 人教A版高中数学2-2-1对数与对数运2021-06-163页
- 人教A版高中数学选修4-5全册试卷课2021-06-167页
- 高中数学人教版选修1-2课时提升作2021-06-167页
- 人教A版高中数学必修二3《点到直线2021-06-1617页
- 2020年高中数学新教材同步必修第二2021-06-165页