- 204.00 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
章末综合测评(三) 统计案例
(时间 120分钟,满分 150分)
一、选择题(本大题共 12小题,每小题 5分,共 60分.在每小题给出的四
个选项中,只有一项是符合题目要求的)
1.下列说法中错误的是( )
A.如果变量 x与 y之间存在着线性相关关系,则我们根据试验数据得到的
点(xi,yi)(i=1,2,…,n)将散布在某一条直线的附近
B.如果两个变量 x与 y之间不存在着线性关系,那么根据它们的一组数据(xi,
yi)(i=1,2,…,n)不能写出一个线性方程
C.设 x,y是具有相关关系的两个变量,且 y关于 x的线性回归方程为ŷ=b̂x
+â,b̂叫做回归系数
D.为使求出的线性回归方程有意义,可用统计检验的方法来判断变量 y与
x之间是否存在线性相关关系
【解析】 任何一组(xi,yi)(i=1,2,…,n)都能写出一个线性方程,只是有
的不存在线性关系.
【答案】 B
2.如图 1所示,有 5组数据,去掉哪组数据后(填字母代号),剩下的 4组数
据的线性相关性最大( )
图 1
A.E B.C
C.D D.A
【解析】 由题图易知 A,B,C,D四点大致在一条直线上,而 E点偏离
最远,故去掉 E点后剩下的数据的线性相关性最大.
【答案】 A
3.在一次试验中,当变量 x的取值分别为 1,1
2
,
1
3
,
1
4
时,变量 y的值分别为
2,3,4,5,则 y与1
x
的回归曲线方程为( ) 【导学号:97270064】
A.ŷ=1
x
+1 B.ŷ=2
x
+3
C.ŷ=2x+1 D.ŷ=x-1
【解析】 由数据可得,四个点都在曲线ŷ=1
x
+1上.
【答案】 A
4.有下列说法:
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型
比较合适;
②用相关指数 R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;
③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小
的模型,拟合效果越好.
其中正确命题的个数是( )
A.0 B.1
C.2 D.3
【解析】 ①选用的模型是否合适与残差点的分布有关;对于②③,R2的值
越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好.
【答案】 D
5.观察下列各图,其中两个分类变量 x,y之间关系最强的是( )
A B
C D
【解析】 在四幅图中,D图中两个深色条的高相差最明显,说明两个分类
变量之间关系最强.
【答案】 D
6.在 2×2列联表中,下列哪两个比值相差越大,两个分类变量有关系的可
能性就越大( )
A. a
a+b
与
c
c+d
B. a
c+d
与
c
a+b
C. a
a+d
与
c
b+c
D. a
b+d
与
c
a+c
【解析】 当 ad与 bc相差越大,两个分类变量有关系的可能性越大,此时
a
a+b
与
c
c+d
相差越大.
【答案】 A
7.如图 2,5个(x,y)数据,去掉 D(3,10)后,下列说法错误的是( )
图 2
A.相关系数 r变大
B.残差平方和变大
C.相关指数 R2变大
D.解释变量 x与预报变量 y的相关性变强
【解析】 由散点图知,去掉 D后,x与 y的相关性变强,且为正相关,所
以 r变大,R2变大,残差平方和变小.
【答案】 B
8.(2016·安庆一中期中)在一次对性别与是否说谎有关的调查中,得到如下
数据,根据表中数据判断如下结论中正确的是( )
说谎 不说谎 总计
男 6 7 13
女 8 9 17
总计 14 16 30
A.在此次调查中有 95%的把握认为是否说谎与性别有关
B.在此次调查中有 99%的把握认为是否说谎与性别有关
C.在此次调查中有 99.5%的把握认为是否说谎与性别有关
D.在此次调查中没有充分证据显示说谎与性别有关
【解析】 由表中数据得 k=30×6×9-8×72
14×16×13×17
≈0.002 42<3.841.
因此没有充分证据认为说谎与性别有关,故选 D.
【答案】 D
9.某地财政收入 x与支出 y满足线性回归方程ŷ=b̂x+â+e(单位:亿元),
其中b̂=0.8,â=2,|e|<0.5,如果今年该地区财政收入 10亿元,年支出预计不会
超过( )
A.10亿 B.9亿
C.10.5亿 D.9.5亿
【解析】 代入数据得 y=10+e,∵|e|<0.5,
∴|y|<10.5,故不会超过 10.5亿.
【答案】 C
10.(2016·合肥高二检测)废品率 x%和每吨生铁成本 y(元)之间的回归直线方
程为ŷ=256+3x,表明( )
A.废品率每增加 1%,生铁成本增加 259元
B.废品率每增加 1%,生铁成本增加 3元
C.废品率每增加 1%,生铁成本平均每吨增加 3元
D.废品率不变,生铁成本为 256元
【解析】 回归方程的系数b̂表示 x每增加一个单位,ŷ平均增加b̂个单位,
当 x为 1时,废品率应为 1%,故当废品率增加 1%时,生铁成本平均每吨增加 3
元.
【答案】 C
11.已知 x与 y之间的几组数据如下表:
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得线性回归直线方程为ŷ=b̂x+â,若某同学根据上表中
的前两组数据(1,0)和(2,2)求得的直线方程为 y=b′x+a′,则以下结论正确的是
( )
A.b̂>b′,â>a′ B.b̂>b′,âa′ D.b̂a′.
【答案】 C
12.两个分类变量 X和 Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别
是 a=10,b=21,c+d=35.若 X与 Y有关系的可信程度不小于 97.5%,则 c等
于( )
A.3 B.4 C.5 D.6
附:
P(K2≥k0) 0.05 0.025
k0 3.841 5.024
【解析】 2×2列联表如下:
x1 x2 总计
y1 10 21 31
y2 c d 35
总计 10+c 21+d 66
故 K2的观测值 k= 66×[1035-c-21c]2
31×35×10+c56-c
≥5.024.
把选项 A,B,C,D代入验证可知选 A.
【答案】 A
二、填空题(本大题共 4小题,每小题 5分,共 20分.将答案填在题中的横
线上)
13.已知一回归直线方程为ŷ=1.5x+45,x∈{1,5,7,13,19},则 y =________.
【导学号:97270065】
【解析】 因为 x =
1
5
(1+5+7+13+19)=9,且 y =1.5 x +45,所以 y =
1.5×9+45=58.5.
【答案】 58.5
14.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度
的关系,随机抽取了 189名员工进行调查,所得数据如下表所示:
积极支持企业改革 不赞成企业改革 总计
工作积极 54 40 94
工作一般 32 63 95
总计 86 103 189
对于人力资源部的研究项目,根据上述数据试求 K2的观测值为________.
【解析】 根据列联表中的数据,得到 k=
189×54×63-40×322
94×95×86×103
≈10.76.
【答案】 10.76
15.(2016·深圳高二检测)某车间为了规定工时定额,需要确定加工零件所花
费的时间,为此进行了 5次试验.根据收集到的数据(如下表),由最小二乘法求
得回归方程ŷ=0.67x+54.9.
零件数 x(个) 10 20 30 40 50
加工时间 Y(min) 62 75 81 89
现发现表中有一个数据模糊看不清,请你推断出该数据的值为________.
【解析】 由表知 x =30,设模糊不清的数据为 m,则 y =
1
5
(62+m+75
+81+89)=307+m
5
,因为 y =0.67 x +54.9,
即
307+m
5
=0.67×30+54.9,
解得 m=68.
【答案】 68
16.某地区恩格尔系数 Y(%)与年份 x的统计数据如下表:
年份 x 2006 2007 2008 2009
恩格尔系数 Y(%) 47 45.5 43.5 41
从散点图可以看出 Y与 x线性相关,且可得回归方程为ŷ=b̂x+4 055.25,据
此模型可预测 2017年该地区的恩格尔系数 Y(%)为________.
【解析】 由表可知 x =2 007.5, y =44.25.
因为 y =b̂ x +4 055.25,
即 44.25=2 007.5b̂+4 055.25,
所以b̂≈-2,所以回归方程为ŷ=-2x+4 055.25,令 x=2 017,得ŷ=21.25.
【答案】 21.25
三、解答题(本大题共 6小题,共 70分.解答应写出文字说明、证明过程或
演算步骤)
17.(本小题满分 10 分)以下是某地区不同身高的未成年男性的体重平均值
表.
身高/cm 60 70 80 90 100 110
体重/kg 6.13 7.9 9.99 12.15 15.02 17.5
身高/cm 120 130 140 150 160 170
体重/kg 20.92 26.86 31.11 38.85 42.25 55.05
(1)给出两个回归方程:
①y=0.429 4x-25.318,
②y=2.004e0.019 7x.
通过计算,得到它们的相关指数分别是:R21=0.9311,R22=0.998.试问哪个回
归方程拟合效果更好?
(2)若体重超过相同身高男性平均值的 1.2倍为偏胖,低于 0.8为偏瘦,那么
该地区某中学一男生身高为 175 cm,体重为 78 kg,他的体重是否正常?
【解】 (1)∵R22>R21,
∴选择第二个方程拟合效果更好.
(2)把 x=175代入 y=2.004e0.019 7x,
得 y=62.97,
由于
78
62.97
=1.24>1.2,所以这名男生偏胖.
18.(本小题满分 12分)关于 x与 y有如下数据:
x 2 4 5 6 8
y 30 40 60 50 70
为了对 x,y两个变量进行统计分析,现有以下两种线性模型:甲模型ŷ=6.5x
+17.5,乙模型ŷ=7x+17,试比较哪一个模型拟合的效果更好.
【解】 R21=1-
∑
5
i=1
yi-ŷi2
∑
5
i=1
yi- y 2
=1- 155
1 000
=0.845,
R22=1-
∑
5
i=1
yi-ŷi2
∑
5
i=1
yi- y 2
=1- 180
1 000
=0.82.
又∵84.5%>82%,
∴甲选用的模型拟合效果更好.
19.(本小题满分 12 分)为了调查某生产线上质量监督员甲对产品质量好坏
有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品
有 982件,次品有 8件;甲不在生产现场时,510件产品中合格品有 493件,次
品有 17件.试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场
对产品质量好坏有无影响?
【解】 (1)2×2列联表如下:
合格品数 次品数 总计
甲在生产现场 982 8 990
甲不在生产现场 493 17 510
总计 1 475 25 1 500
由列联表可得|ac-bd|=|982×17-493×8|=12 750,相差较大,可在某种程
度上认为“质量监督员甲是否在生产现场与产品质量有关系”.
(2)由 2×2列联表中数据,计算得到 K2的观测值为
k=1 500×982×17-493×82
990×510×1 475×25
≈13.097>6.635,
所以在犯错误的概率不超过 0.01的前提下,认为质量监督员甲是否在生产
现场与产品质量有关系.
20.(本小题满分 12分)有两个分类变量 x与 y,其一组观测值如下面的 2×2
列联表所示:
y1 y2
x1 a 20-a
x2 15-a 30+a
其中 a,15-a均为大于 5的整数,则 a取何值时,在犯错误的概率不超过 0.1
的前提下认为 x与 y之间有关系?
【解】 查表可知,要使在犯错误的概率不超过 0.1的前提下认为 x与 y之
间有关系,则 k≥2.706,而
k=65×[a30+a-20-a15-a]2
20×45×15×50
=
65×65a-3002
20×45×15×50
=
13×13a-602
60×90
.
故 k≥2.706,得 a≥7.19或 a≤2.04.
又 a>5且 15-a>5,a∈Z,解得 a=8或 9,
故 a为 8或 9时,在犯错误的概率不超过 0.1的前提下认为 x与 y之间有关
系.
21.(本小题满分 12 分)某地区 2007 年至 2013年农村居民家庭人均纯收入
y(单位:千元)的数据如下表:
年 份 2007 2008 2009 2010 2011 2012 2013
年份代号 t 1 2 3 4 5 6 7
人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(1)求 y关于 t的线性回归方程;
(2)利用(1)中的回归方程,分析 2007年至 2013年该地区农村居民家庭人均
纯收入的变化情况,并预测该地区 2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:
b̂=
∑
n
i=1
ti- t yi- y-
∑
n
i=1
ti- t 2
,â= y--b̂ t .
【解】 (1)由所给数据计算得 t =1
7
(1+2+3+4+5+6+7)=4,
y-=
1
7
(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
∑
7
i=1
(ti- t )2=9+4+1+0+1+4+9=28,
∑
7
i=1
(ti- t )(yi- y-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1
+1×0.5+2×0.9+3×1.6=14,
b̂=
∑
7
i=1
ti- t yi- y-
∑
7
i=1
ti- t 2
=
14
28
=0.5,
â= y--b̂ t =4.3-0.5×4=2.3,
所求回归方程为ŷ=0.5t+2.3.
(2)由(1)知,b=0.5>0,故 2007 年至 2013 年该地区农村居民家庭人均纯收
入逐年增加,平均每年增加 0.5千元.
将 2015年的年份代号 t=9代入(1)中的回归方程,得
ŷ=0.5×9+2.3=6.8,
故预测该地区 2015年农村居民家庭人均纯收入为 6.8千元.
22.(本小题满分 12 分)电视传媒公司为了解某地区观众对某类体育节目的
收视情况,随机抽取了 100名观众进行调查,其中女性有 55名.下面是根据调
查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
图 3
将日均收看该体育节目时间不低于 40 分钟的观众称为“体育迷”,已知
“体育迷”中有 10名女性.
(1)根据已知条件完成下面的 2×2列联表,并据此资料判断“体育迷”与性
别是否有关?
非体育迷 体育迷 总计
男
女
总计
(2)将日均收看该体育节目不低于 50分钟的观众称为“超级体育迷”,已知
“超级体育迷”中有 2名女性,
若从“超级体育迷”中任意选取 2人,求至少有 1名女性观众的概率.
附:K2=
nad-bc2
a+bc+da+cb+d
,
P(K2≥k0) 0.05 0.01
k0 3.841 6.635
【解】 (1)由频率分布直方图可知,在抽取的 100人中,“体育迷”有 25
人,从而完成 2×2列联表如下:
非体育迷 体育迷 总计
男 30 15 45
女 45 10 55
总计 75 25 100
将 2×2列联表中的数据代入公式计算,得
k= nad-bc2
a+bc+da+cb+d
=
100×30×10-45×152
75×25×45×55
=
100
33
≈3.030.因为 3.030<3.841,所以我们没有理由认为“体育迷”与性别
有关.
(2)由频率分布直方图可知,“超级体育迷”为 5人,其中女生为 2人.
记:从“超级体育迷”中取 2人,至少有 1名女性为事件 A.
则 P(A)=C22C03+C12C13
C25
=
7
10
,
即从“超级体育迷”中任意选取 2 人,至少有 1 名女性观众的概率为
7
10
.
相关文档
- 山东省昌邑市第一中学人教版高中数2021-06-1642页
- 北师版高中数学必修一第11讲:对数函2021-06-168页
- 高中数学人教a版选修1-1学业分层测2021-06-166页
- 高中数学人教a版选修2-2(课时训练):12021-06-16135页
- 山东省昌邑市第一中学人教版高中数2021-06-1617页
- 高中数学人教a版必修五模块综合测2021-06-1610页
- 高中数学人教a版选修2-3练习:2-2-12021-06-166页
- 高中数学(人教版a版必修三)配套课时2021-06-163页
- 人教版高中数学选修2-3练习:第一章12021-06-165页
- 高中数学人教a版必修4课时达标检测2021-06-163页