- 255.00 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
章末综合测评(三) 统计案例
(时间 120 分钟,满分 150 分)
一、选择题(本大题共 12 小题,每小题 5 分,共 60 分.在每小题给出的四个
选项中,只有一项是符合题目要求的)
1.下列说法中错误的是( )
A.如果变量 x 与 y 之间存在着线性相关关系,则我们根据试验数据得到的点
(xi,yi)(i=1,2,…,n)将散布在某一条直线的附近
B.如果两个变量 x 与 y 之间不存在着线性关系,那么根据它们的一组数据(xi,
yi)(i=1,2,…,n)不能写出一个线性方程
C.设 x,y 是具有相关关系的两个变量,且 y 关于 x 的线性回归方程为y^=b^x
+a^,b^叫做回归系数
D.为使求出的线性回归方程有意义,可用统计检验的方法来判断变量 y 与 x
之间是否存在线性相关关系
【解析】 任何一组(xi,yi)(i=1,2,…,n)都能写出一个线性方程,只是有的
不存在线性关系.
【答案】 B
2.如图 1 所示,有 5 组数据,去掉哪组数据后(填字母代号),剩下的 4 组数据
的线性相关性最大( )
图 1
A.E B.C
C.D D.A
【解析】 由题图易知 A,B,C,D 四点大致在一条直线上,而 E 点偏离最
远,故去掉 E 点后剩下的数据的线性相关性最大.
【答案】 A
3.在一次试验中,当变量x的取值分别为1,1
2
,1
3
,1
4
时,变量y的值分别为2,3,4,5,
则 y 与1
x
的回归曲线方程为( ) 【导学号:97270064】
A.y^=1
x
+1 B.y^=2
x
+3
C.y^=2x+1 D.y^=x-1
【解析】 由数据可得,四个点都在曲线y^=1
x
+1 上.
【答案】 A
4.有下列说法:
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型
比较合适;
②用相关指数 R2 来刻画回归的效果,R2 值越大,说明模型的拟合效果越好;
③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小
的模型,拟合效果越好.
其中正确命题的个数是( )
A.0 B.1
C.2 D.3
【解析】 ①选用的模型是否合适与残差点的分布有关;对于②③,R2 的值
越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好.
【答案】 D
5.观察下列各图,其中两个分类变量 x,y 之间关系最强的是( )
A B
C D
【解析】 在四幅图中,D 图中两个深色条的高相差最明显,说明两个分类
变量之间关系最强.
【答案】 D
6.在 2×2 列联表中,下列哪两个比值相差越大,两个分类变量有关系的可
能性就越大( )
A. a
a+b
与 c
c+d B. a
c+d
与 c
a+b
C. a
a+d
与 c
b+c D. a
b+d
与 c
a+c
【解析】 当 ad 与 bc 相差越大,两个分类变量有关系的可能性越大,此时 a
a+b
与 c
c+d
相差越大.
【答案】 A
7.如图 2,5 个(x,y)数据,去掉 D(3,10)后,下列说法错误的是( )
图 2
A.相关系数 r 变大
B.残差平方和变大
C.相关指数 R2 变大
D.解释变量 x 与预报变量 y 的相关性变强
【解析】 由散点图知,去掉 D 后,x 与 y 的相关性变强,且为正相关,所以
r 变大,R2 变大,残差平方和变小.
【答案】 B
8.(2016·安庆一中期中)在一次对性别与是否说谎有关的调查中,得到如下数
据,根据表中数据判断如下结论中正确的是( )
说谎 不说谎 总计
男 6 7 13
女 8 9 17
总计 14 16 30
A.在此次调查中有 95%的把握认为是否说谎与性别有关
B.在此次调查中有 99%的把握认为是否说谎与性别有关
C.在此次调查中有 99.5%的把握认为是否说谎与性别有关
D.在此次调查中没有充分证据显示说谎与性别有关
【解析】 由表中数据得 k=30×6×9-8×72
14×16×13×17
≈0.002 42<3.841.
因此没有充分证据认为说谎与性别有关,故选 D.
【答案】 D
9.某地财政收入 x 与支出 y 满足线性回归方程y^=b^x+a^+e(单位:亿元),其
中b^=0.8,a^=2,|e|<0.5,如果今年该地区财政收入 10 亿元,年支出预计不会超过
( )
A.10 亿 B.9 亿
C.10.5 亿 D.9.5 亿
【解析】 代入数据得 y=10+e,∵|e|<0.5,
∴|y|<10.5,故不会超过 10.5 亿.
【答案】 C
10.(2016·合肥高二检测)废品率 x%和每吨生铁成本 y(元)之间的回归直线方程
为y^=256+3x,表明( )
A.废品率每增加 1%,生铁成本增加 259 元
B.废品率每增加 1%,生铁成本增加 3 元
C.废品率每增加 1%,生铁成本平均每吨增加 3 元
D.废品率不变,生铁成本为 256 元
【解析】 回归方程的系数b^表示 x 每增加一个单位,y^平均增加b^个单位,当
x 为 1 时,废品率应为 1%,故当废品率增加 1%时,生铁成本平均每吨增加 3 元.
【答案】 C
11.已知 x 与 y 之间的几组数据如下表:
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得线性回归直线方程为y^=b^x+a^,若某同学根据上表中的
前两组数据(1,0)和(2,2)求得的直线方程为 y=b′x+a′,则以下结论正确的是
( )
A.b^>b′,a^>a′ B.b^>b′,a^a′ D.b^a′.
【答案】 C
12.两个分类变量 X 和 Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是
a=10,b=21,c+d=35.若 X 与 Y 有关系的可信程度不小于 97.5%,则 c 等于( )
A.3 B.4 C.5 D.6
附:
P(K2≥k0) 0.05 0.025
k0 3.841 5.024
【解析】 2×2 列联表如下:
x1 x2 总计
y1 10 21 31
y2 c d 35
总计 10+c 21+d 66
故 K2 的观测值 k= 66×[1035-c-21c]2
31×35×10+c56-c
≥5.024.
把选项 A,B,C,D 代入验证可知选 A.
【答案】 A
二、填空题(本大题共 4 小题,每小题 5 分,共 20 分.将答案填在题中的横线
上)
13.已知一回归直线方程为y^=1.5x+45,x∈{1,5,7,13,19},则 y =________.
【导学号:97270065】
【解析】 因为 x =1
5(1+5+7+13+19)=9,且 y =1.5 x +45,所以 y =
1.5×9+45=58.5.
【答案】 58.5
14.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度
的关系,随机抽取了 189 名员工进行调查,所得数据如下表所示:
积极支持企业改革 不赞成企业改革 总计
工作积极 54 40 94
工作一般 32 63 95
总计 86 103 189
对于人力资源部的研究项目,根据上述数据试求 K2 的观测值为________.
【解析】 根据列联表中的数据,得到 k=
189×54×63-40×322
94×95×86×103
≈10.76.
【答案】 10.76
15.(2016·深圳高二检测)某车间为了规定工时定额,需要确定加工零件所花
费的时间,为此进行了 5 次试验.根据收集到的数据(如下表),由最小二乘法求得
回归方程y^=0.67x+54.9.
零件数 x(个) 10 20 30 40 50
加工时间 Y(min) 62 75 81 89
现发现表中有一个数据模糊看不清,请你推断出该数据的值为________.
【解析】 由表知 x =30,设模糊不清的数据为 m,则 y =1
5(62+m+75+81
+89)=307+m
5
,因为 y =0.67 x +54.9,
即307+m
5
=0.67×30+54.9,
解得 m=68.
【答案】 68
16.某地区恩格尔系数 Y(%)与年份 x 的统计数据如下表:
年份 x 2006 2007 2008 2009
恩格尔系数 Y(%) 47 45.5 43.5 41
从散点图可以看出 Y 与 x 线性相关,且可得回归方程为y^=b^x+4 055.25,据此
模型可预测 2017 年该地区的恩格尔系数 Y(%)为________.
【解析】 由表可知 x =2 007.5, y =44.25.
因为 y =b^ x +4 055.25,
即 44.25=2 007.5b^+4 055.25,
所以b^≈-2,所以回归方程为y^=-2x+4 055.25,令 x=2 017,得y^=21.25.
【答案】 21.25
三、解答题(本大题共 6 小题,共 70 分.解答应写出文字说明、证明过程或演
算步骤)
17.(本小题满分 10 分)以下是某地区不同身高的未成年男性的体重平均值表.
身高/cm 60 70 80 90 100 110
体重/kg 6.13 7.9 9.99 12.15 15.02 17.5
身高/cm 120 130 140 150 160 170
体重/kg 20.92 26.86 31.11 38.85 42.25 55.05
(1)给出两个回归方程:
①y=0.429 4x-25.318,
②y=2.004e0.019 7x.
通过计算,得到它们的相关指数分别是:R21=0.9311,R22=0.998.试问哪个回
归方程拟合效果更好?
(2)若体重超过相同身高男性平均值的 1.2 倍为偏胖,低于 0.8 为偏瘦,那么该
地区某中学一男生身高为 175 cm,体重为 78 kg,他的体重是否正常?
【解】 (1)∵R22>R21,
∴选择第二个方程拟合效果更好.
(2)把 x=175 代入 y=2.004e0.019 7x,
得 y=62.97,
由于 78
62.97
=1.24>1.2,所以这名男生偏胖.
18.(本小题满分 12 分)关于 x 与 y 有如下数据:
x 2 4 5 6 8
y 30 40 60 50 70
为了对 x,y 两个变量进行统计分析,现有以下两种线性模型:甲模型y^=6.5x
+17.5,乙模型y^=7x+17,试比较哪一个模型拟合的效果更好.
【解】 R21=1-
∑5
i=1 yi-y^i2
∑5
i=1 yi- y 2
=1- 155
1 000
=0.845,
R22=1-
∑5
i=1 yi-y^i2
∑5
i=1 yi- y 2
=1- 180
1 000
=0.82.
又∵84.5%>82%,
∴甲选用的模型拟合效果更好.
19.(本小题满分 12 分)为了调查某生产线上质量监督员甲对产品质量好坏有
无影响,现统计数据如下:质量监督员甲在生产现场时,990 件产品中合格品有
982 件,次品有 8 件;甲不在生产现场时,510 件产品中合格品有 493 件,次品有
17 件.试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品
质量好坏有无影响?
【解】 (1)2×2 列联表如下:
合格品数 次品数 总计
甲在生产现场 982 8 990
甲不在生产现场 493 17 510
总计 1 475 25 1 500
由列联表可得|ac-bd|=|982×17-493×8|=12 750,相差较大,可在某种程
度上认为“质量监督员甲是否在生产现场与产品质量有关系”.
(2)由 2×2 列联表中数据,计算得到 K2 的观测值为
k=1 500×982×17-493×82
990×510×1 475×25
≈13.097>6.635,
所以在犯错误的概率不超过 0.01 的前提下,认为质量监督员甲是否在生产现
场与产品质量有关系.
20.(本小题满分 12 分)有两个分类变量 x 与 y,其一组观测值如下面的 2×2
列联表所示:
y1 y2
x1 a 20-a
x2 15-a 30+a
其中 a,15-a 均为大于 5 的整数,则 a 取何值时,在犯错误的概率不超过 0.1
的前提下认为 x 与 y 之间有关系?
【解】 查表可知,要使在犯错误的概率不超过 0.1 的前提下认为 x 与 y 之间
有关系,则 k≥2.706,而
k=65×[a30+a-20-a15-a]2
20×45×15×50
=65×65a-3002
20×45×15×50
=13×13a-602
60×90
.
故 k≥2.706,得 a≥7.19 或 a≤2.04.
又 a>5 且 15-a>5,a∈Z,解得 a=8 或 9,
故 a 为 8 或 9 时,在犯错误的概率不超过 0.1 的前提下认为 x 与 y 之间有关系.
21.(本小题满分 12 分)某地区 2007 年至 2013 年农村居民家庭人均纯收入 y(单
位:千元)的数据如下表:
年 份 2007 2008 2009 2010 2011 2012 2013
年份代号 t 1 2 3 4 5 6 7
人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(1)求 y 关于 t 的线性回归方程;
(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯
收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:
b^=
∑n
i=1 ti- t yi- y-
∑n
i=1 ti- t 2
,a^= y--b^ t .
【解】 (1)由所给数据计算得 t =1
7(1+2+3+4+5+6+7)=4,
y-=1
7(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
∑7
i=1 (ti- t )2=9+4+1+0+1+4+9=28,
∑7
i=1 (ti- t )(yi- y-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+
1×0.5+2×0.9+3×1.6=14,
b^=
∑7
i=1 ti- t yi- y-
∑7
i=1 ti- t 2
=14
28
=0.5,
a^= y--b^ t =4.3-0.5×4=2.3,
所求回归方程为y^=0.5t+2.3.
(2)由(1)知,b=0.5>0,故 2007 年至 2013 年该地区农村居民家庭人均纯收入
逐年增加,平均每年增加 0.5 千元.
将 2015 年的年份代号 t=9 代入(1)中的回归方程,得
y^=0.5×9+2.3=6.8,
故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元.
22.(本小题满分 12 分)电视传媒公司为了解某地区观众对某类体育节目的收
视情况,随机抽取了 100 名观众进行调查,其中女性有 55 名.下面是根据调查结
果绘制的观众日均收看该体育节目时间的频率分布直方图:
图 3
将日均收看该体育节目时间不低于 40 分钟的观众称为“体育迷”,已知“体
育迷”中有 10 名女性.
(1)根据已知条件完成下面的 2×2 列联表,并据此资料判断“体育迷”与性别
是否有关?
非体育迷 体育迷 总计
男
女
总计
(2)将日均收看该体育节目不低于 50 分钟的观众称为“超级体育迷”,已知
“超级体育迷”中有 2 名女性,
若从“超级体育迷”中任意选取 2 人,求至少有 1 名女性观众的概率.
附:K2= nad-bc2
a+bc+da+cb+d
,
P(K2≥k0) 0.05 0.01
k0 3.841 6.635
【解】 (1)由频率分布直方图可知,在抽取的 100 人中,“体育迷”有 25 人,
从而完成 2×2 列联表如下:
非体育迷 体育迷 总计
男 30 15 45
女 45 10 55
总计 75 25 100
将 2×2 列联表中的数据代入公式计算,得
k= nad-bc2
a+bc+da+cb+d
=100×30×10-45×152
75×25×45×55
=100
33
≈3.030.因为 3.030<3.841,所以我们没有理由认为“体育迷”与性别有
关.
(2)由频率分布直方图可知,“超级体育迷”为 5 人,其中女生为 2 人.
记:从“超级体育迷”中取 2 人,至少有 1 名女性为事件 A.
则 P(A)=C22C03+C12C13
C25
= 7
10
,
即从“超级体育迷”中任意选取 2 人,至少有 1 名女性观众的概率为 7
10.
相关文档
- 高中数学单元评估验收二达标检测含2021-06-1610页
- 2020秋新教材高中数学第四章指数函2021-06-1630页
- 高中数学人教a版选修2-3章末综合测2021-06-1612页
- 山东省昌邑市第一中学人教版高中数2021-06-1642页
- 北师版高中数学必修一第11讲:对数函2021-06-168页
- 高中数学人教a版选修1-1学业分层测2021-06-166页
- 高中数学人教a版选修2-2(课时训练):12021-06-16135页
- 山东省昌邑市第一中学人教版高中数2021-06-1617页
- 高中数学人教a版必修五模块综合测2021-06-1610页
- 高中数学人教a版选修2-3练习:2-2-12021-06-166页