- 213.75 KB
- 2021-06-23 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
重点强化训练(五) 统计与统计案例
(对应学生用书第 227 页)
A 组 基础达标
(建议用时:30 分钟)
一、选择题
1.(2017·石家庄模拟)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法
规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区
驾驶员的总人数为 N,其中甲社区有驾驶员 96 人.若在甲、乙、丙、丁四个
社区抽取驾驶员的人数分别为 12,21,25,43,则这四个社区驾驶员的总人数 N
为
( ) 【导学号:79170343】
A.101 B.808
C.1 212 D.2 012
B [由题意知抽样比为12
96
,而四个社区一共抽取的驾驶员人数为 12+21+25
+43=101,故有12
96
=101
N
,解得 N=808.]
2.设某大学的女生体重 y(单位:kg)写身高 x(单位:cm)具有线性相关关系,根
据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^
=
0.85x-85.71,则下列结论中不正确的是( )
A.y 与 x 具有正的线性相关关系
B.回归直线过样本点的中心(x,y)
C.若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg
D.若该大学某女生身高为 170 cm,则可断定其体重必为 58.79 kg
D [∵0.85>0,∴y 与 x 正相关,∴A 正确;
∵回归直线经过样本点的中心(x,y),∴B 正确;
∵Δy=0.85(x+1)-85.71-(0.85x-85.71)=0.85,
∴C 正确.]
3.亚冠联赛前某参赛队准备在甲、乙两名球员中选一人参加比赛.如图 9 所示
的茎叶图记录了一段时间内甲、乙两人训练过程中的成绩,若甲、乙两名球
员的平均成绩分别是 x1,x2,则下列结论正确的是( )
图 9
A.x1>x2,选甲参加更合适
B.x1>x2,选乙参加更合适
C.x1=x2,选甲参加更合适
D.x1=x2,选乙参加更合适
A [根据茎叶图可得甲、乙两人的平均成绩分别为 x1≈31.67,x2≈24.17,从
茎叶图来看,甲的成绩比较集中,而乙的成绩比较分散,因此甲发挥得更稳
定,选甲参加比赛更合适.]
4.(2018·黄山模拟)某同学在研究性学习中,收集到某制药厂今年前 5 个月甲胶
囊生产产量(单位:万盒)的数据如下表所示:
x(月份) 1 2 3 4 5
y(万盒) 5 5 6 6 8
若 x,y 线性相关,线性回归方程为y^
=0.7x+a^
,则估计该制药厂 6 月份生产
甲胶囊产量为( )
【导学号:79170344】
A.8.1 万盒 B.8.2 万盒
C.8.9 万盒 D.8.6 万盒
A [由题意知x=3,y=6,则a^
=y-0.7x=3.9,∴x=6 时,y^
=8.1.]
5.(2018·郑州模拟)利用如图 10 所示算法在平面直角坐标系上打印一系列点,则
打印的点在圆 x2+y2=10 内的个数为( )
图 10
A.2 B.3
C.4 D.5
B [执行题中的程序框图,打印的点的坐标依次为(-3,6),(-2,5),(-1,4),
(0,3),(1,2),(2,1),其中点(0,3),(1,2),(2,1)位于圆 x2+y2=10 内,因此打印
的点位于圆 x2+y2=10 内的共有 3 个.]
二、填空题
6.在某市“创建文明城市”活动中,对 800 名志愿者的年龄抽样调查统计后得
到频率分布直方图(如图 11),但是年龄组为[25,30)的数据不慎丢失,据此估
计这 800 名志愿者年龄在[25,30)内的人数为________.
图 11
160 [设年龄在[25,30)内的志愿者的频率是 P,则有 5×0.01+P+5×0.07+
5×0.06+5×0.02=1,解得 P=0.2.
故估计这 800 名志愿者年龄在[25,30)内的人数是 800×0.2=160.]
7.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,
随机调查了观看该节目的观众 110 名,得到如下的列联表:
女 男 总计
喜爱 40 20 60
不喜爱 20 30 50
总计 60 50 110
试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与
否和性别有关”.
参考附表:
P(K2≥k0) 0.050 0.010 0.001
k0 3.841 6.635 10.828
99% [ 假 设 喜 爱 该 节 目 和 性 别 无 关 , 分 析 列 联 表 中 数 据 , 可 得 K2 =
110 × (40 × 30-20 × 20)2
60 × 50 × 60 × 50
≈7.822>6.635,
所以有 99%的把握认为“喜爱《开门大吉》节目与否和性别有关”.]
8.(2017·太原模拟)数列{a n}满足 an=n,阅读如图 12 所示的程序框图,运行相
应的程序,若输入 n=5,an=n,x=2 的值,则输出的结果 v=________.
图 12
129 [该程序框图循环 4 次,各次 v 的值分别是 14,31,64,129,故输出结果 v=
129.]
三、解答题
9.(2018·合肥模拟)全世界越来越关注环境保护问题,某监测站点于 2016 年 8 月
某日起连续 n 天监测空气质量指数(AQI),数据统计如下表:
空气质量指数
(μg/m3)
[0,50] (50,100] (100,150] (150,200] (200,250]
空气质量等级 优 良 轻度污染 中度污染 重度污染
天数 20 40 m 10 5
(1)根据所给统计表和频率分布直方图中的信息求出 n,m 的值,并完成频率
分布直方图;
图 13
(2)由频率分布直方图,求该组数据的平均数与中位数;
(3)在空气质量指数分别为(50,100]和(150,200]的监测数据中,用分层抽样的方
法抽取 5 天,从中任意选取 2 天,求事件 A“两天空气质量等级都为良”发
生的概率.
[解] (1)∵0.004×50=20
n
,∴n=100,
∵20+40+m+10+5=100,∴m=25.
40
100 × 50
= 0.008 ; 25
100 × 50
= 0.005 ; 10
100 × 50
= 0.002 ; 5
100 × 50
=
0.001.2 分
由此完成频率分布直方图,如图:
4 分
(2)由频率分布直方图得该组数据的平均数为 25×0.004×50+75×0.008×50
+125×0.005×50+175×0.002×50+225×0.001×50=95, 6 分
∵[0,50)的频率为 0.004×50=0.2,[50,100)的频率为 0.008×50=0.4,
∴中位数为 50+0.5-0.2
0.4
×50=87.5. 8 分
(3)由题意知在空气质量指数为(50,100]和(150,200]的监测天数中分别抽取 4 天
和 1 天,9 分
在所抽取的 5 天中,将空气质量指数为(50,100]的 4 天分别记为 a,b,c,d;
将空气质量指数为(150,200]的 1 天记为 e,从中任取 2 天的基本事件为(a,
b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,
e),共 10 个, 10 分
其中事件 A“两天空气质量等级都为良”包含的基本事件为
(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),共 6 个.11 分
所以 P(A)= 6
10
=3
5. 12 分
10.(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区
城乡居民人民币储蓄存款(年底余额)如下表:
年份 2010 2011 2012 2013 2014
时间代号 t 1 2 3 4 5
储蓄存款 y(千亿元) 5 6 7 8 10
(1)求 y 关于 t 的回归方程y^
=b^
t+a^
;
(2)用所求回归方程预测该地区 2015 年(t=6)的人民币储蓄存款.
附:回归方程y^
=b^
t+a^
中,b^
=
∑n
i=1
t iyi-n t y
∑n
i=1
t 2i-n t2
,a^
=y-b^
t.
[解] (1)列表计算如下:
这里 n=5,t=1
n
n
∑
i=1
ti=15
5
=3,y=1
n
n
∑
i=1
yi=36
5
=7.2. 2 分
又 ltt=
n
∑
i=1
t2i-nt 2=55-5×32=10,
lty=
n
∑
i=1
tiyi-n t
-
y
-
=120-5×3×7.2=12,
从而b^
=lty
ltt
=12
10
=1.2,
a^
=y-b^
t=7.2-1.2×3=3.6,
故所求回归方程为y^
=1.2t+3.6. 7 分
(2)将 t=6 代入回归方程可预测该地区 2015 年的人民币储蓄存款为y^
=1.2×6
+3.6=10.8(千亿元). 12 分
B 组 能力提升
(建议用时:15 分钟)
1.如图 14 所示的程序框图,若输出 k 的值为 6,则判断框内可填入的条件是( )
【导学号:79170345】
图 14
A.s>1
2
? B.s>3
5
?
C.s> 7
10
? D.s>4
5
?
C [第一次执行循环:s=1× 9
10
= 9
10
,k=8,s= 9
10
应满足条件;
第二次执行循环:s= 9
10
×8
9
= 8
10
,k=7,s= 8
10
应满足条件,排除选项 D;
第三次执行循环:s= 8
10
×7
8
= 7
10
,k=6,不再满足条件,结束循环.
因此判断框中的条件为 s> 7
10.]
2.(2017·西安调研)已知某产品连续 4 个月的广告费用 x 1(千元)与销售额 y1(万
元),经过对这些数据的处理,得到如下数据信息:
①
4
∑
i=1
xi=18,
4
∑
i=1
yi=14;
②广告费用 x 和销售额 y 之间具有较强的线性相关关系;
③回归直线方程y^
=b^
x+a^
中的b^
=0.8(用最小二乘法求得).那么,广告费用为
6 千元时,可预测销售额约为________万元.
4.7 [因为
4
∑
i=1
xi=18,
4
∑
i=1
yi=14,所以x=4.5,y=3.5,
因为回归直线方程y^
=b^
x+a^
中的b^
=0.8,
所以 3.5=0.8×4.5+a^
,
所以a^
=-0.1,所以y^
=0.8x-0.1.
x=6 时,可预测销售额约为 4.7 万元.]
3.(2015·广东高考)某工厂 36 名工人的年龄数据如下表.
工人
编号 年龄 工人
编号 年龄 工人
编号 年龄 工人
编号 年龄
1 40 10 36 19 27 28 34
2 44 11 31 20 43 29 39
3 40 12 38 21 41 30 43
4 41 13 39 22 37 31 38
5 33 14 43 23 34 32 42
6 40 15 45 24 42 33 53
7 45 16 39 25 37 34 37
8 42 17 38 26 44 35 49
9 43 18 36 27 42 36 39
(1)用系统抽样法从 36 名工人中抽取容量为 9 的样本,且在第一分段里用随
机抽样法抽到的年龄数据为 44,列出样本的年龄数据;
(2)计算(1)中样本的均值x和方差 s2;
(3)36 名工人中年龄在x-s 与x+s 之间有多少人?所占的百分比是多少(精确
到 0.01%)?
[解] (1)36 人分成 9 组,每组 4 人,其中第一组的工人年龄为 44,所以它在
组中的编号为 2,
所以所有样本数据的编号为 4n-2(n=1,2,…,9),
其年龄数据为:44,40,36,43,36,37,44,43,37. 5 分
(2)由均值公式知:x=44+40+…+37
9
=40,
由方差公式知:s2=1
9[(44-40)2+(40-40)2+…+(37-40)2]=100
9 . 8 分
(3)因为 s2=100
9
,s=10
3
,
所以 36 名工人中年龄在x-s 和x+s 之间的人数等于年龄在区间[37,43]上的人
数,
即 40,40,41,…,39,共 23 人.
所 以 36 名 工 人 中 年 龄 在 x- s 和 x+ s 之 间 的 人 数 所 占 的 百 分 比 为 23
36
×100%≈63.89%. 12 分