- 317.00 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第十二章 统计与统计案例
第一讲 随机抽样与用样本估计总体
1.[2020石家庄高三摸底考试]为了调查某工厂生产的一种产品的尺寸是否合格,现从500件产品中抽出10件进行检验,先将500件产品编号为000,001,002,…,499,在随机数表中任选一个数开始,例如选出第6行第8列的数4开始向右读(为了便于说明,下面摘取了随机数表的第6行至第8行),选出的第1个号码为439,则选出的第4个号码为( )
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75
A.548 B.443 C.379 D.217
2.[2020安徽江淮十校第一次联考]某创业公司共有36名职工,为了解该公司职工的年龄构成情况,随机采访了9名职工,得到的数据(单位:岁)为36,36,37,37,44,40,43,44,43,若用样本估计总体,则年龄在(x - s,x+s)(x为平均数,s为标准差)内的人数占公司总人数的百分比是(精确到1%)( )
A.56% B.14% C.25% D.67%
3.[多选题]图12-1-1是2019年第一季度A,B,C,D,E五省GDP情况图,则下列叙述中正确的是 ( )
图12-1-1
A.2019年第一季度GDP增速由高到低排位第5的是A省
B.与2018年同期相比,五省2019年第一季度的GDP总量均实现了增长
C.2018年同期C省的GDP总量不超过4 000亿元
D.2019年第一季度GDP总量和增速由高到低排位均居同一位的省只有1个
4.[2019河南郑州三测]某同学10次测评成绩的数据如下(从小到大排列):2,2,3,4,10+x,10+y,19,19,20,21.已知成绩的中位数为12,若要使标准差最小,则4x+2y的值是 ( )
A.12 B.14 C.16 D.18
5.[2018全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图12 - 1 - 2(1)(2)所示的饼图:
(1) (2)
图12 - 1 - 2
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
6.[2020贵阳高三摸底考试]某大学为了解在校本科生参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取 名学生.
7.[2019全国卷Ⅱ]我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车
次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .
考法1 两种抽样方法的运用
命题角度1 分层抽样
1[2017 江苏高考]某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.
应从丙种型号的产品中抽取60×300200+400+300+100=18(件).
命题角度2 简单随机抽样
2 2019年9月14日,女排世界杯在日本拉开帷幕,某网络直播平台开通观众留言渠道,为中国女排加油.此平台利用随机数表法从编号为01,02,…,25的号码中选取5个幸运号码,选取方法是从下方随机数表的第1行第24列的数字开始,从左往右依次选取2个数字,则第5个被选中的号码为 .
81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 85(第一行)
06 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49(第二行)
根据题意及随机数表可得5个被选中的号码依次为16,06,09,13,23.故第5个被选中的号码为23.
1.为了了解某市某校不同年级的学生对垃圾分类的了解程度,拟采用分层抽样的方法,从该校三个年级的学生中抽取一个容量为320的样本进行调查.已知该校高一年级、高二年级、高三年级的人数之比为6∶5∶5,则应从高一年级的学生中抽取名.
考法2 统计图表的应用
命题角度1 扇形图、折线图、条形图及其应用
3[多选题]某调查机构对某地互联网行业进行了调查统计,得到整个互联网行业从业者的年龄分布扇形图(如图12-1-3)、90后从事互联网行业的岗位分布条形图(如图12-1-4),则下列结论中一定正确的是
图12-1-3 图12-1-4
A.互联网行业从业者中90后占一半以上
B.互联网行业中从事技术岗位的90后人数超过总人数的20%
C.互联网行业中从事运营岗位的人数90后比80前多
D.互联网行业中从事运营岗位的人数90后比80后多
A选项,根据扇形图可知互联网行业从业者中90后占了56%,故正确;B选项,互联网行业中从事技术岗位的90后人数占总人数的0.396×0.56≈0.222,故正确;C选项,互联网行业中从事运营岗位的90后人数占总人数的0.17×0.56≈0.095,而80前从事互联网行业的人数才占总人数的0.03,故正确;D选项,因为互联网行业中从事运营岗位的80后人数占总人数的比例不能确定,所以无法判断,故错误.故选ABC.
ABC
命题角度2 频率分布直方图及其应用
4 [2019全国卷Ⅲ]为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、物质的量浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图12 - 1 - 5所示的直方图.
记C为事件:“乙离子残留在体内的百分比不低于5.5%”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
(1)根据P(C)的估计值为0.70及频率之和为1可求得a,b的值;(2)根据各组区间的中点值及频率即可计算平均值.
(1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1 - 0.05 - 0.15 - 0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2%×0.15+3%×0.20+4%×0.30+5%×0.20+6%×0.10+7%×0.05=4.05%.
乙离子残留百分比的平均值的估计值为
3%×0.05+4%×0.10+5%×0.15+6%×0.35+7%×0.20+8%×0.15=6.00%.
2.(1)[多选题]如图12-1-6所示的折线图是某房地产公司中某销售员一年的工资情况.若近几年来,该销售员每年的工资情况基本稳定,则( )
A.工资增长率最高的为8月份
B.该销售员一年有7个月的工资超过4 000元
C.由此图可以估计,该销售员2020年6,7,8月份的平均工资将会超过5 000元
D.该销售员这一年中的最低工资为1 900元
(2)[2018全国卷Ⅰ]某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(1)在图12 - 1 - 7中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
图12 - 1 - 7
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
考法3 用样本的数字特征估计总体的数字特征
5 [2019全国卷Ⅱ]演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
A.中位数 B.平均数 C.方差 D.极差
记9个原始评分分别为a,b,c,d,e,f ,g,h,i(按从小到大的顺序排列),易知e既是7个有效评分的中位数,又是9个原始评分的中位数,故不变的数字特征是中位数.
A
6[2019全国卷Ⅱ]某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的
分组
[-0.20,0)
[0,0.20)
[0.20,0.40)
[0.40,0.60)
[0.60,0.80)
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:74≈8.602.
(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率估计总体可得,这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)产值增长率的平均数y=1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
方差s2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,标准差s=0.029 6=0.02×74≈0.17.故这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
3.[多选题]某班期末考试数学成绩(满分150分)的频率分布直方图如图12-1-8所示,
图12-1-8
其中分组区间[80,90],(90,100],(100,110],(110,120],(120,130],(130,140],(140,150](单位:分),根据频率分布直方图,判断下列说法正确的是( )
A.估计本次考试数学成绩的平均数为114.8分
B.估计本次考试数学成绩的众数为115分
C.估计本次考试数学成绩的中位数为114分
D.本次考试数学成绩110分以上的人数等于110分以下的人数
1.D 从第6行第8列的数4开始自左向右读下去,三位三位地读,把在000~499范围内且前面没有出现过的数记下,否则跳过,则第4个满足条件的数是217,故选D.
2.A x=36+36+37+37+44+40+43+44+439=40,
s2=16+16+9+9+16+0+9+16+99=1009,s=103,
所以年龄在(x- s,x+s)即(1103,1303)内的人数为5,59≈56%,
故选A.
3.ABC 由折线图可知A,B正确;4 067.4÷(1+6.6%)≈3 816(亿元),3 816<4 000,故C正确;2019年第一季度GDP总量和增速由高到低排位均居同一位的省有B省(均第一)、C省(均第四),共有2个,故D错误.故选ABC.
4.A 由成绩的中位数为12,得10+x+10+y2=12,故x+y=4,故成绩的平均数为110(2+2+3+4+10+x+10+y+19+19+20+21)=11.4.要使标准差最小,即方差最小,只需使(10+x- 11.4)2+(10+y- 11.4)2最小,又(10+x- 11.4)2+(10+y- 11.4)2=(x- 1.4)2+(y- 1.4)2≥(x+y- 2.8)22=0.72,当且仅当x- 1.4=y- 1.4时取等号,即x=y=2时,标准差最小.此时4x+2y=12.故选A.
【技巧点拨】 巧解平均数与方差
1.找齐法
在计算平均数时,如果这些数都在某个数左右摆动,就选取一个数作为标准进行找齐.找齐法的依据是
平均数x=x1+x2+…+xnn
=(x1- a)+(x2- a)+…+(xn- a)+nan
=a+(x1- a)+(x2- a)+…+(xn- a)n;
方差s2=(x1- x)2+(x2- x)2+…+(xn- x)2n
=[(x1- a)- (x- a)]2+[(x2- a)- (x- a)2]+…+[(xn- a)- (x- a)]2n.
其中a为被选作标准的数,在使用找齐法时,a的选取可以多种多样,原则是便于计算.
2.方差的简化公式
方差的一个简化公式是s2=1n[(x12+x22+…+xn2)- nx2]=x2-x2[其中x2=1n(x12+x22+…+xn2)].该式只要把方差公式展开进行重组即可证明.
5.A 解法一 设新农村建设前经济收入的总量为x,则新农村建设后经济收入的总量为2x.
建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;
建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;
建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;
建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D正确.
解法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,A不正确.
【试题评析】 在统计问题中,涉及的图表很多,本题以饼图为依托,考查利用统计知识分析社会实际问题,体现了统计图表的应用功能.与往年高考试题相比,2018年高考试题对概率统计的考查更贴近生活.解答本题时,若没有注意题眼“实现翻番”,而直接观察饼图中的百分率进行比较,则会得到错误答案.解题时看准题眼,就能有效避免此类错误.
【素养落地】 该题紧扣时政,以新农村建设前后的经济收入构成比例的饼图为背景,考查抽象概括能力、数据处理能力,体现了直观想象、数学建模、数据分析、数学抽象、逻辑推理等核心素养.试题较为简单.解题时从图中读出相应的信息即可得结果.
6.60 设应从一年级本科生中抽取n名学生,则3004+5+5+6=n4,解得n=60.
7.0.98 经停该站高铁列车所有车次的平均正点率的估计值为10×0.97+20×0.98+10×0.9910+20+10=0.98.
1.120 因为该校高一年级、高二年级、高三年级的人数之比为6∶5∶5,所以应从高一年级的学生中抽取320×66+5+5=120(名).
2.(1)BC 由题图可知,工资增长率最高的为6月份,故A选项错误;该销售员一年有7个月的工资超过4 000元,故B选项正确;由折线图知该销售员6,7,8月份的平均工资超过了8 000元,故估计该销售员2020年6,7,8月份的平均工资将超过5 000元,故C选项正确;该销售员这一年中的最低工资为1 300元,故D选项错误.故选BC.
(2)(i)频率分布直方图如图D 12- 1- 1所示.
图D 12- 1- 1
(ii)根据(1)中的频率分布直方图,知该家庭使用节水龙头50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.
(iii)该家庭未使用节水龙头50天日用水量的平均数为
x1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.
该家庭使用了节水龙头后50天日用水量的平均数为
x2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.
估计该家庭使用节水龙头后,一年能节省水(0.48- 0.35)×365=47.45(m3).
3.ABC 由频率分布直方图可知,本次考试数学成绩的平均数为85×0.04+95×0.06+105×0.24+115×0.36+125×0.16+135×0.12+145×0.02=114.8(分),A正确;由图易知本次考试数学成绩的众数为115分,B正确;前三组的频率和为(0.004+0.006+0.024)×10=0.34,0.34+0.036×10=0.7,所以本次考试数学成绩的中位数应落在区间(110,120]上,故中位数为110+0.5- 0.340.36×10≈114(分),C正确;因为0.04+0.06+0.24<0.36+0.16+0.12+0.02,故本次考试数学成绩110分以上的人数多于110分以下的人数,D错误.故选ABC.