- 241.72 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第十三章统计与统计案例
第一讲 随机抽样与用样本估计总体
1.[2020石家庄高三摸底考试]为了调查某工厂生产的一种产品的尺寸是否合格,现从500件产品中抽出10件进行检验,先将500件产品编号为000,001,002,…,499,在随机数表中任选一个数开始,例如选出第6行第8列的数4开始向右读(为了便于说明,下面摘取了随机数表的第6行至第8行),选出的第1个号码为439,则选出的第4个号码为( )
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75
A.548 B.443 C.379 D.217
2.[2020安徽江淮十校第一次联考]某创业公司共有36名职工,为了解该公司职工的年龄构成情况,随机采访了9名职工,得到的数据(单位:岁)为36,36,37,37,44,40,43,44,43,若用样本估计总体,则年龄在(x - s,x+s)(x为平均数,s为标准差)内的人数占公司总人数的百分比是(精确到1%)( )
A.56% B.14% C.25% D.67%
3.[2020广东七校联考]图13 - 1 - 1是2019年第一季度A,B,C,D,E五省GDP情况图,则下列叙述中不正确的是( )
图13 - 1 - 1
A.2019年第一季度GDP增速由高到低排位第5的是A省
B.与2018年同期相比,五省2019年第一季度的GDP总量均实现了增长
C.2018年同期C省的GDP总量不超过4 000亿元
D.2019年第一季度GDP总量和增速由高到低排位均居同一位的省只有1个
4.[2020河南安阳高三第一次调研考试]图13 - 1 - 2是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是( )
A.甲所得分数的极差为22
B.乙所得分数的中位数为18
C.两人所得分数的众数相等
D.甲所得分数的平均数低于乙所得分数的平均数
5.[2019河南郑州三测]某同学10次测评成绩的数据如下(从小到大排列):2,2,3,4,10+x,10+y,19,19,20,21.已知成绩的中位数为12,若要使标准差最小,则4x+2y的值是( )
A.12 B.14 C.16 D.18
6.[2018全国卷Ⅰ,3,5分][理]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图13 - 1 - 3(1)(2)所示的饼图:
(1) (2)
图13 - 1 - 3
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
7.[2020贵阳高三摸底考试]某大学为了解在校本科生参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取 名学生.
8.[2019全国卷Ⅱ,13,5分][理]我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .
考法1三种抽样方法的运用
1 [2018全国卷Ⅲ,14,5分]某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是 .
因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,这样才能了解到不同年龄段的客户对公司服务的客观评价,所以最合适的抽样方法是分层抽样.
2(1)[2019全国卷Ⅰ,6,5分]某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是
A.8号学生 B.200号学生C.616号学生 D.815号学生
(2)[2017江苏,3,5分]某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.
(3)2019年9月14日,女排世界杯在日本拉开帷幕,某网络直播平台开通观众留言渠道,为中国女排加油.此平台利用随机数表法从编号为01,02,…,25的号码中选取5个幸运号码,选取方法是从下方随机数表的第1行第24列的数字开始,从左往右依次选取2个数字,则第5个被选中的号码为 .
81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 85(第一行)
06 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49(第二行)
(1)解法一 由系统抽样可知第一组学生的编号为1~10,第二组学生的编号为11~20,…,最后一组学生的编号为991~1000.设第一组取到的学生编号为x,则第二组取到的学生编号为x+10,以此类推,所取的学生编号为10的倍数加x.因为46号学生被抽到,所以x=6,所以616号学生被抽到,故选C.
解法二 由题意,知抽样间隔为1000100=10.因为46号学生被抽到,所以被抽到的学生的编号为6,16,…,6+10(n - 1),n∈N*.代入四个选项知,只有抽到616号学生时,n=62,为整数,故选C.
(2)应从丙种型号的产品中抽取60×300200+400+300+100=18(件).
(3)根据题意及随机数表可得5个被选中的号码依次为16,06,09,13,23.故第5个被选中的号码为23.
1.(1)某班从56名学生中选8人参加学校组织的新中国成立七十周年知识竞赛活动,这些学生的学号分别为1,2,3,…,56,现根据学号,采用系统抽样的方法选取,已知学号为4的同学被选中,那么下列学号是被选出的同学的学号的是( )
A.9 B.15 C.18 D.26
(2)为了了解某市某校不同年级的学生对垃圾分类的了解程度,拟采用分层抽样的方法,从该校三个年级的学生中抽取一个容量为320的样本进行调查.已知该校高一年级、高二年级、高三年级的人数之比为6∶5∶5,则应从高一年级的学生中抽取名.
考法2统计图表的应用
命题角度1 频率分布直方图及其应用
3 [2019全国卷Ⅲ,17,12分][理]为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、物质的量浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图13 - 1 - 4所示的直方图.
记C为事件:“乙离子残留在体内的百分比不低于5.5%”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
(1)根据P(C)的估计值为0.70及频率之和为1可求得a,b的值;(2)根据各组区间的中点值及频率即可计算平均值.
(1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1 - 0.05 - 0.15 - 0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2%×0.15+3%×0.20+4%×0.30+5%×0.20+6%×0.10+7%×0.05=4.05%.
乙离子残留百分比的平均值的估计值为
3%×0.05+4%×0.10+5%×0.15+6%×0.35+7%×0.20+8%×0.15=6.00%.
命题角度2 茎叶图及其应用
4 [2020郑州模拟]某高中从高三年级甲、乙两个班中各选出7名学生参加数学联赛,他们取得的成绩(满分140分)的茎叶图如图13 - 1 - 5所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若x,G,y成等比数列且正实数a,b满足a,G,b成等差数列,则1a+4b的最小值为
A.49 B.2 C.94 D.9
由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x=1.由乙班学生成绩的平均数为86,可得( - 10)+( - 6)+( - 4)+(y - 6)+5+7+10=0,解得y=4.由x,G,y成等比数列,可得G2=xy=4.由正实数a,b满足a,G,b成等差数列,可得G>0,a+b=2G,所以G=2,a+b=4,所以1a+4b=(1a+4b)×(a4+b4)=14(1+ba+4ab+4)≥14×(5+4)=94(当且仅当b=2a时取等号).故1a+4b的最小值为94.
C
2.[2018全国卷Ⅰ,19,12分]某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(1)在图13 - 1 - 6中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
图13 - 1 - 6
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
考法3用样本的数字特征估计总体的数字特征
5 [2019全国卷Ⅱ,5,5分][理]演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
A.中位数 B.平均数 C.方差 D.极差
记9个原始评分分别为a,b,c,d,e,f ,g,h,i(按从小到大的顺序排列),易知e既是7个有效评分的中位数,又是9个原始评分的中位数,故不变的数字特征是中位数.
A
6某市为调查甲、乙两校学生对分层教学模式的满意度,用简单随机抽样从这两校中分别抽取30名学生,根据他们对分层教学模式的满意度评分(百分制),绘制出茎叶图如图13 - 1 - 7所示.
(1)估计甲学校学生对分层教学模式的满意度评分的中位数.
(2)设甲、乙两校学生对分层教学模式的满意度评分的平均数分别为x1,x2,估计x1-x2的值.
(1)求出茎叶图中的甲学校学生对分层教学模式的满意度评分的中位数后,可估计甲学校学生对分层教学模式的满意度评分的中位数.(2)观察茎叶图中的数据,分别求出甲、乙两校学生对分层教学模式的满意度评分的样本数据的平均数,从而可估计x1-x2的值.
(1)样本数据中,甲学校学生对分层教学模式的满意度评分处于最中间的两个数是70,70,
所以样本数据中甲学校学生对分层教学模式的满意度评分的中位数是70,由此估计甲学校学生对分层教学模式的满意度评分的中位数是70.……………………………………………………………………………………………(用样本的中位数来估计总体的中位数)
(2)解法一 设甲、乙两校样本中学生对分层教学模式的满意度评分的平均数分别为x' 1,x' 2,…………………………(因为是
样本的平均数,与题中的总体平均数是不同的,故需另外设字母表示)
根据样本茎叶图可知,
x' 1=130×(47+52+53×2+55+60×2+61+63×3+64+65×2+70×2+71×2+72×2+76×2+78+82+84×2+85+87+90+92)=208430,x' 2=130×(45+53×2+58+60×3+61×2+62×2+63×2+65+70×2+72×3+73×2+76×2+79+81×2+85×2+88+90)=206930,所以x' 1-x' 2=2084-206930=0.5,故x1-x2的估计值为0.5.
解法二 设甲、乙两校样本中学生对分层教学模式的满意度评分的平均数分别为x″ 1,x″ 2,
根据样本茎叶图可知,
30(x″ 1-x″ 2)=30x″ 1 - 30x″ 2=(7 - 5)+(55+8 - 14)+(24 - 12 - 65)+(26 - 24 - 79)+(22 - 20)+92=2+49 - 53 - 77+2+92=15.(直接求30(x″ 1-x″ 2),达到“妙算”的目的)
因此x″ 1-x″ 2=0.5,故x1-x2的估计值为0.5.
本题第(2)问的易错点有两处:一是由茎叶图读数据时读错或漏读,导致所求的平均数出错;二是运算不认真,导致所求得的结果出错.显然解法二的运算量比解法一的运算量少得多,因此,认真审题,多思少算,既可简化运算,又可避免运算错误.
3.[2019全国卷Ⅱ,19,12分]某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
[ - 0.20,0)
[0,0.20)
[0.20,0.40)
[0.40,0.60)
[0.60,0.80)
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:74≈8.602.
1.D 从第6行第8列的数4开始自左向右读下去,三位三位地读,把在000~499范围内且前面没有出现过的数记下,否则跳过,则第4个满足条件的数是217,故选D.
2.A x=36+36+37+37+44+40+43+44+439=40,
s2=16+16+9+9+16+0+9+16+99=1009,s=103,
所以年龄在(x - s,x+s)即(1103,1303)内的人数为5,59≈56%,
故选A.
3.D 由折线图可知A,B正确;4 067.4÷(1+6.6%)≈3 816(亿元),3 816<4 000,故C正确;2019年第一季度GDP总量和增速由高到低排位均居同一位的省有B省(均第一)、C省(均第四),共有2个,故D错误.故选D.
4.D 甲的最高分为33,最低分为11,极差为22,A正确;乙所得分数的中位数为18,B正确;甲、乙所得分数的众数都为22,C正确;甲的平均分为x甲=11+15+17+20+22+22+24+32+339=1969,乙的平均分为x乙=8+11+12+16+18+20+22+22+319=1609,甲所得分数的平均数高于乙所得分数的平均数,D错误,故选D.
5.A 由成绩的中位数为12,得10+x+10+y2=12,故x+y=4,故成绩的平均数为110(2+2+3+4+10+x+10+y+19+19+20+21)=11.4.要使标准差最小,即方差最小,只需使(10+x - 11.4)2+(10+y - 11.4)2最小,又(10+x - 11.4)2+(10+y - 11.4)2=(x - 1.4)2+(y - 1.4)2≥(x+y - 2.8)22=0.72,当且仅当x - 1.4=y - 1.4时取等号,即x=y=2时,标准差最小.此时4x+2y=12.故选A.
【技巧点拨】 巧解平均数与方差
1.找齐法
在计算平均数时,如果这些数都在某个数左右摆动,就选取一个数作为标准进行找齐.找齐法的依据是
平均数x=x1+x2+…+xnn
=(x1 - a)+(x2 - a)+…+(xn - a)+nan
=a+(x1 - a)+(x2 - a)+…+(xn - a)n;
方差s2=(x1 - x)2+(x2 - x)2+…+(xn - x)2n
=[(x1 - a) - (x - a)]2+[(x2 - a) - (x - a)2]+…+[(xn - a) - (x - a)]2n.
其中a为被选作标准的数,在使用找齐法时,a的选取可以多种多样,原则是便于计算.
2.方差的简化公式
方差的一个简化公式是s2=1n[(x12+x22+…+xn2) - nx2]=x2-x2[其中x2=1n(x12+x22+…+xn2)].该式只要把方差公式展开进行重组即可证明.
6.A 解法一 设新农村建设前经济收入的总量为x,则新农村建设后经济收入的总量为2x.
建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;
建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;
建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;
建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D正确.
解法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,A不正确.
【试题评析】 在统计问题中,涉及的图表很多,本题以饼图为依托,考查利用统计知识分析社会实际问题,体现了统计图表的应用功能.与往年高考试题相比,2018年高考试题对概率统计的考查更贴近生活.解答本题时,若没有注意题眼“实现翻番”,而直接观察饼图中的百分率进行比较,则会得到错误答案.解题时看准题眼,就能有效避免此类错误.
【素养落地】 该题紧扣时政,以新农村建设前后的经济收入构成比例的饼图为背景,考查抽象概括能力、数据处理能力,体现了直观想象、数学建模、数据分析、数学抽象、逻辑推理等核心素养.试题较为简单.解题时从图中读出相应的信息即可得结果.
7.60 设应从一年级本科生中抽取n名学生,则3004+5+5+6=n4,解得n=60.
8.0.98 经停该站高铁列车所有车次的平均正点率的估计值为10×0.97+20×0.98+10×0.9910+20+10=0.98.
1.(1)C 由题意知,抽取的学生构成等差数列{an},a1=4,d=7,所以an=7n - 3,a3=3×7 - 3=18,故选C.
(2)120 因为该校高一年级、高二年级、高三年级的人数之比为6∶5∶5,所以应从高一年级的学生中抽取320×66+5+5=120(名).
2.(1)频率分布直方图如图D 13 - 1 - 1所示.
图D 13 - 1 - 1
(2)根据(1)中的频率分布直方图,知该家庭使用节水龙头50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.
(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.
该家庭使用了节水龙头后50天日用水量的平均数为x2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.
估计该家庭使用节水龙头后,一年能节省水(0.48 - 0.35)×365=47.45(m3).
3.(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率估计总体可得,这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)产值增长率的平均数y=1100( - 0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
方差s2=1100[( - 0.40)2×2+( - 0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,
标准差s=0.0296=0.02×74≈0.17.
故这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.