- 1.07 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
11.4 统计
挖命题
【考情探究】
考点
内容解读
5年考情
预测热度
考题示例
考向
关联考点
1.随机抽样
1.理解随机抽样的必要性和重要性
2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样方法
2014天津文,9
2012天津,9
2011天津,9
分层抽样
★☆☆
2.统计图表
了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点
2017北京文,17
统计图表的理解与应用
古典概型、分层抽样方法
★★☆
3.用样本估计总体
1.理解样本数据标准差的意义和作用,会计算样本数据标准差
2.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释
3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想
4.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题
2013北京文,16
抽样方法与总体分布的统计
古典概型的概率和方程
★★☆
2011北京,17
茎叶图、平均数、方差、分布列和期望
分析解读 1.掌握简单随机抽样、分层抽样等常用抽样方法,体会两种抽样方法的区别与联系及具体的操作步骤.2.会用样本的频率分布估计总体的分布,会用样本的数字特征估计总体的数字特征.3.样本数字特征及频率分布直方图为高考热点.有关统计内容及方法主要以选择题、填空题的形式呈现,分值约为5分,属容易题;抽样方法和各种统计图表与概率的有关内容相结合也会出现在解答题中,分值约为13分,属中档题.
破考点
【考点集训】
考点一 随机抽样
1.(2014重庆文,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150 C.200 D.250
答案 A
2.(2018课标Ⅲ文改编,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样和分层抽样,则最合适的抽样方法是 .
答案 分层抽样
考点二 统计图表
3.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.93 B.123 C.137 D.167
答案 C
4.(2015重庆,4,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:
0
8
9
1
2
5
8
2
0
0
3
3
8
3
1
2
则这组数据的中位数是( )
A.19 B.20 C.21.5 D.23
答案 B
5.(2015湖北文,14,5分)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a= ;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .
答案 (1)3 (2)6 000
6.(2014广东文,17,13分)某车间20名工人年龄数据如下表:
年龄(岁)
工人数(人)
19
1
28
3
29
3
30
5
31
4
32
3
40
1
合计
20
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
解析 (1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21.
(2)这20名工人年龄的茎叶图如下:
1
2
3
4
9
8 8 8 9 9 9
0 0 0 0 0 1 1 1 1 2 2 2
0
(3)这20名工人年龄的平均数 x=120×(19×1+28×3+29×3+30×5+31×4+32×3+40×1)=30,故方差s2=120×[1×(19-30)2+3×(28-30)2+3×(29-30)2+5×(30-30)2+4×(31-30)2+3×(32-30)2+1×(40-30)2]=120×(121+12+3+0+4+12+100)=12.6.
考点三 用样本估计总体
7.(2018课标Ⅰ文,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
解析 (1)
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.
(3)该家庭未使用节水龙头50天日用水量的平均数为
x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.
该家庭使用了节水龙头后50天日用水量的平均数为
x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).
炼技法
【方法集训】
方法1 频率分布直方图的应用
1.(2014重庆,17,13分)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;
(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.
解析 (1)由(2a+3a+6a+7a+2a)×10=1,解得a=1200=0.005.
(2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2.
成绩落在[60,70)中的学生人数为3×0.005×10×20=3.
(3)记成绩落在[50,60)中的2人为A1,A2,成绩落在[60,70)中的3人为B1,B2,B3,则从成绩在[50,70)的学生中任选2人的基本事件共有10个:
(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),
其中2人的成绩都在[60,70)中的基本事件有3个:
(B1,B2),(B1,B3),(B2,B3),故所求概率为P=310.
2.1995年联合国教科文组织宣布每年的4月23日为世界读书日,主旨宣言为“希望散居在全球各地的人们,都能享受阅读带来的乐趣,都能尊重和感谢为人类文明做出巨大贡献的文学、文化、科学思想的大师们,都能保护知识产权”.为了解大学生课外阅读情况,现从某高校随机抽取100名学生,将他们一年课外阅读量(单位:本)的数据分成7组[20,30),[30,40),……,[80,90),并整理得到频率分布直方图(如图):
(1)估计课外阅读量小于60本的人数;
(2)已知课外阅读量在[20,30),[30,40),[40,50)内的学生人数比为2∶3∶5.为了解学生阅读课外书的情况,现从阅读量在[20,40)内的学生中随机抽取2人进行座谈,求2人分别在不同组的概率;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计100名学生该年课外阅读量的平均数在第几组(只需写出结论).
解析 (1)由题图,计算得课外阅读量小于60本的人数大约为100-100×10×(0.04+0.02+0.02)=20.
(2)由已知条件可知阅读量在[20,50)内的人数为100-100×10×(0.04+0.02+0.02+0.01)=10,
则[20,30)内的人数为2,[30,40)内的人数为3,[40,50)内的人数为5.
设[20,30)内的2人分别为a,b,[30,40)内的3人分别为c,d,e.
设事件A为“2人分别在不同组”.
从[20,40)内的学生中随机选取2人包含(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),共10个基本事件,而事件A包含(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),共6个基本事件.
所以P(A)=610=35.
(3)第五组.
方法2 样本的数字特征及用其估计总体的数字特征
3.某市的一个义务植树点统计了近10年栽种侧柏和银杏的数据(单位:株),制表:
年份
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
侧柏
3 200
3 600
3 300
3 900
3 500
3 300
3 900
3 600
4 100
4 000
银杏
3 400
3 300
3 600
3 600
3 700
4 200
4 400
3 700
4 200
4 200
(1)根据表中数据写出这10年内栽种银杏数量的中位数,并计算这10年栽种银杏数量的平均数;
(2)从统计的数据中,在栽种侧柏与银杏数量之差的绝对值不小于300株的年份中,任意抽取2年,求恰有1年栽种侧柏数量比银杏数量多的概率.
解析 (1)这10年栽种银杏数量从小到大排列为3 300,3 400,3 600,3 600,3 700,3 700,4 200,4 200,4 200,4 400,故中位数为3 700,平均数为3 830.
(2)栽种侧柏与银杏数量之差绝对值不小于300株的年份有
2009,2010,2011,2013,2014,共5年.
从中任意抽取2年有(2 009,2 010),(2 009,2 011),(2 009,2 013),(2 009,2 014),(2 010,2 011),(2 010,2 013),(2 010,2 014),(2 011,2 013),(2 011,2 014),(2 013,2 014),共10种情况.
恰有1年栽种侧柏数量比银杏数量多的有(2 009,2 010),(2 009,2 013),(2 009,2 014),(2 010,2 011),(2 011,2 013),(2 011,2 014),共6种情况.所以所求概率P=610=35.
故恰有1年栽种侧柏数量比银杏数量多的概率为35.
4.某网站从春节期间参与收发网络红包的手机用户中随机抽取10 000名进行调查,将受访用户按年龄分成5组:[10,20),[20,30),……,[50,60],并整理得到如下频率分布直方图:
(1)求a的值;
(2)从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的概率;
(3)估计春节期间参与收发网络红包的手机用户的平均年龄.
解析 (1)根据频率分布直方图可得10×(a+0.005+0.01+0.02+0.03)=1,解得a=0.035.
(2)样本中年龄低于40岁的频率为
10×(0.01+0.035+0.03)=0.75.
所以从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的概率为0.75.
(3)春节期间参与收发网络红包的手机用户的平均年龄估计为15×0.1+25×0.35+35×0.3+45×0.2+55×0.05=32.5岁.
过专题
【五年高考】
A组 自主命题·天津卷题组
1.(2014天津文,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取 名学生.
答案 60
2.(2012天津,9,5分)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取 所学校,中学中抽取 所学校.
答案 18;9
3.(2011天津,9,5分)一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为 .
答案 12
B组 统一命题、省(区、市)卷题组
考点一 随机抽样
1.(2014广东,6,5分)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
图1
图2
A.200,20 B.100,20 C.200,10 D.100,10
答案 A
2.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.
答案 18
3.(2014湖北,11,5分)甲、乙两套设备生产的同类型产品共4 800 件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为 件.
答案 1 800
考点二 统计图表
1.(2018课标Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A
2.(2017课标Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
答案 A
3.(2017山东,8,5分)从分别标有1,2,…,9的9张卡片中不放回地随机抽取2次,每次抽取1张.则抽到的2张卡片上的数奇偶性不同的概率是( )
A.518 B.49 C.59 D.79
答案 C
4.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .
8
9 9
9
0 1 1
答案 90
5.(2014江苏,6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有 株树木的底部周长小于100 cm.
答案 24
6.(2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
解析 (1)由频率分布直方图,可知月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.
(2)由(1),知100位居民月均用水量不低于3吨的频率为 0.06+0.04+0.02=0.12,
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.
思路分析 (1)通过各组频率之和为1,求出a的值.
(2)利用样本的频率来估计总体的数字特征.
评析本题考查了样本数据的数字特征,及利用样本的数字特征估计总体的数字特征,同时考查了学生的运算能力.
考点三 用样本估计总体
1.(2014广东,17,13分)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.
根据上述数据得到样本的频率分布表如下:
分组
频数
频率
[25,30]
3
0.12
(30,35]
5
0.20
(35,40]
8
0.32
(40,45]
n1
f1
(45,50]
n2
f2
(1)确定样本频率分布表中n1,n2, f1和f2的值;
(2)根据上述频率分布表,画出样本频率分布直方图;
(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.
解析 (1)n1=7,n2=2, f1=0.28, f2=0.08.
(2)样本频率分布直方图如图所示.
(3)根据样本频率分布直方图,得每人的日加工零件数落在区间(30,35]的概率为0.2,设所取的4人中,日加工零件数落在区间(30,35]的人数为ξ,则ξ~B(4,0.2),P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.409 6=0.590 4,
所以4人中,至少有1人的日加工零件数落在区间(30,35]的概率为0.590 4.
2.(2014福建,20,12分)根据世行2013年新标准,人均GDP低于1 035美元为低收入国家;人均GDP为1 035~ 4 085美元为中等偏下收入国家;人均GDP为4 085~ 12 616美元为中等偏上收入国家;人均GDP不低于12 616美元为高收入国家.某城市有5个行政区,各区人口占该城市人口比例及人均GDP如下表:
行政区
区人口占城
市人口比例
区人均GDP
(单位:美元)
A
25%
8 000
B
30%
4 000
C
15%
6 000
D
10%
3 000
E
20%
10 000
(1)判断该城市人均GDP是否达到中等偏上收入国家标准;
(2)现从该城市5个行政区中随机抽取2个,求抽到的2个行政区人均GDP都达到中等偏上收入国家标准的概率.
解析 (1)设该城市人口总数为a,则该城市人均GDP为
8 000×0.25a+4 000×0.30a+6 000×0.15a+3 000×0.10a+10 000×0.20aa
=6 400.因为6 400∈[4 085,12 616),
所以该城市人均GDP达到了中等偏上收入国家标准.
(2)“从5个行政区中随机抽取2个”的所有的基本事件是{A,B},{A,C},{A,D},{A,E},{B,C},{B,D},{B,E},{C,D},{C,E},{D,E},共10个.
设事件“抽到的2个行政区人均GDP都达到中等偏上收入国家标准”为M,则事件M包含的基本事件是{A,C},{A,E},{C,E},共3个,所以所求概率为P(M)=310.
3.(2015广东,17,12分)某工厂36名工人的年龄数据如下表.
工人编号
年龄
工人编号
年龄
工人编号
年龄
工人编号
年龄
1
40
10
36
19
27
28
34
2
44
11
31
20
43
29
39
3
40
12
38
21
41
30
43
4
41
13
39
22
37
31
38
5
33
14
43
23
34
32
42
6
40
15
45
24
42
33
53
7
45
16
39
25
37
34
37
8
42
17
38
26
44
35
49
9
43
18
36
27
42
36
39
(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;
(2)计算(1)中样本的均值x和方差s2;
(3)36名工人中年龄在x-s与x+s之间有多少人?所占的百分比是多少(精确到0.01%)?
解析 (1)由系统抽样,将36名工人分为9组(4人一组),每组抽取一名工人.因为在第一分段里抽到的是年龄为44的工人,即编号为2的工人,故所抽样本的年龄数据为44,40,36,43,36,37,44,43,37.
(2)均值x=44+40+36+43+36+37+44+43+379=40;
方差s2=19×[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=1009.
(3)由(2)可知s=103.由题意,年龄在40-103,40+103内的工人共有23人,所占的百分比为2336×100%≈63.89%.
C组 教师专用题组
(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
答案 D
【三年模拟】
一、选择题(每小题5分,共5分)
1.(2017天津耀华中学第二次月考,2)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为600件、400件、300件,用分层抽样方法抽取容量为n的样本,若从丙车间抽取6件,则n的值为( )
A.18 B.20 C.24 D.26
答案 D
二、填空题(每小题5分,共25分)
2.(2017天津南开三模,9)某人5次下班途中所花的时间(单位:分钟)分别为m,n,5,6,4.已知这组数据的平均数为5,方差为2,则|m-n|的值为 .
答案 4
3.(2017天津南开中学5月月考,9)某单位生产甲、乙、丙三种不同型号的产品,三种产品数量之比为3∶4∶5,现用分层抽样的方法抽出一个容量为96的样本,则乙种型号的产品数量为 .
答案 32
4.(2018天津南开模拟,9)某中学为了解学生的数学学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到样本的频率分布直方图(如图),根据频率分布直方图,推测这3 000名学生在该次数学考试中成绩低于60分的学生人数是 .
答案 600
5.(2017天津滨海新区七校联考,10)某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取24人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为 .
答案 4
6.(2017天津南开质量检测,9)某班50名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成五组:第一组[13,14),第二组[14,15),……,第五组[17,18].如图是按上述分组方法得到的频率分布直方图,若成绩大于或等于14秒且小于16秒为良好,则该班在这次百米测试中成绩良好的人数为 .
答案 27
三、解答题(共80分)
7.(2018天津和平质量检测(3),15)某校有8名学生参加歌唱比赛,得分情况如下:6,9,5,9,6,10,7,8.把这8名学生的得分看成一个总体.
(1)求该总体的平均数;
(2)求该总体的方差;
(3)用简单随机抽样方法从这8名学生中抽取2名,他们的得分组成一个样本,求该样本平均数与总体平均数之差的绝对值不超过0.5的概率.
解析 (1)总体平均数为
x=18×(6+9+5+9+6+10+7+8)=7.5.
(2)总体方差
s2=18×[(6-7.5)2+(9-7.5)2+(5-7.5)2+(9-7.5)2+(6-7.5)2+(10-7.5)2+(7-7.5)2+(8-7.5)2]=2.75.
(3)设事件A表示“该样本平均数与总体平均数之差的绝对值不超过0.5”,
从总体5,6,6,7,8,9,9,10中抽取2个个体,全部的可能结果有28种,分别为
(5,6),(5,6),(5,7),(5,8),(5,9),(5,9),(5,10),(6,6),(6,7),(6,8),(6,9),(6,9),(6,10),(6,7),(6,8),(6,9),(6,9),(6,10),(7,8),(7,9),(7,9),(7,10),(8,9),(8,9),(8,10),(9,9),(9,10),(9,10),
其中A包括的基本事件有14个,分别为
(5,9),(5,9),(5,10),(6,8),(6,9),(6,9),(6,10),(6,8),(6,9),(6,9),(6,10),(7,8),(7,9),(7,9),
∴该样本平均数与总体平均数之差的绝对值不超过0.5的概率P(A)=1428=12.
8.(2018天津河北质量检测(1),15)某校有若干学生社团,其中文学社、围棋社、书法社的人数分别为9、18、27.现采用分层抽样的方法从这三个社团中抽取6个人参加活动.
(1)求应从这三个社团中抽取的人数;
(2)将抽取的6个人进行编号,编号分别为A1,A2,A3,A4,A5,A6,现从这6人中抽出2人组成活动小组.
(i)用所给编号列出所有可能结果;
(ii)设M为事件“编号为A1和A2的2人中恰有1人被抽到”,求事件M的概率.
解析 (1)应从“文学社”“围棋社”“书法社”中抽取的人数分别是1,2,3.
(2)(i)从6人中随机抽取2人组成活动小组的所有可能结果为
(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,A6),(A2,A3),(A2,A4),(A2,A5),(A2,A6),(A3,A4),(A3,A5),(A3,A6),(A4,A5),(A4,A6),(A5,A6),共15种.
(ii)事件M包含(A1,A3),(A1,A4),(A1,A5),(A1,A6),(A2,A3),(A2,A4),(A2,A5),(A2,A6),共8个基本事件.
因此,事件M发生的概率P(M)=815.
9.(2018天津南开质量检测(1),15)某教研部门对本地区甲、乙、丙三所学校高一年级进行教学质量抽样调查,甲、乙、丙三所学校高一年级班级数量(单位:个)如下表所示.研究人员用分层抽样的方法从这三所学校中共抽取6个班级进行调查.
学校
甲
乙
丙
数量
4
12
8
(1)求这6个班级中来自甲、乙、丙三所学校的数量;
(2)在这6个班级中随机抽取2个班级做进一步调查.
(i)列举出所有可能的抽取结果;
(ii)求这2个班级来自同一所学校的概率.
解析 (1)因为样本容量与总体的个体数的比是64+12+8=14,
所以样本中甲、乙、丙三所学校的数量分别是
4×14=1,12×14=3,8×14=2.
所以这6个班级来自甲、乙、丙三所学校的数量分别为1,3,2.
(2)设6个班级来自甲、乙、丙三所学校的样本分别为甲;乙1,乙2,乙3;丙1,丙2.
(i)抽取2个班级的所有可能结果为
{甲,乙1},{甲,乙2},{甲,乙3},{甲,丙1},{甲,丙2},{乙1,乙2},{乙1,乙3},{乙1,丙1},{乙1,丙2},{乙2,乙3},{乙2,丙1},{乙2,丙2},{乙3,丙1},{乙3,丙2},{丙1,丙2},共15个.
(ii)每个班级被抽到的机会均等,因此这些基本事件的出现是等可能的.
记事件A为“抽取的这2个班级来自同一所学校”,
则事件A包含的基本事件有
{乙1,乙2},{乙1,乙3},{乙2,乙3},{丙1,丙2},共4个.
所以P(A)=415,即这2个班级来自同一所学校的概率为415.
10.(2018天津和平质量检测(1),16)某校从参加高三区级模拟考试的学生中随机抽取60名,将其数学成绩(均为整数)分成6段[80,90),[90,100),…,[130,140)后得到相应的频率分布直方图如图,根据图中的信息,回答下列问题.
(1)求分数在[100,110)内的人数;
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;
(3)用分层抽样的方法在分数段为[80,100)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[90,100)内的概率.
解析 (1)根据频率分布直方图知,分数在[100,110)内的频率为0.025×10=0.25,
则所求的人数为60×0.25=15.
(2)用同一组数据区间的中点值作为代表,得本次考试的平均分x=85×0.15+95×0.30+105×0.25+115×0.15+125×0.10+135×0.05=104.
(3)用分层抽样的方法在分数段为[80,100)的学生中抽取一个容量为6的样本,
则[80,90)内应抽取6×0.150.15+0.30=2人,记为A、B,
[90,100)内应抽取4人,记为c、d、e、 f,
从这6人中任取2人,基本事件为
AB、Ac、Ad、Ae、Af、Bc、Bd、Be、Bf、cd、ce、cf、de、df、ef,共15种,
至多有1人在分数段[90,100)内的基本事件是AB、Ac、Ad、Ae、Af、Bc、Bd、Be、Bf,共9种,
故所求的概率是P=915=35.
11.(2018天津红桥一模,16)学校计划举办“国家”系列讲座.由于条件限制,按男、女生比例采取分层抽样的方法,从某班选出10人参加活动,在活动前,对所选的10名同学进行了国学素养测试,这10名同学的性别和测试成绩(百分制)的茎叶图如图所示.
(1)分别计算这10名同学中男女生测试的平均成绩;
(2)若这10名同学中男生和女生的国学素养测试成绩的标准差分别是s1,s2,试比较s1与s2的大小(不必计算,只需直接写出结果);
(3)规定成绩大于或等于75分为优良,从这10名同学中随机选取一男一女两名同学,求这两名同学的国学素养测试成绩均为优良的概率.
解析 (1)由茎叶图得男生测试的平均成绩
x1=14×(64+76+77+78)=73.75(分),
女生测试的平均成绩
x2=16×(56+79+76+70+88+87)=76(分).
(2)由茎叶图得s1