- 305.00 KB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
高考必考题突破讲座(六)
统计与概率、随机变量及其分布列
题型特点
考情分析
命题趋势
1.概率问题的核心是概率计算.其中事件的互斥、对立、独立是概率计算的核心,排列组合是进行概率计算的工具.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征,他们是高考考查的核心内容.
2.离散型随机变量的分布列及其期望的考查是历来高考的重点,特别是与统计内容的渗透,背景新颖,充分体现了概率与统计的工具性和交汇性.
2017·全国卷Ⅱ,18
2017·北京卷,17
2017·天津卷,16
2017·江苏卷,23
以统计的图、表为载体,结合概率的应用,考查特征数字和概率的计算,以及独立变量、相关变量间的关系判断.
分值:10~12分
1.常见概率模型的计算
几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.
2.离散型随机变量的分布列、均值与方差
离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,常有解答题的考查,属于中档题.复习中应强化应用类习题的理解与掌握,弄清随机变量的所有取值,它是正确求随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中应强化解答题的规范性训练.
3.概率与统计的综合应用
概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.
4.统计与统计案例
能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.
【例1】 现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏.
(1)求这4个人中恰有2人去参加甲游戏的概率;
(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率;
(3)用X,Y分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X-Y|,求随机变量ξ的分布列.
解析 依题意,这4个人中,每个人去参加甲游戏的概率为,去参加乙游戏的概率为.
设“这4个人恰有i人去参加甲游戏”事件Ai(i=0,1,2,3,4).
则P(Ai)=Ci4-i.
(1)这4个人中恰有2人参加甲游戏的概率
P(A2)=C22=.
(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B,则B=A3+A4且A3与A4互斥.
故P(B)=P(A3+A4)=P(A3)+P(A4)=C3×+C4=.
(3)依题设,ξ的所有可能取值为0,2,4.
且A1与A3互斥,A0与A4互斥.
则P(ξ=0)=P(A2)=,
P(ξ=2)=P(A1+A3)=P(A1)+P(A3)
=C1·3+C3×=,
P(ξ=4)=P(A0+A4)=P(A0)+P(A4)
=C4+C4=.
于是ξ的分布列是
ξ
0
2
4
P
【例2】 (2017·北京卷)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x和y的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.
(1)从服药的50名患者中随机选出一人,求此人指标y的值小于60的概率;
(2)从图中A,B,C,D四人中随机选出两人,记ξ为选出的两人中指标x的值大于1.7的人数,求ξ的分布列和数学期望E(ξ);
(3)试判断这100名患者中服药者指标y数据的方差与未服药者指标y数据的方差的大小(只需写出结论).
解析 (1)由图知,在服药的50名患者中,指标y的值小于60的有15人.
所以从服药的50名患者中随机选出一人,此人指标y的值小于60的概率为=0.3.
(2)由图知,A,B,C,D四人中,指标x的值大于1.7的有2人:A和C.
所以ξ的所有可能取值为0,1,2.
P(ξ=0)==,P(ξ=1)==,P(ξ=2)==.
所以ξ的分布列为
ξ
0
1
2
P
故ξ的期望E(ξ)=0×+1×+2×=1.
(3)在这100名患者中,服药者指标y数据的方差大于未服药者指标y数据方差.
【例3】 (2018·湖南长沙一模)2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示.
(1)分别求出成绩在第3,4,5组的人数;
(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽出6人进行面试.
①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率,②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望.
解析 (1)由频率分布直方图知:
第3组的人数为5×0.06×40=12;
第4组的人数为5×0.04×40=8;
第5组的人数为5×0.02×40=4.
(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人.
①设“甲或乙进入第二轮面试”为事件A,则
P(A)=1-=,
所以甲或乙进入第二轮面试的概率为.
②X的所有可能取值为0,1,2,
P(X=0)==,P(X=1)==,P(X=2)==.
所以X的分布列为
X
0
1
2
P
E(X)=0×+1×+2×==.
【例4】 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.
附注:
参考数据:i=9.32,iyi=40.17,=0.55,=2.646.
参考公式:相关系数r=,
回归方程=+t中斜率和截距的最小二乘法估计公式分别为
=,=-.
解析 (1)由折线图中数据和附注中参考数据得
=4,(ti-)2=28,=0.55,
(ti-)(yi-)=iyi-i=40.17-4×9.32=2.89,
r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1)得==≈0.103,=-=1.331-0.103×4≈0.92.
所以y关于t的回归方程为=0.92+0.10t.
将2019年对应的t=9代入回归方程得=0.92+0.10×9=1.82.
所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨.
1.(2018·河北沧州一模)甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为,乙获胜的概率为,各局比赛结果相互独立.
(1)求甲在4局以内(含4局)赢得比赛的概率;
(2)记X为比赛决出胜负时的总局数,求X的分布列和数学期望.
解析 用A表示“甲在4局以内(含4局)赢得比赛”,Ak表示“第k局甲获胜”,Bk表示“第k局乙获胜”,则P(Ak)=,
P(Bk)=,k=1,2,3,4,5.
(1)P(A)=P(A1A2)+P(B1A2A3)+P(A1B2A3A4)
=P(A1)P(A2)+P(B1)P(A2)P(A3)+P(A1)P(B2)P(A3)P(A4)
=2+×2+××2=.
(2)X的可能取值为2,3,4,5.
P(X=2)=P(A1A2)+P(B1B2)
=P(A1)P(A2)+P(B1)P(B2)=,
P(X=3)=P(B1A2A3)+P(A1B2B3)
=P(B1)P(A2)P(A3)+P(A1)P(B2)P(B3)=,
P(X=4)=P(A1B2A3A4)+P(B1A2B3B4)
=P(A1)P(B2)P(A3)P(A4)+P(B1)P(A2)P(B3)P(B4)=,
P(X=5)=1-P(X=2)-P(X=3)-P(X=4)=.
故X的分布列为
X
2
3
4
5
P
E(X)=2×+3×+4×+5×=.
2.(2018·广东广州质检)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程=x+;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程=x+中,=,=-,
其中,为样本平均值.
解析 (1)由题意知n=10,=i==8,
=i==2,lxx=-n2=80,
又lxy=iyi-n =184-10×8×2=24,
由此得===0.3,
=-=2-0.3×8=-0.4,
故所求线性回归方程为=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).
3.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下.
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;
(2)填写下面的列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
K2=.
解析 (1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.
由题意知P(A)=P(BC)=P(B)P(C).
旧养殖法的箱产量低于50 kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估计值为0.62.
新养殖法的箱产量不低于50 kg的频率为
(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估计值为0.66.
因此事件A的概率估计值为0.62×0.66=0.409 2.
(2)根据箱产量的频率分布直方图得列联表.
箱产量<50 kg
箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
K2=≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,
箱产量低于55 kg的直方图面积为
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新养殖法箱产量的中位数的估计值为
50+≈52.35(kg).
4.(2018·湖北襄阳五中适应性考试)某商场计划销售某种产品,现邀请生产该产品的甲、乙两个厂家进场试销10天.两个厂家提供的返利方案如下:甲厂家每天固定返利70元,且每卖出一件产品厂家再返利2元;乙厂家无固定返利,卖出40件以内(含40件)的产品,每件产品厂家返利4元,超出40件的部分每件返利6元.经统计,两个厂家的试销情况茎叶图如下.
(1)现从甲厂家试销的10天中抽取两天,求这两天的销售量都大于40的概率;
(2)若将频率视作概率,回答以下问题:
①记乙厂家的日返利额为X(单位:元),求X的分布列和数学期望;
②商场拟在甲、乙两个厂家中选择一家长期销售,如果仅从日返利额的角度考虑,请利用所学的统计学知识为商场作出选择,并说明理由.
解析 (1)记“抽取的两天销售量都大于40”为事件A,
则P(A)==.
(2)①设乙产品的日销售量为a,
则当a=38时,X=38×4=152;当a=39时,X=39×4=156;
当a=40时,X=40×4=160;
当a=41时,X=40×4+1×6=166;
当a=42时,X=40×4+2×6=172;
∴X的所有可能取值为152,156,160,166,172,
∴X的分布列为
X
152
156
160
166
172
P
∴E(X)=152×+156×+160×+166×+172×=162.
②依题意,甲厂家的日平均销售量为
38×0.2+39×0.4+40×0.2+41×0.1+42×0.1=39.5,
∴甲厂家的日平均返利额为70+39.5×2=149元,
由①得乙厂家的日平均返利额为162元(>149元),
∴推荐该商场选择乙厂家长期销售.
课时达标 讲座(六)
[解密考纲]概率与统计是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查学生的应用意识及阅读理解能力、数据分析能力.概率问题的核心是概率计算,其中事件的互斥、对立、独立和随机变量的分布是概率计算的核心.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征.统计与概率内容相互渗透,背景新颖.
1.(2018·海南模拟)已知某班n名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a,b,c成等差数列,且成绩在[90,100]内的有6人.
(1)求n的值;
(2)若成绩在[40,50)内的人数是成绩在[50,60)内的人数的,规定60分以下为不及格,从不及格的人中任意选取3人,求成绩在50分以下的人数X的分布列和数学期望.
解析 (1)依题意得
⇒b=0.01,
因为成绩在[90,100]内的有6人,所以n==60.
(2)由⇒
于是成绩在[40,50)及[50,60)内的人数分别为3和9,即不及格的人数为12,从中任选3人,则成绩在50分以下的人数X的所有可能取值为0,1,2,3,
且P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
所以X的分布列如下
X
0
1
2
3
P
故X的数学期望为E(X)=0×+1×+2×+3×=.
2.(2018·广东五校联考)下图是某市11月1日至14日的空气质量指数趋势图,空气质量指数(AQI)小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择11月1日至11月12日中的某一天到达该市,并停留3天.
(1)求此人到达当日空气重度污染的概率;
(2)设ξ是此人停留期间空气重度污染的天数,求ξ的分布列与数学期望.
解析 设Ai表示事件“此人于11月i日到达该市”(i=1,2,…,12).
依题意知,P(Ai)=,且Ai∩Aj=∅(i≠j).
(1)设B为事件“此人到达当日空气重度污染”,则B=A1∪A2∪A3∪A7∪A12,
所以P(B)=P(A1∪A2∪A3∪A7∪A12)=P(A1)+P(A2)+P(A3)+P(A7)+P(A12)=,
即此人到达当日空气重度污染的概率为.
(2)由题意可知,ξ的所有可能取值为0,1,2,3,
P(ξ=0)=P(A4∪A8∪A9)=P(A4)+P(A8)+P(A9)==,
P(ξ=2)=P(A2∪A11)=P(A2)+P(A11)==,
P(ξ=3)=P(A1∪A12)=P(A1)+P(A12)==,
P(ξ=1)=1-P(ξ=0)-P(ξ=2)-P(ξ=3)
=1---=,
所以ξ的分布列为
ξ
0
1
2
3
P
故ξ的数学期望E(ξ)=0×+1×+2×+3×=.
3.(2018·河南焦作模拟)某单位共10名员工,他们某年的收入如下表.
员工编号
1
2
3
4
5
6
7
8
9
10
年薪/万元
3
3.5
4
5
5.5
6.5
7
7.5
8
50
(1)求该单位员工当年年薪的平均值和中位数;
(2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望;
(3)已知员工年薪收入与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元,4.2万元,5.6万元,7.2万元,预测该员工第五年的年薪为多少?
附:线性回归方程=x+中系数计算公式
=,=-,其中,表示样本均值.
解析 (1)平均值为10万元,中位数为6万元.
(2)年薪高于5万的有6人,低于或等于5万的有4人,ξ取值为0,1,2.
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,
所以ξ的分布列为
ξ
0
1
2
P
数学期望为E(ξ)=0×+1×+2×=.
(3)设xi,yi(i=1,2,3,4)分别表示工作年限及相应年薪,
则=2.5,=5,(xi-)2=2.25+0.25+0.25+2.25=5,
(xi-)(yi-)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,
===1.4,
=-=5-1.4×2.5=1.5,
因此线性回归方程为y=1.4x+1.5,
可预测该员工第5年的年薪收入为8.5万元.
4.(2017·天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,
且在各路口遇到红灯的概率分别为,,.
(1)记X表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X的分布列和数学期望;
(2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率.
解析 (1)随机变量X的所有可能取值为0,1,2,3.
P(X=0)=××=,
P(X=1)=××+××+××=,
P(X=2)=××+××+××=,
P(X=3)=××=.
所以随机变量X的分布列为
X
0
1
2
3
P
∴E(X)=0×+1×+2×+3×=.
(2)设Y表示第一辆车遇到红灯的个数,Z表示第二辆车遇到红灯的个数,则所求事件的概率为
P(Y+Z=1)=P(Y=0,Z=1)+P(Y=1,Z=0)
=P(Y=0)P(Z=1)+P(Y=1)P(Z=0)
=×+×=.
所以这2辆车共遇到了1个红灯的概率为.
5.(2018·河南洛阳统考)某教师为了了解本校高三学生一模考试的数学成绩情况,将所教两个班级的数学成绩(单位:分)绘制成如图所示的茎叶图.
(1)分别求出甲、乙两个班级数学成绩的中位数、众数;
(2)若规定成绩大于或等于115分为优秀,分别求出两个班级数学成绩的优秀率;
(3)在(2)的条件下,若用甲班学生数学成绩的频率估计概率,从该校高三年级中随机抽取3人,记这3人中数学成绩优秀的人数为X,求X的分布列和数学期望.
解析 (1)由所给的茎叶图知,甲班50名同学的成绩由小到大排序,排在第25,26位的是108,109,数量最多的是103,故甲班数学成绩的中位数是108.5,众数是103;
乙班48名同学的成绩由小到大排序,排在第24,25位的是106,107,数量最多的是92和101,故乙班数学成绩的中位数是106.5,众数为92或101.
(2)由茎叶图中的数据可知,甲班中数学成绩为优秀的人数为20,优秀率为=;乙班中数学成绩为优秀的人数为18,优秀率为=.
(3)用甲班学生数学成绩的频率估计概率,则高三学生数学成绩的优秀率P=,则X的所有可能取值为0,1,2,3,
且X~B,
P(X=0)=C3=;
P(X=1)=C××2=;
P(X=2)=C×2×=;
P(X=3)=C×3=;
X的分布列为
X
0
1
2
3
P
E(X)=0×+1×+2×+3×=或E(X)=3×=.
6.(2018·河北保定模拟)某市拟实行机动车尾号限行交替措施,为了解民众对“车辆限行”的态度,随机调查了50人,并将调查结果制成下表.
年龄/岁
[15,25)
[25,35)
[35,45)
[45,55)
[55,65)
[65,75)
频数
5
10
15
10
5
5
赞成人数
4
6
9
6
3
4
(1)若从年龄在[15,25),[25,35)的被调查者中各随机选取2人进行跟踪调查,选中的4人中不赞成“车辆限行”的人数记为X,求X的分布列和期望;
(2)把年龄在[15,45)称为中青年,年龄在[45,75)称为中老年,请根据上表完成2×2列联表,并说明民众对“车辆限行”的态度与年龄是否有关联.
态度
年龄
赞成
不赞成
总计
中青年
中老年
总计
参考公式和数据χ2=
χ2
≤2.706
>2.706
>3.841
>6.635
A,B关联性
无关联
90%
95%
99%
解析 (1)X的取值为0,1,2,3,则
P(X=0)=·==,
P(X=1)=·+·==,
P(X=2)=·+·==,
P(X=3)=·==,
X的分布列为
X
0
1
2
3
P
E(X)=0×+1×+2×+3×=1.2.
(2)2×2列联表如图所示.
态度
年龄
赞成
不赞成
总计
中青年
19
11
30
中老年
7
13
20
总计
32
18
50
χ2=≤2.706,
说明民众对“车辆限行”的态度与年龄没有关联.