- 1.12 MB
- 2021-06-24 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
专题12 概率与统计
1.【2019年高考全国Ⅲ卷理数】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为
A.0.5 B.0.6 C.0.7 D.0.8
【答案】C
【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C.
【名师点睛】本题考查抽样数据的统计,渗透了数据处理和数学运算素养.采取去重法,利用转化与化归思想解题.
2.(2018全国卷Ⅲ)某群体中的每位成员使用移动支付的概率都为,各成员的支付方式相互独立,设为该群体的10位成员中使用移动支付的人数,,,则=
A.0.7 B.0.6 C.0.4 D.0.3
【答案】B
【解析】由题意知该群体的10位成员使用移动支付的概率分布符合二项分布,,
所以或.由,得,即,
所以,所以。
3.【2019年高考全国Ⅱ卷理数】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
A.中位数 B.平均数 C.方差 D.极差
【答案】A
【解析】设9位评委评分按从小到大排列为.则①原始中位数为
,去掉最低分,最高分后剩余,中位数仍为,A正确;②原始平均数,后来平均数,平均数受极端值影响较大,与不一定相同,B不正确;③,
,由②易知,C不正确;④原极差,后来极差,显然极差变小,D不正确.故选A.
4、(2018全国卷Ⅰ)如图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形的斜边,直角边,.的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为,,,
A. B. C. D.
【答案】A
【解析】通解 设直角三角形的内角,,所对的边分别为,,,则区域I的面积即
的面积,为,区域Ⅱ的面积
,所以,由几何概型的知识知,故选A.
优解 不妨设为等腰直角三角形,,则,所以区域I的面积即的面积,为,区域Ⅱ的面积,区域Ⅲ的面积.根据几何概型的概率计算公式,得,,所以,,.
5、【2019年高考江苏卷】已知一组数据6,7,8,8,9,10,则该组数据的方差是______________.
【答案】
【解析】由题意,该组数据的平均数为,
所以该组数据的方差是.
6.【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【答案】(1)a=0.35,b=0.10;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.
【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1–0.05–0.15–0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
7、【2019年高考全国Ⅰ卷理数】为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,表示“甲药的累计得分为时,最终认为甲药比乙药更有效”的概率,则,,,其中,,.假设,.
(i)证明:为等比数列;
(ii)求,并根据的值解释这种试验方案的合理性.
【答案】(1)分布列见解析;(2)(i)证明见解析,(ii) ,解释见解析.
【解析】X的所有可能取值为,,
,,所以的分布列为:
(2)(i)由(1)得.因此,
故,即.又因为,
所以为公比为4,首项为的等比数列.
(ii)由(i)可得
.由于,故,所以.
表示最终认为甲药更有效的概率,由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,
认为甲药更有效的概率为,此时得出错误结论的概率非常小,说明这种试验方案合理.
一、 考向分析:
概率与统计
统计
概率
随机抽
样方法
用样本估
计总体
古典概型
几何概型
随机变量分布列及其均值与方差
正态分布
及其应用
样本的数
字特征
频率分
布直方
及图茎叶图
回归分析
独立性检验
超几何
分布
条件概率
二项分布
二
考查内容
解 题 技 巧
随机
抽样
1.随机数法编号要求:应保证各号数的位数相同,而抽签法则无限制。
2.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的。
3.系统抽样是等距抽样,入样个体的编号相差的整数倍。
4.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比。
用样本估
计总体
1.绘制频率分布直方图时的2个注意点
(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确。
(2)频率分布直方图的纵坐标是,而不是频率。
2.由频率分布直方图进行相关计算时,需掌握的2个关系式
(1)×组距=频率。
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数。
3.茎叶图的优缺点
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似。它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示。其缺点是当样本容量较大时,作图较烦琐。
4、用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似。实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差),分析稳定情况。
5.若给出图形,一方面可以由图形得到相应的样本数据,计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性比较方差(标准差)的大小。
回归分析
独立性检验
1、相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性,若呈图形区域且分布较乱则不具有相关性。
两个具有相关关系的变量之间,可以从散点图直观看出是否具有较好的线性相关关系,相关系数的绝对值越接近1,其线性相关关系越强。
2.回归直线方程=x+必经过样本点中心(,)。
3.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测。
4、解决独立性检验问题的3步骤
(1)根据样本数据制成2×2列联表。
(2)根据公式K2=,计算K2的值。
(3)查表比较K2与临界值的大小关系,作统计判断。
提醒:应用独立性检验方法解决问题,易出现不能准确计算K2值的错误。
几何概型
古典概型
1.“几何概型”与“古典概型”两者共同点是基本事件的发生是等可能的,不同之处是几何概型的基本事件的个数是无限的,古典概型中基本事件的个数是有限的。
2、不放回的试验中,抽取几次可以看成一次性抽取几个。如在n个球中,不放回地随机抽取m个球,可以看成一次性抽取m个球,则共有C种取法。
3、几何概型一般就是直线上的、平面上的和空间中的,直线上的几何概型的概率表现为线段的长度之比,平面上的就是区域面积的比,空间中的就是体积之比等。解答几何概型试题要善于根据这些特点寻找基本事件所在线、面、体,寻找随机事件所在的线、面、体,把几何概型的计算转化为相应的长度、面积或体积的比值的计算。正确确定基本事件占有的空间位置和随机事件在这个位置中的情况,然后计算相关的量,再根据几何概型的公式计算概率。
1.分布列性质的两个作用
(1)利用分布列中各事件概率之和为1可求参数的值。
(2)随机变量ξ所取的值分别对应的事件是两两互斥的,利用这一点可求相关事件的概率。
2、求随机变量的分布列的三个步骤
随机变
量分布
列及其
均值与
方差
找:理解并确定ξ=xi的意义,找出随机变量ξ的所有可能的取值xi(i=1,2,…,n)。
求:借助概率的有关知识求出随机变量ξ取每一个值的概率P(ξ=xi)=pi(i=1,2,…,n)。注意应用计数原理、古典概型等知识。
列:列出表格并检验所求的概率是否满足分布列的两条性质。
3.超几何分布的两个特点
(1)超几何分布是不放回抽样问题。 (2)随机变量为抽到的某类个体的个数。
4.超几何分布的应用条件及实质
(1)条件:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考察某类个体个数ξ的概率分布。
(2)实质:古典概型问题。
5、条件概率的求法
(1)定义法:先求P(A)和P(AB),再由 P(B|A)=求P(B|A)。
(2)基本事件法:借助古典概型概率公式,先求事件A包含的基本事件数n(A),再求事件AB所包含的基本事件数n(AB),得 P(B|A)=。
1.相互独立事件与互斥事件的区别
相互独立事件是指两个事件发生的概率互不影响,计算式为P(AB)=P(A)P(B),互斥事件是指在同一试验中,两个事件不会同时发生,计算公式为P(A∪B)=P(A)+P(B)。
2.求相互独立事件同时发生的概率的主要方法
(1)利用相互独立事件的概率乘法公式直接求解,P(A·B)=P(A)·P(B)只有在事件A,B相互独立时,公式才成立,此时P(B)=P(B|A)。
(2)正面计算较繁(如求用“至少”表述的事件的概率)或难以入手时,可从其对立事件入手计算。
3、利用独立重复试验概率公式可以简化求概率的过程,但需要注意检查该概率模型是否满足公式P(X=k)=Cpk(1-p)n-k的三个条件:(1)在一次试验中某事件A发生的概率是一个常数p;(2)n次试验不仅是在完全相同的情况下进行的重复试验,而且各次试验的结果是相互独立的;(3)该公式表示n次试验中事件A恰好发生了k次的概率。
4、解决正态分布问题有三个关键点:①对称轴x=μ;②标准差σ;③分布区间。利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ
特殊区间,从而求出所求概率。
5、超几何分布的抽取是不放回抽取,各次抽取不独立,二项分布的抽取是独立的,各次抽取相互独立。当超几何分布所对应的总体数量很大时可以近似地看作二项分布。
6、求离散型随机变量ξ的均值与方差的步骤
(1)理解ξ的意义,写出ξ可能的全部值。(2)求ξ取每个值的概率。
(3)写出ξ的分布列。 (4)由均值的定义求E(ξ)。
(5)由方差的定义求D(ξ)。
7.判断一个随机变量是否服从二项分布,关键有二:其一是独立性,即一次试验中,事件发生与不发生二者必居其一;其二是重复性,即试验是独立重复地进行了n次。
8、二项分布的期望与方差
(1)如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量。
(2)有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同样还可求出D(aξ+b)。
二、考向讲解
考查频率分布直方图、茎叶图:
【例】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查。通过抽样,获得了某年100位居民每人的月均用水量(单位:吨)。将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图。
(1)求直方图中a的值。
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由。
(3)估计居民月均用水量的中位数。
【解析】(1)由频率分布直方图可知,月均用水量在[0,0.5)内的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.21,0.25,0.06,0.04,0.02。由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=2a×0.5,解得a=0.30。
(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12。由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000。
(3)设中位数为x吨。因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5。由0.50×(x-2)=0.5-0.48,解得x=2.04,故可估计居民月均用水量的中位数为2.04吨。
【例】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)。若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5 B.5,5
C.3,7 D.5,7
【答案】A
【解析】根据两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以=,解得x=3。故选A。
考查样本数据特征:
【例】气象意义上从春季进入夏季的标志为“连续5天的日平均温度均不低于22 ℃”。现有甲、乙、丙三地连续5天的日平均温度的记录数据(数据都是正整数,单位:℃):
①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,均值为24;
③丙地:5个数据中有一个是32,均值为26,方差为10.8。则满足进入夏季标志的地区有( )
A.0个 B.1个 C.2个 D.3个
【答案】C
【解析】 ①甲地:5个数据的中位数为24,众数为22,根据数据特征得,甲地连续5天的日平均温度的记录数据可能为22,22,24,25,26,其连续5天的日平均温度均不低于22 ℃;②乙地:5个数据的中位数为27,均值为24,当5个数据为19,20,27,27,27时,其连续5天的日平均温度有低于22 ℃的,故不确定;③
丙地:5个数据中有一个是32,均值为26,若有低于22,则取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22 ℃。故满足进入夏季标志的地区有甲、丙两地。故选C。
【例】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图所示:
(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50 kg, 新养殖法的箱产量不低于50 kg”,估计A的概率。
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关。
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)。
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
K2=
【解析】(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”,
由题意知P(A)=P(BC)=P(B)P(C),旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62。故P(B)的估计值为0.62。新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66。故P(C)的估计值为0.66。因此,事件A的概率估计值为0.62×0.66=0.409 2。
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg
箱产量≥50 kg
总计
旧养殖法
62
38
100
新养殖法
34
66
100
总计
96
104
200
K2=≈15.705,由于15.705>6.635,
故有99%的把握认为箱产量与养殖方法有关。
(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5。故新养殖法箱产量的中位数的估计值为50+≈52.35(kg)。
考查古典概型、几何概型:
【例】我国古代有着辉煌的数学研究成果。《周髀算经》、《九章算术》、《海岛算经》、《孙子算经》……《缉古算经》等10部专著,有着丰富多彩的内容,是了解我国古代数学的重要文献。这10部专著中有7部产生于魏晋南北朝时期。某中学拟从这10部名著中选择2部作为“数学文化”校本课程学习内容,则所选的2部名著中至少有1部是魏晋南北朝时期的名著的概率为( )
A. B.
C. D.
【答案】A
【解析】法一:从10部名著中选择2部名著的方法数为C=45,所选的2部都为魏晋南北朝时期的名著的方法数为C=21,只有1部为魏晋南北朝时期的名著的方法数为C×C=21,于是事件“所选的2部名著中至少有1部是魏晋南北朝时期的名著”的概率P==。故选A。
法二:从10部名著中选择2部名著的方法数为C=45,所选的2部都不是魏晋南北朝时期的名著的方法数为C=3,由对立事件的概率计算公式得P=1-=。故选A。
【例】由不等式确定的平面区域记为,不等式,确定的平面区域记为,在中随机取一点,则该点恰好在内的概率为( )
A. B. C. D.
【答案】D
【解析】由题意作图,如图所示,的面积为,图中阴影部分的面积为,则所求的概率,选D.
【例】在棱长为2的正方体ABCD-A1B1C1D1中,点O为底面ABCD的中心,在正方体ABCD-A1B1C1D1内随机取一点P,则点P到点O的距离大于1的概率为_____________。
【答案】1-
【解析】如图,与点O距离等于1的点的轨迹是一个半球面,其体积V1=×π×13=。事件“点P与点O距离大于1的概率”对应的区域体积为23-,根据几何概型概率公式得,点P与点O距离大于1的概率P==1-。
【例】在区间[0,2]上随机地取一个数x,则事件“-1≤log≤1”发生的概率为( )
A. B.
C. D.
【答案】A
【解析】由-1≤log≤1,得log2≤log≤log,所以≤x+≤2,所以0≤x≤。由几何概型可知,事件发生的概率为
=。故选A。
【例】某市中学生田径运动会总分获得冠、亚、季军的代表队人数情况如下表,大会组委会为使颁奖仪式有序进行,气氛活跃,在颁奖过程中穿插抽奖活动。并用分层抽样的方法从三个代表队中共抽取16人在前排就坐,其中亚军队有5人。
名次
性别
冠军队
亚军队
季军队
男生
30
30
女生
30
20
30
(1)求季军队的男运动员人数。
(2)从前排就坐的亚军队5人(3男2女)中随机抽取2人上台领奖,请求出有女生上台领奖的概率。
(3)抽奖活动中,运动员通过操作按键,使电脑自动产生[0,4]内的两个均匀随机数x,y,随后电脑自动运行如图所示的程序框图的相应程序。若电脑显示“中奖”,则运动员获相应奖品;若电脑显示“谢谢”,则不中奖。求运动员获得奖品的概率。
【解析】(1)设代表队共有n人,则=,所以n=160,
则季军队的男运动员人数为160-(30+30+30+20+30)=20。
(2)设男生为a1,a2,a3,女生为b1,b2,随机抽取2人,包括的基本事件个数为C=10,有女生上台领奖的基本事件为C-C=10-3=7,所以P(A)=,有女生上台领奖的概率为。
(3)试验的全部结果所构成的区域为Ω={(x,y)|0≤x≤4,0≤y≤4},面积为SΩ=4×4=16,
事件A表示运动员获得奖品,所构成的区域为A={(x,y)|4x-y-8≤0,0≤x≤4,0≤y≤4},
面积为SA=(2+3)×4=10,这是一个几何概型,所以P(A)==。即运动员获得奖品的概率为。
考查相互独立事件:
【例】某学校举行知识竞赛,第一轮选拔共设有1,2,3三个问题,每位参赛者按问题1,2,3的顺序作答,竞赛规则如下:
①每位参赛者计分器的初始分均为10分,答对问题1,2,3分别加1分,2分,3分,答错任一题减2分;
②每回答一题,积分器显示累计分数,当累计分数小于8分时,答题结束,淘汰出局;当累计分数大于或等于12分时,答题结束,进入下一轮;当答完三题,累计分数仍不足12分时,答题结束,淘汰出局.
已知甲同学回答1,2,3三个问题正确的概率依次为,,,且各题回答正确与否相互之间没有影响.
(1)求甲同学能进入下一轮的概率;
(2)用X表示甲同学本轮答题结束时的累计分数,求X的分布列.
【解析】(1)设事件A表示“甲同学问题1回答正确”,事件B表示“甲同学问题2回答正确”,事件C表示“甲同学问题3回答正确”,依题意P(A)=,P(B)=,P(C)=.记“甲同学能进入下一轮”为事件D,则P(D)=P(AC+AB+BC)=P(AC)+P(AB)+P(BC)
=P(A)P()P(C)+P(A)P(B)+P()P(B)P(C)=××+×+××=.
(2)X可能的取值是6,7,8,12,13.
P(X=6)=P()=×=, P(X=7)=P(A)=××=,
P(X=8)=P(B)=××=, P(X=12)=P(AC)=××=,
P(X=13)=P(AB+BC)=P(AB)+P(BC)=×+××=.
∴X的分布列为
X
6
7
8
12
13
P
考查离散型随机变量分布列:
【例】已知随机变量满足,,=1,2.若,则
A.<,< B.<,>
C.>,< D.>,>
【答案】A
【解析】由题意可得
0
1
0
1
由两点分布,;,,
∵
∵,∴,,∴<,<,选A.
【例】某市两所中学的学生组队参加辩论赛,中学推荐了3名男生,2名女生,中学推荐了3名男生,4名女生,两校推荐的学生一起参加集训,由于集训后队员的水平相当,从参加集训的男生中随机抽取3人,女生中随机抽取3人组成代表队.
(1)求中学至少有1名学生入选代表队的概率;
(2)某场比赛前,从代表队的6名队员中随机抽取4人参赛,设表示参赛的男生人数,求得分布列和数学期望.
【解析】(1)由题意,参加集训的男、女生各有6名,参赛学生全从中抽取(等价于 中学没有学生入选代表队)的概率为.因此,中学至少1名学生入选的概率为.
(2)根据题意,的可能取值为1,2,3.
,,,
所以的分布列为:
1
2
3
因此,的期望为,.
【例】一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示:
将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.
(Ⅰ)求在未来连续3天里,有连续2天的日销售量都不低于100个且另一天的日销售量低于50个的概率;
(Ⅱ)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列,期望及方差.
【解析】(Ⅰ)用表示日销量,则
代表连续2日销量不低于100且一日销量低于50,
则,故所求时间的概率为.
(Ⅱ)可取0,1,2,3.由(Ⅰ)可知日销量不低于100的概率.
∴,,,
的分布列如下
X
0
1
2
3
P
0.064
0.288
0.432
0.216
∴,.
考查正态分布:
【例】设,,这两个正态分布密度曲线如图所示.下列结论中正确的是
A. B.
C.对任意正数, D.对任意正数,
【答案】C
【解析】由正态分布密度曲线的性质可知,,的密度曲线分别关于直线,对称,因此结合题中所给图象可得,,所以,故错误.又得密度曲线较的密度曲线“瘦高”,所以,所以,B错误.对任意正数,,,C正确,D错误.
【例】已知随机变量服从正态分布,且,则
A. B. C. D.
【答案】C
【解析】如图,正态分布的密度函数示意图所示函数关于直线对称,所以,并且则,所以选C.
【例】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布.
(1)假设生产状态正常,记表示一天内抽取的16个零件中其尺寸在之外的零件数,求及的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,
,其中为抽取的第个零件的尺寸,=1,2,…,16.
用样本平均数作为的估计值,用样本标准差作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除之外的数据,用剩下的数据估计和 (精确到0.01).
附:若随机变量服从正态分布,则=0.997 4,,.
【解析】(1)抽取的一个零件的尺寸在之内的概率为0.9974,从而零件的尺寸在
之外的概率为0.0026,故.因此
.的数学期望为.
(2)(i)如果生产状态正常,一个零件尺寸在之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
(ii)由,,得的估计值为,的估计值为
,由样本数据可以看出有一个零件的尺寸在之外,因此需对当天的生产过程进行检查.剔除之外的数据9.22,剩下数据的平均数为
,因此的估计值为10.02.
,剔除之外的数据9.22,剩下数据的样本方差为,因此的估计值为.
考查条件概率:
【例】把一枚硬币连续抛两次,记“第一次出现正面”为事件A,“第二次出现反面”为事件B,则P(B|A)等于( )
A. B.
C. D.
【答案】A
【解析】由古典概型知P(A)=,P(AB)=,则由条件概率知P(B|A)===.
【例】如图,EFGH是以O为圆心,半径为1的圆的内接正方形.将一颗豆子随机地扔到该圆内,用A表示事件“豆子落在正方形EFGH内”,B表示事件“豆子落在扇形OHE(阴影部分)内”,则P(B|A)=________.
【答案】
【解析】由题意可得,事件A发生的概率P(A)===.
事件AB表示“豆子落在△EOH内”,则P(AB)===.
故P(B|A)===.
超几何分布与二项分布
二项分布与超几何分布的辨别方法
超几何分布的抽取是不放回抽取,各次抽取不独立,二项分布的抽取是独立的,各次抽取相互独立。当超几何分布所对应的总体数量很大时可以近似地看作二项分布。
【例】写出下列离散型随机变量的分布列,并指出其中服从二项分布的是哪些?服从超几何分布的是哪些?
(1)X1表示n次重复抛掷1枚骰子出现点数是3的倍数的次数。
(2)X2表示连续抛掷2枚骰子,所得的2个骰子的点数之和。
(3)有一批产品共有N件,其中次品有M件(N>M>0),采用有放回抽取方法抽取n次(n>N),抽出的次品件数为X3。
(4)有一批产品共有N件,其中M件为次品,采用不放回抽取方法抽n件,出现次品的件数为X4(N-M>n>0)。
【解】 (1)X1的分布列为
X1
0
1
2
…
n
P
C0n
C1n-1
C2n-2
…
Cn
X1服从二项分布,即X1~B。
(2)X2的分布列为
X2
2
3
4
5
6
7
8
9
10
11
12
P
(3)X3的分布列为
X3
0
1
2
…
n
P
n
C·n-1
C2·n-2
…
n
X3服从二项分布,即X3~B。
(4)X4的分布列为
X4
0
1
…
k
…
n
P
…
…
X4服从超几何分布。
【例】从某批产品中,有放回地抽取产品两次,每次随机抽取1件。假设事件A:“取出的2件产品中至多有1件是二等品”,其概率P(A)=0.96。
(1)求从该批产品中任取1件是二等品的概率p。
(2)若该批产品共100件,从中无放回地抽取2件,ξ表示取出的2件产品中二等品的件数,求ξ的分布列。
【解析】(1)记A0表示事件“取出的2件产品中无二等品”,A1表示事件“取出的2件产品中恰有1件二等品”,则A0,A1互斥,且A=A0∪A1,故P(A)=P(A0∪A1)=P(A0)+P(A1)=(1-p)2+Cp(1-p)=1-p2,即0.96=1-p2,解得p=0.2或p=-0.2(舍去),故从该批产品中任取1件是二等品的概率为0.2。
(2)该批产品共100件,由(1)知其二等品有100×0.2=20(件),ξ的可能取值为0,1,2。
故P(ξ=0)==,P(ξ=1)==,P(ξ=2)==。
所以ξ的分布列为
ξ
0
1
2
P
【例】甲、乙两支排球队进行比赛,约定先胜3局者获得比赛的胜利,比赛随即结束。除第五局甲队获胜的概率是外,其余每局比赛甲队获胜的概率都是。假设各局比赛结果相互独立。
(1)分别求甲队以3∶0,3∶1,3∶2胜利的概率。
(2)若比赛结果为3∶0或3∶1,则胜利方得3分,对方得0分;若比赛结果为3∶2,则胜利方得2分,对方得1分。求乙队得分X的分布列。
【解析】(1)设“甲队以3∶0,3∶1,3∶2胜利”分别为事件A,B,C,则P(A)=××=,
P(B)=C2××=,P(C)=C2×2×=。
(2)X的可能的取值为0,1,2,3。则P(X=0)=P(A)+P(B)=,P(X=1)=P(C)=,
P(X=2)=C×2×2×=,P(X=3)=3+C2××=。
所以X的分布列为
X
0
1
2
3
P
小结:利用独立重复试验概率公式可以简化求概率的过程,但需要注意检查该概率模型是否满足公式P(X=k)=Cpk(1-p)n-k的三个条件:(1)在一次试验中某事件A发生的概率是一个常数p;(2)n次试验不仅是在完全相同的情况下进行的重复试验,而且各次试验的结果是相互独立的;(3)该公式表示n次试验中事件A恰好发生了k次的概率。