- 426.50 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第8讲 离散型随机变量的均值与方差、正态分布
1.离散型随机变量X的均值与方差
已知离散型随机变量X的分布列为P(X=xi)=pi(i=1,2,3,…,n).
均值(数学期望)
方差
计算
公式
E(X)=x1p1+x2p2+…+xipi+…+xnpn
D(X)=(xi-E(X))2pi
作用
反映了离散型随机变量取值的平均水平
刻画了随机变量X与其均值E(X)的平均偏离程度
标准差
方差的算术平方根为随机变量X的标准差
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b(a,b为常数).
(2)D(aX+b)=a2D(X)(a,b为常数).
3.两个特殊分布的期望与方差
分布
期望
方差
两点分布
E(X)=p
D(X)=p(1-p)
二项分布
E(X)=np
D(X)=np(1-p)
4.正态曲线的特点
(1)曲线位于x轴上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值;
(4)曲线与x轴之间的面积为1;
(5)当σ一定时,曲线随着μ的变化而沿x轴平移;
(6)当μ一定时,曲线的形状由σ确定.σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
判断正误(正确的打“√”,错误的打“×”)
(1)随机变量的均值是常数,样本的平均数是随机变量,它不确定.( )
(2)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离变量的平均程度越小.( )
(3)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的均值,σ是正态分布的标准差.( )
(4)一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.( )
(5)均值是算术平均数概念的推广,与概率无关.( )
答案:(1)√ (2)√ (3)√ (4)√ (5)×
已知X的分布列为
X
-1
0
1
P
设Y=2X+3,则E(Y)的值为( )
A. B.4
C.-1 D.1
解析:选A.E(X)=-+=-,
E(Y)=E(2X+3)=2E(X)+3=-+3=.
已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<4)=( )
A.0.6 B.0.4
C.0.3 D.0.2
解析:选A.由P(ξ<4)=0.8,得P(ξ≥4)=0.2.
又正态曲线关于x=2对称,则P(ξ≤0)=P(ξ≥4)=0.2,所以P(0<ξ<4)=1-P(ξ≤0)-P(ξ≥4)=0.6.
(2017·高考全国卷Ⅱ)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则DX=________.
解析:依题意,X~B(100,0.02),
所以DX=100×0.02×(1-0.02)=1.96.
答案:1.96
一个人将编号为1,2,3,4的四个小球随机放入编号为1,2,3,4的四个盒子,每个盒子放一个小球,球的编号与盒子的编号相同时就放对了,否则就放错了.设放对个数记为ξ,则ξ的期望的值为________.
解析:将四个不同小球放入四个不同盒子,每个盒子放一个小球,共有A种不同放法,放对的个数ξ可取的值有0,1,2,4,其中P(ξ=0)==,
P(ξ=1)==,P(ξ=2)==,P(ξ=4)==,E(ξ)=0×+1×+2×+4×=1.
答案:1
离散型随机变量的均值与方差
(高频考点)
离散型随机变量的均值与方差是高考命题的热点,多以解答题的形式呈现,多为中档题.高考对离散型随机变量的均值与方差的考查主要有以下两个命题角度:
(1)古典概型背景下的离散型随机变量的均值与方差;
(2)与二项分布有关的均值与方差.
[典例引领]
角度一 古典概型背景下的离散型随机变量的
均值与方差
某小组共10人,利用假期参加义工活动.已知参加义工活动次数为1,2,3的人数分别为3,3,4.现从这10人中随机选出2人作为该组代表参加座谈会.
(1)设A为事件“选出的2人参加义工活动次数之和为4”,求事件A发生的概率;
(2)设X为选出的2人参加义工活动次数之差的绝对值,求随机变量X的分布列和数学期望与方差.
【解】 (1)由已知,有P(A)==.
所以事件A发生的概率为.
(2)随机变量X的所有可能取值为0,1,2.
P(X=0)==,
P(X=1)==,
P(X=2)==.
所以随机变量X的分布列为
X
0
1
2
P
随机变量X的数学期望E(X)=0×+1×+2×=1.
方差D(X)=(0-1)2+(1-1)2+(2-1)2=.
角度二 与二项分布有关的均值与方差
(2018·洛阳市第一次统一考试)雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM 2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格考核指标.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A、B、C三个城市进行治霾落实情况抽查.
(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;
(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.
【解】 (1)随机选取,共有34=81种不同方法,
恰有一个城市没有专家组选取的有C(CA+C)=42种不同方法,
故恰有一个城市没有专家组选取的概率为=.
(2)设事件A:“一个城市需复检”,则P(A)=1-=,X的所有可能取值为0,1,2,3,
P(X=0)=C·=,P(X=1)=C··=,P(X=2)=C··=,P(X=3)=C·=.
所以X的分布列为
X
0
1
2
3
P
X~B,E(X)=3×=.
(1)求离散型随机变量ξ的均值与方差的步骤
①理解ξ的意义,写出ξ可能的全部取值.
②求ξ取每个值的概率.
③写出ξ的分布列.
④由均值的定义求E(ξ).
⑤由方差的定义求D(ξ).
(2)二项分布的期望与方差
如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量.
[提醒] 均值E(X)由X的分布列唯一确定,即X作为随机变量是可变的,而E(X)是不变的,它描述X取值的平均水平.
[通关练习]
1.体育课的投篮测试规则是:一位同学投篮一次,若投中则合格,停止投篮,若投不中,则重新投篮一次,若三次投篮均不中,则不合格,停止投篮.某位同学每次投篮命中的概率为,则该同学投篮次数X的数学期望E(X)=________.
解析:投篮次数X的可能取值为1,2,3,
且P(X=1)=,P(X=2)=×=,
P(X=3)=××=.
随机变量X的分布列为
X
1
2
3
P
所以E(X)=1×+2×+3×=.
答案:
2.(2018·湖北黄冈三月调研)已知6只小白鼠中有1只感染了病毒,需要对6只小白鼠进行病毒DNA化验来确定哪一只受到了感染.下面是两种化验方案:方案甲:逐个化验,直到能确定感染病毒的小白鼠为止.方案乙:将6只小白鼠分为两组,每组三只,将其中一组的三只小白鼠的待化验物质混合在一起化验,若化验结果显示含有病毒DNA,则表明感染病毒的小白鼠在这三只当中,然后逐个化验,直到确定感染病毒的小白鼠为止;若化验结果显示不含病毒DNA,则在另外一组中逐个进行化验.
(1)求执行方案乙化验次数恰好为2次的概率;
(2)若首次化验的化验费为10元,第二次化验的化验费为8元,第三次及以后每次化验的化验费都是6元,求方案甲所需化验费的分布列和期望.
解:(1)执行方案乙化验次数恰好为2次的情况分两种:第一种,先化验一组,结果显示不含病毒DNA,再从另一组中任取一只进行化验,其恰含有病毒DNA,此种情况的概率为×=,第二种,先化验一组,结果显示含病毒DNA,再从中逐个化验,恰好第一只含有病毒,此种情况的概率为×=.
所以执行方案乙化验次数恰好为2次的概率为+=.
(2)设用方案甲化验需要的化验费为η(单位:元),则η的可能取值为10,18,24,30,36.
P(η=10)=,
P(η=18)=×=,
P(η=24)=××=,
P(η=30)=×××=,
P(η=36)=×××=,
则化验费η的分布列为
η
10
18
24
30
36
P
所以E(η)=10×+18×+24×+30×+36×=(元).
均值与方差的实际应用
[典例引领]
(2018·广西三市第一次联考)某公司为招聘新员工设计了一个面试方案:应聘者从6道备选题中一次性随机抽取3道题,按照题目要求独立完成.规定:至少正确完成其中2道题的便可通过.已知6道备选题中应聘者甲有4道题能正确完成,2道题不能完成;应聘者乙每道题正确完成的概率都是,且每道题正确完成与否互不影响.
(1)分别求甲、乙两人正确完成面试题数的分布列及数学期望;
(2)请分析比较甲、乙两人谁面试通过的可能性大?
【解】 (1)设甲正确完成面试的题数为ξ,则ξ的可能取值为1,2,3.
P(ξ=1)==;P(ξ=2)==;P(ξ=3)==.
应聘者甲正确完成题数ξ的分布列为
ξ
1
2
3
P
E(ξ)=1×+2×+3×=2.
设乙正确完成面试的题数为η,则η的可能取值为0,1,2,3.
P(η=0)=C=;P(η=1)=C=;
P(η=2)=C=;P(η=3)=C=.
应聘者乙正确完成题数η的分布列为
η
0
1
2
3
P
E(η)=0×+1×+2×+3×=2.(或因为η~B(3,),
所以E(η)=3×=2)
(2)因为D(ξ)=(1-2)2×+(2-2)2×+(3-2)2×=,
D(η)=3××=.
所以D(ξ)<D(η).
综上所述,从做对题数的数学期望考查,两人水平相当;
从做对题数的方差考查,甲较稳定;
从至少完成2道题的概率考查,甲面试通过的可能性大.
均值与方差的实际应用
(1)D(X)表示随机变量X对E(X)的平均偏离程度,D(X)越大表明平均偏离程度越大,说明X的取值越分散;反之,D(X)越小,X的取值越集中在E(X)附近,统计中常用来描述X的分散程度.
(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量取值偏离于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定.
(2018·长沙市统一模拟考试)张老师开车上班,有路线①与路线②两条路线可供选择.
路线①:沿途有A,B两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为,,若A处遇红灯或黄灯,则导致延误时间2分钟;若B处遇红灯或黄灯,则导致延误时间3分钟;若两处都遇绿灯,则全程所花时间为20分钟.
路线②:沿途有a,b两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为,,若a
处遇红灯或黄灯,则导致延误时间8分钟;若b处遇红灯或黄灯,则导致延误时间5分钟;若两处都遇绿灯,则全程所花时间为15分钟.
(1)若张老师选择路线①,求他20分钟能到校的概率;
(2)为使张老师日常上班途中所花时间较少,你建议张老师选择哪条路线?并说明理由.
解:(1)走路线①,20分钟能到校意味着张老师在A,B两处均遇到绿灯,记该事件发生的概率为P,则P=×=.
(2)设选择路线①的延误时间为随机变量ξ,则ξ的所有可能取值为0,2,3,5.
则P(ξ=0)=×=,P(ξ=2)=×=,
P(ξ=3)=×=,P(ξ=5)=×=.
ξ的数学期望E(ξ)=0×+2×+3×+5×=2.
设选择路线②的延误时间为随机变量η,则η的所有可能取值为0,8,5,13.
则P(η=0)=×=,P(η=8)=×=,
P(η=5)=×=,P(η=13)=×=.
η的数学期望E(η)=0×+8×+5×+13×=5.
因此选择路线①平均所花时间为20+2=22分钟,选择路线②平均所花时间为15+5=20分钟.
所以为使张老师日常上班途中所花时间较少,建议张老师选择路线②.
正态分布
[典例引领]
(1)(2018·长春质检)已知随机变量X服从正态分布N(1,σ2),若P(X>2)=0.15,则P(0≤X≤1)=( )
A.0.85 B.0.70
C.0.35 D.0.15
(2)已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( )
(附:若随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)≈68.27%,P(μ-2σ<ξ<μ+2σ)≈95.45%)
A.4.56% B.13.59%
C.27.18% D.31.74%
【解析】 (1)P(0≤X≤1)=P(1≤X≤2)=0.5-P(X>2)=0.35.
(2)由正态分布的概率公式知P(-3<ξ<3)≈0.682 7,P(-6<ξ<6)≈0.954 5,故P(3<ξ<6)===0.135 9=13.59%,故选B.
【答案】 (1)C (2)B
正态分布下的概率计算常见的两类问题
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,及曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
[通关练习]
1.若X~N(5,1),则P(3<X<4)=( )
A.0.954 5 B.0.477 3
C.0.341 4 D.0.135 9
解析:选D.依题意得
P(3<X<4)=P(3<X<7)-P(4<X<6)=×0.954 5-×0.682 7=0.135 9.
2.(2018·福建省毕业班质量检测)若随机变量X~N(μ,σ2),且P(X>5)=P(X<-1)=0.2,则P(25)=P(X<-1)=0.2,所以μ==2,所以P(22)-P(X>5)=0.5-0.2=0.3.
答案:0.3
随机变量的均值、方差与样本的平均值、方差的关系
随机变量的均值、方差是常数,它们不依赖于样本的抽取,而样本的平均值、方差是随机变量,它们随着样本的不同而变化.
期望与方差的一般计算步骤
(1)理解X的意义,写出X的所有可能取的值;
(2)求X取各个值的概率,写出分布列;
(3)根据分布列,正确运用期望与方差的定义或公式进行计算.
若X服从正态分布,即X~N(μ,σ2),要充分利用正态
曲线的关于直线X=μ对称和曲线与x轴之间的面积为1的性质.
易错防范
(1)E(X)是一个实数,由X的分布列唯一确定.随机变量X是可变的,可取不同的值,而E(X)是不变的,它描述X取值的平均状态.
(2)变量的方差与标准差都反映了随机变量取值的稳定与波动、集中与离散的程度,其中标准差与随机变量本身具有相同的单位.
(3)方差也是一个常数,它不具有随机性,方差的值一定是非负的.
1.罐中有6个红球,4个白球,从中任取1球,记住颜色后再放回,连续摸取4次,设X为取得红球的次数,则X的方差D(X)的值为( )
A. B.
C. D.
解析:选B.因为是有放回地摸球,所以每次摸球(试验)摸得红球(成功)的概率均为,连续摸4次(做4次试验),X为取得红球(成功)的次数,则X~B,所以D(X)=4××=.
2.某校在高三第一次模拟考试中约有1 000人参加考试,其数学考试成绩近似服从正态分布,即X~N(100,a2)(a>0),试卷满分为150分,统计结果显示数学考试成绩不及格(低于90分)的人数占总人数的,则此次数学考试成绩在100分到110分(包含100分和110分)之间的人数约为( )
A.400 B.500
C.600 D.800
解析:选A.P(X<90)=P(X>110)=,P(90≤X≤110)=1-×2=,P(100≤X≤110)=,1 000×=400.故选A.
3.(2017·高考浙江卷)已知随机变量ξi满足P(ξi=1)=pi,P(ξi=0)=1-pi,i=1,2.若0<p1<p2<,则( )
A.E(ξ1)<E(ξ2),D(ξ1)<D(ξ2)
B.E(ξ1)<E(ξ2),D(ξ1)>D(ξ2)
C.E(ξ1)>E(ξ2),D(ξ1)<D(ξ2)
D.E(ξ1)>E(ξ2),D(ξ1)>D(ξ2)
解析:选A.根据题意得,E(ξi)=pi,D(ξi)=pi(1-pi),i=1,2,因为0