第8讲 离散型随机变量的均值与方差、正态分布
一、知识梳理
1.离散型随机变量的均值与方差
若离散型随机变量X的分布列为
X
a1
a2
…
ar
P
p1
p2
…
pr
(1)均值:称EX=a1p1+a2p2+…+arpr为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)方差:DX=E(X-EX)2= (ai-EX)2pi为随机变量X的方差,它刻画了随机变量X与其均值EX的平均偏离程度.
2.均值与方差的性质
(a,b为常数)
3.超几何分布与二项分布的均值
X
X服从参数为N,M,n
的超几何分布
X~B(n,p)
EX
np
4.正态曲线的特点
(1)曲线位于x轴上方,与x轴不相交.
(2)曲线是单峰的,它关于直线x=μ对称.
(3)曲线在x=μ处达到峰值 .
(4)曲线与x轴之间的面积为1.
(5)当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移.
(6)当μ一定时,曲线的形状由σ确定.σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
常用结论
均值与方差的七个常用性质
若Y=aX+b,其中a,b是常数,X是随机变量,则
(1)E k=k,D k=0,其中k为常数.
(2)E(aX+b)=aE X+b,D(aX+b)=a2DX.
(3)E(X1+X2)=EX1+EX2.
(4)D X=EX2-(EX)2.
(5)若X1,X2相互独立,则E(X1·X2)=EX1·EX2.
(6)若X服从两点分布,则EX=p,DX=p(1-p).
(7)若X服从二项分布,即X~B(n,p),则EX=np,DX=np(1-p).
二、教材衍化
1.已知X的分布列为
X
-1
0
1
P
设Y=2X+3,则EY=________.
解析:EX=-+=-,
EY=E(2X+3)=2EX+3=-+3=.
答案:
2.甲、乙两工人在一天生产中出现的废品数分别是两个随机变量X,Y,其分布列分别为:
X
0
1
2
3
P
0.4
0.3
0.2
0.1
Y
0
1
2
P
0.3
0.5
0.2
若甲、乙两人的日产量相等,则甲、乙两人中技术较好的是________.
解析:EX=0×0.4+1×0.3+2×0.2+3×0.1=1.
EY=0×0.3+1×0.5+2×0.2=0.9,
因为EY
2c-1)=P(X2c-1)=P(XP(A2),所以甲应选择L1.
又P(B1)=(0.01+0.02+0.03+0.02)×10=0.8,P(B2)=(0.01+0.04+0.04)×10=0.9,
P(B2)>P(B1),所以乙应选择L2.
(2)用M,N分别表示针对(1)的选择方案,甲、乙两人在各自允许的时间内赶到B地,由(1)知P(M)=0.6,P(N)=0.9,X的可能取值为0,1,2.
由题意知,M,N相互独立,
所以P(X=0)=0.4×0.1=0.04,
P(X=1)=0.4×0.9+0.6×0.1=0.42,
P(X=2)=0.6×0.9=0.54,
所以X的分布列为
X
0
1
2
P
0.04
0.42
0.54
所以E X=0×0.04+1×0.42+2×0.54=1.5.
求离散型随机变量的均值与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算.
随着网络营销和电子商务的兴起,人们的购物方式更具多样化.某调查机构随机抽取10名购物者进行采访,5名男性购物者中有3名倾向于选择网购,2名倾向于选择实体店,5名女性购物者中有2名倾向于选择网购,3名倾向于选择实体店.
(1)若从10名购物者中随机抽取2名,其中男、女各一名,求至少1名倾向于选择实体店的概率;
(2)若从这10名购物者中随机抽取3名,设X表示抽到倾向于选择网购的男性购物者的人数,求X的分布列和数学期望.
解:(1)设“随机抽取2名,其中男、女各一名,至少1名倾向于选择实体店”为事件A,则表示事件“随机抽取2名,其中男、女各一名,都倾向于选择网购”,
则P(A)=1-P()=1-=.
(2)X所有可能的取值为0,1,2,3,
且P(X=k)=,
则P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==.
所以X的分布列为
X
0
1
2
3
P
E X=0×+1×+2×+3×=.
二项分布的均值与方差(典例迁移)
雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM 2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格考核指标.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A、B、C三个城市进行治霾落实情况抽查.
(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;
(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.
【解】 (1)随机选取,共有34=81种不同方法,
恰有一个城市没有专家组选取的有C(CA+C)=42种不同方法,
故恰有一个城市没有专家组选取的概率为=.
(2)设事件A:“一个城市需复检”,则P(A)=1-=,X的所有可能取值为0,1,2,3,
P(X=0)=C·=,P(X=1)=C··=,P(X=2)=C··=,P(X=3)=C·=.
所以X的分布列为
X
0
1
2
3
P
X~B,E X=3×=.
(1)求离散型随机变量ξ的均值与方差的步骤
①理解ξ的意义,写出ξ可能的全部取值;
②求ξ取每个值的概率;
③写出ξ的分布列;
④由均值的定义求Eξ;
⑤由方差的定义求Dξ.
(2)二项分布的期望与方差
如果ξ~B(n,p),则用公式Eξ=np;Dξ=np(1-p)求解,可大大减少计算量.
[提醒] 均值E X由X的分布列唯一确定,即X作为随机变量是可变的,而E X是不变的,它描述X取值的平均水平.
电子商务在我国发展迅猛,网上购物成为很多人的选择.某购物网站组织了一次促销活动,在网页的界面上打出广告:高级口香糖,10元钱三瓶,有8种口味供您选择(其中有1种为草莓口味).小王点击进入网页一看,只见有很多包装完全相同的瓶装口香糖排在一起,看不见具体口味,由购买者随机点击进行选择(各种口味的高级口香糖均超过三瓶,且各种口味的瓶数相同,每点击选择一瓶后,网页自动补充相应的口香糖).
(1)小王花10元钱买三瓶,请问小王收到货的组合方式共有多少种?
(2)小王花10元钱买三瓶,由小王随机点击三瓶,请列出有小王喜欢的草莓味口香糖的瓶数ξ的分布列,并计算其数学期望和方差.
解:(1)若三瓶口味均不一样,有C=56(种);
若其中两瓶口味一样,有CC=56(种);
若三瓶口味一样,有8种.
故小王收到货的组合方式共有56+56+8=120(种).
(2)ξ所有可能的取值为0,1,2,3.
因为各种口味的高级口香糖均超过3瓶,且各种口味的瓶数相同,有8种不同口味,所以小王随机点击一次是草莓味口香糖的概率为,
即随机变量ξ服从二项分布,即ξ~B.
P(ξ=0)=C××=,
P(ξ=1)=C××=,
P(ξ=2)=C××=,
P(ξ=3)=C××=.
所以ξ的分布列为
ξ
0
1
2
3
P
数学期望Eξ=np=3×=,
方差Dξ)=np(1-p)=3××=.
均值与方差的实际应用(师生共研)
(2020·黑龙江哈尔滨六中二模)某健身机构统计了去年该机构所有消费者的消费金额(单位:元),如图所示:
(1)现从去年的消费金额超过3 200元的消费者中随机抽取2人,求至少有1位消费者去年的消费金额在(3 200,4 000]内的概率;
(2)针对这些消费者,该健身机构今年欲实施入会制,详情如下表:
会员等级
消费金额
普通会员
2 000
银卡会员
2 700
金卡会员
3 200
预计去年消费金额在(0,1 600]内的消费者今年都将会申请办理普通会员,消费金额在(1 600,3 200]内的消费者都将会申请办理银卡会员,消费金额在(3 200,4 800]内的消费者都将会申请办理金卡会员,消费者在申请办理会员时,需一次性缴清相应等级的消费金额,该健身机构在今年底将针对这些消费者举办消费返利活动,现有如下两种预设方案:
方案1:按分层抽样从普通会员,银卡会员,金卡会员中总共抽取25位“幸运之星”
给予奖励:普通会员中的“幸运之星”每人奖励500元;银卡会员中的“幸运之星”每人奖励600元;金卡会员中的“幸运之星”每人奖励800元.
方案2:每位会员均可参加摸奖游戏,游戏规则如下:从一个装有3个白球、2个红球(球只有颜色不同)的箱子中,有放回地摸三次球,每次只能摸一个球,若摸到红球的总数为2,则可获得200元奖励金;若摸到红球的总数为3,则可获得300元奖励金;其他情况不给予奖励.规定每位普通会员均可参加1次摸奖游戏;每位银卡会员均可参加2次摸奖游戏;每位金卡会员均可参加3次摸奖游戏(每次摸奖的结果相互独立).
请你预测哪一种返利活动方案该健身机构的投资较少?并说明理由.
【解】 (1)去年的消费金额超过3 200元的消费者有12人,随机抽取2人,消费金额在(3 200,4 000]的范围内的人数为X,可能取值为0,1,2.P(X≥1)=1-P(X=0)=1-=,
所以至少有1位消费者去年的消费金额在(3 200,4 000]的范围内的概率为.
(2)方案1:按分层抽样从普通会员,银卡会员,金卡会员中总共抽取25位“幸运之星”,则“幸运之星”中的普通会员,银卡会员,金卡会员的人数分别为×25=7,×25=15,×25=3.
按照方案1奖励的总金额ξ1=7×500+15×600+3×800=14 900(元).
方案2:设η表示参加一次摸奖游戏所获得的奖励金,则η的可能取值为0,200,300.
摸到红球的概率P==,
所以P(η=0)=C··+C··=,
P(η=200)=C··=,
P(η=300)=C·=.
η的分布列为
η
0
200
300
P
数学期望Eη=0×+200×+300×=76.8(元),
按照方案2奖励的总金额ξ2=(28+2×60+3×12)×76.8=14 131.2(元),
由ξ1>ξ2知,方案2投资较少.
均值与方差的实际应用
(1)D(X)表示随机变量X对E X的平均偏离程度,D X越大表明平均偏离程度越大,说明X的取值越分散;反之,DX越小,X的取值越集中在E X附近,统计中常用来描述X的分散程度.
(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量取值偏离于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定.
(2020·湖北武汉模拟)某保险公司对一个拥有20 000人的企业推出一款意外险产品,每年每位职工只要交少量保费,发生意外后可一次性获得若干赔偿金,保险公司把企业的所有岗位共分为A,B,C三类工种,从事这三类工种的人数分别为12 000,6 000,2 000,由历史数据统计出三类工种的赔付频率如表(并以此估计赔付概率):
工种类别
A
B
C
赔付频率
已知A,B,C三类工种的职工每人每年保费分别为25元、25元、40元,出险后的赔偿金额分别为100万元、100万元、50万元,保险公司在开展此项业务过程中的固定支出为每年10万元.
(1)求保险公司在该业务所获利润的期望值;
(2)现有如下两个方案供企业选择:
方案1:企业不与保险公司合作,职工不交保险,出意外企业自行拿出与保险公司提供的等额赔偿金赔偿付给意外职工,企业开展这项工作的固定支出为每年12万元;
方案2:企业与保险公司合作,企业负责职工保费的70%,职工个人负责保费的30%,出险后赔偿金由保险公司赔付,企业无额外专项开支.
请根据企业成本差异给出选择合适方案的建议.
解:(1)设工种A,B,C职工的每份保单保险公司的收益为随机变量X,Y,Z,则X,Y,Z的分布列分别为
X
25
25-100×104
P
1-
Y
25
25-100×104
P
1-
Z
40
40-50×104
P
1-
所以EX=25×+(25-100×104)×=15,
EY=25×+(25-100×104)×=5,
EZ=40×+(40-50×104)×=-10,
保险公司所获利润的期望值为12 000×15+6 000×5-2 000×10-100 000=90 000,
所以保险公司在该业务所获利润的期望值为9万元.
(2)方案1:企业不与保险公司合作,则企业每年安全支出与固定开支共为12 000×100×104×+6 000×100×104×+2 000×50×104×+12×104=46×104;
方案2:企业与保险公司合作,则企业支出保险金额为(12 000×25+6 000×25+2 000×40)×0.7=37.1×104.
因为46×104>37.1×104,
所以建议企业选择方案2.
正态分布(师生共研)
(2020·安徽安庆二模)为了保障某种药品的主要药理成分在国家药品监督管理局规定的值的范围内,某制药厂在该药品的生产过程中,检验员在一天中按照规定每间隔2小时对该药品进行检测,每天检测4次,每次检测由检验员从该药品生产线上随机抽取20件产品进行检测,测量其主要药理成分含量(单位:mg).根据生产经验,可以认为这条药品生产线正常状态下生产的产品中其主要药理成分含量服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示某次抽取的20件产品中其主要药理成分含量在(μ-3σ,μ+3σ)之外的药品件数,求P(X=1)(精确到0.001)及X的数学期望.
(2)在一天内的四次检测中,如果有一次出现了主要药理成分含量在(μ-3σ,μ+3σ)之外的药品,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对本次的生产过程进行检查;如果在一天中,有连续两次检测出现了主要药理成分含量在(μ-3σ,μ+3σ)之外的药品,则需停止生产并对原材料进行检测.
(i)下面是检验员在某一次抽取的20件药品的主要药理成分含量:
10.02
9.78
10.04
9.92
10.14
10.04
9.22
10.13
9.91
9.95
10.09
9.96
9.88
10.01
9.98
9.95
10.05
10.05
9.96
10.12
经计算得=xi=9.96,s==≈0.19.
其中xi为抽取的第i件药品的主要药理成分含量(i=1,2,…,20).用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对本次的生产过程进行检查?
(ii)试确定一天中需停止生产并对原材料进行检测的概率.(精确到0.001)
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ0,试卷满分150分),统计结果显示数学考试成绩在70分到110分之间的人数约为总人数的,则此次月考中数学考试成绩不低于110分的学生约有________人.
解析:因为成绩服从正态分布X~N(90,a2),
所以其正态分布曲线关于直线x=90对称,
又因为成绩在70分到110分之间的人数约为总人数的,
由对称性知成绩在110分以上的人数约为总人数的×=,所以此次数学考试成绩不低于110分的学生约有×900=180(人).
答案:180
利用期望与方差进行决策
某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买.则每个500元,现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)若要求P(X≤n)≥0.5,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一.应选用哪个?
【解】 (1)由柱状图并以频率代替概率可得,
一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2.
可知X的所有可能取值为16,17,18,19,20,21,22,
P(X=16)=0.2×0.2=0.04;
P(X=17)=2×0.2×0.4=0.16;
P(X=18)=2×0.2×0.2+0.4×0.4=0.24;
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;
P(X=20)=2×0.2×0.4+0.2×0.2=0.2;
P(X=21)=2×0.2×0.2=0.08;
P(X=22)=0.2×0.2=0.04.
所以X的分布列为
X
16
17
18
19
20
21
22
P
0.04
0.16
0.24
0.24
0.2
0.08
0.04
(2)由(1)知P(X≤18)=0.44,P(X≤19)=0.68,故n的最小值为19.
(3)记Y表示2台机器在购买易损零件上所需的费用(单位:元).
当n=19时,
EY=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040.
当n=20时,
EY=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080.
可知当n=19时所需费用的期望值小于n=20时所需费用的期望值,故应选n=19.
利用期望与方差进行决策的方法
(1)若我们希望实际的平均水平较理想时,则先求随机变量ξ1,ξ2的期望,当Eξ1=Eξ2时,不应误认为它们一样好,需要用Dξ1,Dξ2来比较这两个随机变量的偏离程度,偏离程度小的更好.
(2)若我们希望比较稳定时,应先考虑方差,再考虑均值是否相等或者接近.
(3)若对平均水平或者稳定性没有明确要求时,一般先计算期望,若相等,
则由方差来确定哪一个更好.若Eξ1与Eξ2比较接近,且期望较大者的方差较小,显然该变量更好;若Eξ1与Eξ2比较接近且方差相差不大时,应根据不同选择给出不同的结论,即是选择较理想的平均水平还是选择较稳定.
甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪80元,每单送餐员抽成4元;乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元.假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:
甲公司送餐员送餐单数频数表
送餐单数
38
39
40
41
42
天数
10
15
10
10
5
乙公司送餐员送餐单数频数表
送餐单数
38
39
40
41
42
天数
5
10
10
20
5
(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率;
(2)若将频率视为概率,回答下列两个问题:
①记乙公司送餐员日工资为X(单位:元),求X的分布列和数学期望E(X);
②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王作出选择,并说明理由.
解:(1)记抽取的3天送餐单数都不小于40为事件M,
则P(M)==.
(2)①设乙公司送餐员的送餐单数为a,
当a=38时,X=38×6=228,
当a=39时,X=39×6=234,
当a=40时,X=40×6=240,
当a=41时,X=40×6+1×7=247,
当a=42时,X=40×6+2×7=254.
所以X的所有可能取值为228,234,240,247,254.
故X的分布列为
X
228
234
240
247
254
P
所以EX=228×+234×+240×+247×+254×=241.8.
②依题意,甲公司送餐员的日平均送餐单数为38×0.2+39×0.3+40×0.2+41×0.2+42×0.1=39.7,
所以甲公司送餐员的日平均工资为80+4×39.7=238.8元.
由①得乙公司送餐员的日平均工资为241.8元.
因为238.8<241.8,所以推荐小王去乙公司应聘.
[基础题组练]
1.已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<4)=( )
A.0.6 B.0.4
C.0.3 D.0.2
解析:选A.由P(ξ<4)=0.8,得P(ξ≥4)=0.2.
又正态曲线关于x=2对称,则P(ξ≤0)=P(ξ≥4)=0.2,所以P(0<ξ<4)=1-P(ξ≤0)-P(ξ≥4)=0.6.
2.口袋中有编号分别为1,2,3的三个大小和形状相同的小球,从中任取2个,则取出的球的最大编号X的期望为( )
A. B.
C.2 D.
解析:选D.因为口袋中有编号分别为1,2,3的三个大小和形状相同的小球,从中任取2个,所以取出的球的最大编号X的可能取值为2,3,所以P(X=2)==,P(X=3)==,所以EX=2×+3×=.
3.(2020·河南焦作一模)设X~N(1,1),其正态分布密度曲线如图所示,那么从正方形ABCD中随机取10 000个点,则取自阴影部分的点的个数的估计值是( )
(注:若X~N(μ,σ2),则P(μ-σ1,则k<7.35,P(X=k-1)7.35,P(X=k-1)>P(X=k).
所以当k=7时,P(X=k)最大,即当P(X=k)最大时,k=7.
2.(2020·云南昆明检测)某地区为贯彻“绿水青山就是金山银山”的精神,鼓励农户利用荒坡种植果树.某农户考察三种不同的果树苗A,B,C,经引种试验后发现,引种树苗A的自然成活率为0.8,引种树苗B,C的自然成活率均为p(0.7≤p≤0.9).
(1)任取树苗A,B,C各一棵,估计自然成活的棵数为X,求X的分布列及EX;
(2)将(1)中的EX取得最大值时p的值作为B种树苗自然成活的概率.该农户决定引种n棵B种树苗,引种后没有自然成活的树苗中有75%的树苗可经过人工栽培技术处理,处理后成活的概率为0.8,其余的树苗不能成活.
①求一棵B种树苗最终成活的概率;
②若每棵树苗引种最终成活后可获利300元,不成活的每棵亏损50元,该农户为了获利不低于20万元,问至少引种B种树苗多少棵?
解:(1)由题意知,X的所有可能值为0,1,2,3,
则P(X=0)=0.2(1-p)2,
P(X=1)=0.8×(1-p)2+0.2×C×p×(1-p)=0.8(1-p)2+0.4p(1-p)=0.4p2-1.2p+0.8,
P(X=2)=0.2p2+0.8×C×p×(1-p)=0.2p2+1.6p(1-p)=-1.4p2+1.6p,
P(X=3)=0.8p2.
X的分布列为
X
0
1
2
3
P
0.2p2-0.4p+0.2
0.4p2-1.2p+0.8
-1.4p2+1.6p
0.8p2
所以E X=1×(0.4p2-1.2p+0.8)+2×(-1.4p2+1.6p)+3×0.8p2=2p+0.8.
(2)当p=0.9时,E X取得最大值.
①一棵B树苗最终成活的概率为0.9+0.1×0.75×0.8=0.96.
②记Y为n棵B种树苗的成活棵数,M(n)为n棵B种树苗的利润,则Y~B(n,0.96),E Y=0.96n,M(n)=300Y-50(n-Y)=350Y-50n,E(M(n))=350E Y-50n=286n,要使E(M(n))≥200 000,则有n≥699.3.
所以该农户至少种植700棵B种树苗,就可获利不低于20万元.
3.(2019·高考全国卷Ⅰ)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,
若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求X的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时 ,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api-1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.
(ⅰ)证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列;
(ⅱ)求p4,并根据p4的值解释这种试验方案的合理性.
解:(1)X的所有可能取值为-1,0,1.
P(X=-1)=(1-α)β,
P(X=0)=αβ+(1-α)(1-β),
P(X=1)=α(1-β).
所以X的分布列为
(2)(ⅰ)证明:由(1)得a=0.4,b=0.5,c=0.1.
因此pi=0.4pi-1+0.5pi+0.1pi+1,故0.1(pi+1-pi)=0.4(pi-pi-1),即pi+1-pi=4(pi-pi-1).
又因为p1-p0=p1≠0,所以{pi+1-pi}(i=0,1,2,…,7)为公比为4,首项为p1的等比数列.
(ⅱ)由(ⅰ)可得
p8=p8-p7+p7-p6+…+p1-p0+p0
=(p8-p7)+(p7-p6)+…+(p1-p0)
=p1.
由于p8=1,故p1=,所以
p4=(p4-p3)+(p3-p2)+(p2-p1)+(p1-p0)
=p1=.
p4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p4=≈0.003 9,此时得出错误结论的概率非常小,说明这种试验方案合理.