- 766.00 KB
- 2021-05-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
二项分布与超几何分布辨析
二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析.
例 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求:
(1)有放回抽样时,取到黑球的个数X的分布列;
(2)不放回抽样时,取到黑球的个数Y的分布列.
解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率均为,3次取球可以看成3次独立重复试验,则.
;;
;.
因此,的分布列为
0
1
2
3
2.不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有:
;;.
因此,的分布列为
0
1
2
辨析:通过此例可以看出:有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.
超几何分布和二项分布都是离散型分布,超几何分布和二项分布的区别:
超几何分布需要知道总体的容量,而二项分布不需要;
超几何分布是不放回抽取,而二项分布是放回抽取(独立重复)
当总体的容量非常大时,超几何分布近似于二项分布........
二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。在实际应用中,理解并区分两个概率模型是至关重要的。下面举例进行对比辨析。
1.有放回抽样:每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型。
2.不放回抽样:取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型。因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样。所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的(特别注意:二项分布是在次独立重复试验的3个条件成立时应用的)。
超几何分布和二项分布的区别:
(1)超几何分布需要知道总体的容量,而二项分布不需要;
(2)超几何分布是“不放回”抽取,而二项分布是“有放回”抽取(独立重复)。
练习题:
1. 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球。求:
(1)有放回抽样时,取到黑球的个数X的分布列;
(2)不放回抽样时,取到黑球的个数Y的分布列。
2. (2008年四川延考)一条生产线上生产的产品按质量情况分为三类:A类、B类、C类.检验员定时从该生产线上任取2件产品进行一次抽检,若发现其中含有C类产品或2件都是B类产品,就需要调整设备,否则不需要调整.已知该生产线上生产的每件产品为A类品,B类品和C类品的概率分别为0.9,0.05和0.05,且各件产品的质量情况互不影响.
(1)求在一次抽检后,设备不需要调整的概率;
(2)若检验员一天抽检3次,以ξ表示一天中需要调整设备的次数,求ξ的分布列.
3. 今天你低碳了吗?近来,国内网站流行一种名为“碳排放计算器”的软件,人们可以扰此计算出自己每天的碳排放量。例如:家居用电的碳排放量(千克)=耗电度数×.785,汽车的碳排放量(千克)=油耗公升数×0.785等。某班同学利用寒假在两个小区逐户进行了一次生活习惯进否符合低碳观念的调查。若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”。这二族人数占各自小区总人数的比例P数据如下:
B小区
低碳族
非低碳族
比例P
A小区
低碳族
非低碳族
比例P
(I)如果甲、乙来自A小区,丙、丁来自B小区,求这4人中恰有2人是低碳族的概率;
(II)A小区经过大力宣传,每周非低碳族中有20%的人加入到低碳族的行列。如果2周后随机地从A小区中任选25个人,记表示25个人中低碳族人数,求
4. 在“自选模块”考试中,某试场的每位同学都选了一道数学题,第一小组选《数学史与不等式选讲》的有1人,选《矩阵变换和坐标系与参数方程》的有5人,第二小组选《数学史与不等式选讲》的有2人,选《矩阵变换和坐标系与参数方程》的有4人,现从第一、第二两小组各任选2人分析得分情况.
(Ⅰ)求选出的4 人均为选《矩阵变换和坐标系与参数方程》的概率;
(Ⅱ)设为选出的4个人中选《数学史与不等式选讲》的人数,求的分布列和数学期望.
5. 甲、乙两人参加2010年广州亚运会青年志愿者的选拔.打算采用现场答题的方式来进行,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题.规定每次考试都从备选题中随机抽出3题进行测试,至少答对2题才能入选.
(1)求甲答对试题数ξ的概率分布;
(2)求甲、乙两人至少有一人入选的概率.
正态分布和线性回归
高考要求
1.了解正态分布的意义及主要性质 2.了解线性回归的方法和简单应用
知识点归纳
1.正态分布密度函数:
,(σ>0,-∞<x<∞)
其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为
2.正态分布)是由均值μ和标准差σ唯一决定的分布
例1、下面给出三个正态总体的函数表示式,请找出其均值μ和标准差σ.
(1),(-∞<x<+∞
(2),(-∞<x<+∞
解: (1)0,1 (2)1,2
3.正态曲线的性质:正态分布由参数μ、σ唯一确定,如果随机变量~N(μ,σ2),根据定义有:μ=E,σ=D。
正态曲线具有以下性质:
(1)曲线在x轴的上方,与x轴不相交。
(2)曲线关于直线x =μ对称。
(3)曲线在x =μ时位于最高点。
(4)当x <μ时,曲线上升;当x >μ时,曲线下降。并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。
(5)当μ一定时,曲线的形状由σ确定。σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。
五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学
4.标准正态曲线:当μ=0、σ=l时,正态总体称为标准正态总体,其相应的函数表示式是,(-∞<x<+∞)
其相应的曲线称为标准正态曲线
标准正态总体N(0,1)在正态总体的研究中占有重要的地位 任何正态分布的概率问题均可转化成标准正态分布的概率问题
5.标准正态总体的概率问题:
对于标准正态总体N(0,1),是总体取值小于的概率,
即 ,
其中,图中阴影部分的面积表示为概率 只要有标准正态分布表即可查表解决.从图中不难发现:当时,;而当时,Φ(0)=0.5
例2 设,且总体密度曲线的函数表达式为:
,x∈R。
(1)求μ,σ;
(2)求的值。
分析:根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ。利用一般正态总体与标准正态总体N(0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。
解:(1)由于,
根据一般正态分布的函数表达形式,可知μ=1,,故X~N(1,2)。
(2)
。
点评:
在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。
9.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系
相关关系与函数关系的异同点如下:
相同点:均是指两个变量的关系
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.
10.回归分析一元线性回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析 通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性
对于线性回归分析,我们要注意以下几个方面:
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析的前提。
(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。
(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。
11.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度 粗略地看,散点分布具有一定的规律
12. 回归直线 设所求的直线方程为,其中a、b是待定系数.
, ,
相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析
13.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把
=
叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.
14.相关系数的性质: ≤1,且越接近1,相关程度越大;且越接近0,相关程度越小.一般的,当 0.75 时,就可以判断其具有很强的相关性,这时求线性回归方程才有意义。
例3 假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
若由资料可知y对x呈线性相关关系。试求:
(1)线性回归方程;
(2)估计使用年限为10年时,维修费用是多少?
分析:本题为了降低难度,告诉了y与x间呈线性相关关系,目的是训练公式的使用。
解:(1)列表如下:
i
1
2
3
4
5
2
3
4
5
6
2.2
3.8
5.5
6.5
7.0
4.4
11.4
22.0
32.5
42.0
4
9
16
25
36
, , ,
于是,
。
∴线性回归方程为:。
(2)当x=10时,(万元)
即估计使用10年时维修费用是12.38万元。
点评:本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。
二项分布与正态分布
[最新考纲]
1.了解条件概率和两个事件相互独立的概念.
2.理解n次独立重复试验的模型及二项分布.
3.能解决一些简单的实际问题.
知 识 梳 理
1.条件概率及其性质
条件概率的定义
条件概率的性质
设A,B为两个事件,且P(A)>0,称P(B|A)=为在事件A发生的条件下,事件B发生的条件概率
(1)0≤P(B|A)≤1
(2)若B,C是两个互斥事件,则P(B∪C|A)=P(B|A)+P(C|A)
2.事件的相互独立性
设A,B为两个事件,如果P(AB)=P(A)P(B),则称事件A与事件B相互独立.
若事件A,B相互独立,则P(B|A)=P(B);事件A与,与B,与都相互独立.
3.独立重复试验与二项分布
(1)独立重复试验
在相同条件下重复做的n次试验称为n次独立重复试验,若用Ai(i=1,2,…,n)表示第i次试验结果,则
P(A1A2A3…An)=P(A1)P(A2)P(A3)…P(An).
(2)二项分布
在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则P(X=k)=Cpk(1-p)n-k(k=0,1,2,…,n),此时称随机变量X服从二项分布,记为X~B(n,p),并称p为成功概率.
4.正态分布
(1)正态分布的定义及表示
如果对于任何实数a,b(a4)的值.
考点四 独立重复试验与二项分布
【例4】 某种有奖销售的饮料,瓶盖内印有“奖励一瓶”或“谢谢购买”字样,购买一瓶若其瓶盖内印有“奖励一瓶”字样即为中奖,中奖概率为.甲、乙、丙三位同学每人购买了一瓶该饮料.
(1)求甲中奖且乙、丙都没有中奖的概率;
(2)求中奖人数X的分布列.
规律方法 (1)独立重复试验是在同样的条件下重复地、各次之间相互独立地进行的一种试验,在这种试验中,每一次试验只有两种结果,即某事件要么发生,要么不发生,并且任何一次试验中发生的概率都是一样的.
(2)求复杂事件的概率,要正确分析复杂事件的构成,看复杂事件能转化为几个彼此互斥的事件的和事件还是能转化为几个相互独立事件同时发生的积事件,然后求概率.
【训练4】 某居民小区有两个相互独立的安全防范系统(简称系统)A和B,系统A和系统B在任意时刻发生故障的概率分别为和p.
(1)若在任意时刻至少有一个系统不发生故障的概率为,求p的值;
(2)设系统A在3次相互独立的检测中不发生故障的次数为随机变量X,求X的概率分布列及数学期望E(X).
小结
1.相互独立事件与互斥事件的区别
相互独立事件是指两个事件发生的概率互不影响,计算式为P(AB)=P(A)P(B).互斥事件是指在同一试验中,两个事件不会同时发生,计算公式为P(A∪B)=P(A)+P(B).
2.在n次独立重复试验中,事件A恰好发生k次可看做是C个互斥事件的和,其中每一个事件都可看做是k个A事件与(n-k)个事件同时发生,只是发生的次序不同,其发生的概率都是pk(1-p)n-k.因此n次独立重复试验中事件A恰好发生k次的概率为Cpk(1-p)n-k.
3.若X服从正态分布,即X~N(μ,σ2),要充分利用正态曲线的对称性和曲线与x轴之间的面积为1.