- 263.00 KB
- 2021-05-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
高考数学第18题(概率与统计)
1、求等可能性事件、互斥事件和相互独立事件的概率
解此类题目常应用以下知识:
(1)等可能性事件(古典概型)的概率:P(A)==;
等可能事件概率的计算步骤:
计算一次试验的基本事件总数;
设所求事件A,并计算事件A包含的基本事件的个数;
依公式求值;
答,即给问题一个明确的答复.
(2)互斥事件有一个发生的概率:P(A+B)=P(A)+P(B);
特例:对立事件的概率:P(A)+P()=P(A+)=1.
(3)相互独立事件同时发生的概率:P(A·B)=P(A)·P(B);
特例:独立重复试验的概率:Pn(k)=.其中P为事件A在一次试验中发生的概率,此式为二项式[(1-P)+P]n展开的第k+1项.
(4)解决概率问题要注意“四个步骤,一个结合”:
求概率的步骤是:
第一步,确定事件性质
即所给的问题归结为四类事件中的某一种.
第二步,判断事件的运算
即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.
第三步,运用公式求解
第四步,答,即给提出的问题有一个明确的答复.
2.离散型随机变量的分布列
1.随机变量及相关概念
①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.
②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.
③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量.
2.离散型随机变量的分布列
①离散型随机变量的分布列的概念和性质
一般地,设离散型随机变量可能取的值为,,……,,……,取每一个值(1,2,……)的概率P()=,则称下表.
…
…
P
P1
P2
…
…
为随机变量的概率分布,简称的分布列.
由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质:
(1),1,2,…;(2)…=1.
②常见的离散型随机变量的分布列:
(1)二项分布
次独立重复试验中,事件A发生的次数是一个随机变量,其所有可能的取值为0,1,2,…n,并且,其中,,随机变量的分布列如下:
0
1
…
…
P
…
称这样随机变量服从二项分布,记作,其中、为参数,并记: .
(2) 几何分布
在独立重复试验中,某事件第一次发生时所作的试验的次数是一个取值为正整数的离散型随机变量,“”表示在第k次独立重复试验时事件第一次发生.
随机变量的概率分布为:
1
2
3
…
k
…
P
p
qp
…
…
3.离散型随机变量的期望与方差
随机变量的数学期望和方差
(1)离散型随机变量的数学期望:…;期望反映随机变量取值的平均水平.
⑵离散型随机变量的方差:……;
方差反映随机变量取值的稳定与波动,集中与离散的程度.
⑶基本性质:;.
(4)若~B(n,p),则 ; D =npq(这里q=1-p) ;
如果随机变量服从几何分布,,则,D =其中q=1-p.
4.抽样方法与总体分布的估计
抽样方法
1.简单随机抽样:设一个总体的个数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.
2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).
3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.
总体分布的估计
由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.
总体分布:总体取值的概率分布规律通常称为总体分布.
当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.
当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.
总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线.
5.正态分布与线性回归
1.正态分布的概念及主要性质
(1)正态分布的概念
如果连续型随机变量 的概率密度函数为 ,x 其中、为常数,并且>0,则称服从正态分布,记为(,).
(2)期望E =μ,方差.
(3)正态分布的性质
正态曲线具有下列性质:
①曲线在x轴上方,并且关于直线x=μ对称.
②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.
③曲线的对称轴位置由μ确定;曲线的形状由确定,越大,曲线越“矮胖”;反之越“高瘦”.
三σ原则即为
数值分布在(μ—σ,μ+σ)中的概率为0.6526
数值分布在(μ—2σ,μ+2σ)中的概率为0.9544
数值分布在(μ—3σ,μ+3σ)中的概率为0.9974
(4)标准正态分布
当=0,=1时服从标准的正态分布,记作(0,1)
(5)两个重要的公式
①,② .
(6)与二者联系.
若,则 ;
②若,则.
6.线性回归
1.简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.
变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.
具体说来,对n个样本数据(),(),…,(),其回归直线方程: ,其中
…(xn,yn),则变量间线性相关系数r的计算公式如下:
2.相关系数r:假设两个随机变量的取值分别是(x1,y1),(x2,y2),
,称为样本中心点,因而回归直线过样本中心点.
当时,表明两变量正相关;当,表明两变量负相关. 越接近1,表明两变量的线性相关性越强; 越接近0,表明两变量的线性相关关系几乎不存在,通常当时,认为两个变量有很强的线性相关关系.
7.独立性检验的概念
一般地,假设有两个分类变量和,它们的值域分别为和,其样本频数列联表(称为列联表)为:
总计
总计
我们利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”,这种方法称为两个分类变量的独立性检验.
(二)独立性检验的基本思想
独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量应该很小,如果由观测数据计算得到的的观测值很大,则在一定程度上说明假设不合理.
具体比较如下表:
反证法原理与独立性检验原理的比较
反证法原理
在假设下,如果推出一个矛盾,就证明了不成立.
独立性检验原理
在假设下,如果出现一个与矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率.
(三)独立性检验的方法
假设:“与有关系”,可按如下步骤判断结论成立的
可能性:
1.通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.
2.利用独立性检验来考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体做法是:
(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后通过下表确定临界值.
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(2)由公式,计算的观测值.
(3)如果,就推断“与有关系”.这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”,或者在样本数据中没有足够证据支持结论“与有关系”.
理解总结
根据独立性检验的基本思想,可知对于的观测值,存在一个正数为判断规则的临界值,当,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量没有关系”.在实际应用中,我们把解释为有
的把握认为“两个分类变量之间有关系”;把解释为不能以的把握认为“两个分类变量之间有关系”,或者样本观测数据没有提供“两个分类变量之间有关系”的充分证据.