- 2.94 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
热点十七 概率与统计大题(理)
【名师精讲指南篇】
【高考真题再现】
1.【2014 全国卷 1】 从某企业生产的某种产品中抽取 500 件,测量这些产品的一项质量指标
值,由测量结果得如下图频率分布直方图:
(I)求这 500 件产品质量指标值的样本平均值 x 和样本方差 2s (同一组的数据用该组区间
的中点值作代表);
(II)由直方图可以认为,这种产品的质量指标 Z 服从正态分布 2,N ,其中 近似为
样本平均数 x , 2 近似为样本方差 2s .
(i)利用该正态分布,求 187.8 212.2P Z ;
(ii)某用户从该企业购买了 100 件这种产品,记 X 表示这 100 件产品中质量指标值位于区
间 187.8,212.2 的产品件数.利用(i)的结果,求 EX .
附: 150 12.2
若 2~ ,Z N 则
0.6826P Z , 2 2 0.9544P Z .
【解析】(I)抽取产品的质量指标值的样本平均值 x 和样本方差 2s 分别为
170 0.02 180 0.09 190 0.22x 200 0.33 210 0.24 220 0.08
230 0.02 200 ,
2 2 2 2 2 2 2( 30) 0.02 ( 20) 0.09 ( 10) 0.22 0 0.33 10 0.24 20 0.08 30 0.02s
150 .
(II)(i)由(I)知, Z 服从正态分布 (200,150)N ,从而
187.8 212.2P Z (200 12.2 Z 200P
12.2) 0.6826 .
(ii)由(i)可知,一件产品的质量指标值位于区间 187.8,212.2 的概率为 0.6826 ,依题
意知 (100,0.6826)X B ,所以 100 0.6826 68.26EX .
2.【2014 全国卷 2 理】某地区 2007 年至 2013 年农村居民家庭纯收入 y (单位:千元)的
数据如下表:
年份 2007 2008 2009 2010 2011 2012 2013
年份代号t 1 2 3 4 5 6 7
人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(1)求 y 关于 t 的线性回归方程;
(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的
变化情况,并预测该地区 2015 年农村居民家庭人均纯收入.
附 : 回 归 直 线 的 斜 率 和 截 距 的 最 小 二 乘 法 估 计 公 式 分 别 为 :
1
2
1
n
i i
i
n
i
i
t t y y
b
t t
, ˆˆa y bt .
(II)由(I)知, ˆ 0.5 0b ,故 2007 年至 2013年该地区农村居民家庭人均纯收入逐年增
加,平均每年增加 0.5 千元.将 2015 年的年份代号 9t 代入(I)中的回归方程,得
ˆ 0.5 9 2.3 6.8y 千元,故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元
3.【2015 全国卷理】某公司为了解用户对其产品的满意度,从 ,A B 两地区分别随机调查了
20 个用户,得到用户对产品的满意度评分如下:
A 地区:62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B 地区:73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评
分的平均值及分散程度(不要求计算出具体值,得出结论即可);
A 地 区 B 地 区
4
5
6
7
8
9
(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分 低于 70 分 70 分到 89 分 不低于 90 分
满意度等级 不满意 满意 非常满意
记事件 C:“A 地区用户的满意度等级高于 B 地区用户的满意度等级”,假设两地区用户的评
价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求 C 的概率.
【解析】(1)由题意知,两地区用户满意度评分的茎叶图如下.
通过茎叶图可以看出, A 地区用户满意度评分的平均值高于 B 地区用户满意度评分的平均
值; A 地区用户满意度评分比较集中, B 地区用户满意度评分比较分散.
(2)记 1AC 为事件:“ A 地区用户的满意度等级为满意或非常满意”;
记 2AC 为事件:“ A 地区用户的满意度等级为非常满意”;
记 1BC 为事件:“ B 地区用户的满意度等级为不满意”;
记 2BC 为事件:“ B 地区用户的满意度等级为满意”.
则可得 1AC 与 1BC 相互独立, 2AC 与 2BC 相互独立, 1BC 与 2BC 互斥,
则可得 1 1 2 2B A B AC C C C C .
所以 1 1 2 2( ) ( )B A B AP C P C C C C 1 1 2 2( ) ( )B A B AP C C P C C
1 1 2 2( ) ( ) ( ) ( )B A B AP C P C P C P C .
由题意及所给数据可得 1AC , 2AC , 1BC , 2BC 发生的频率分别为 16
20
, 4
20
, 10
20
, 8
20
.
故可得 1( )AP C 16= 20
, 2( )=AP C 4
20
, 1( )=BP C 10
20
, 2( )BP C 8= 20
,
故 10 16 8 4( )= + 0.4820 20 20 20P C .即C 的概率为 0.48.
4.【2015 全国卷Ⅰ理】某公司为确定下一年投入某种产品的宣传费,需了解年宣传费 x (单
位:千元)对年销售量 y (单位: t )和年利润 z (单位:千元)的影响,对近 8 年的年宣传
费 ix 和年销售量 1,2, ,8iy i 数据作了初步处理,得到下面的散点图及一些统计量的值.
A 地区 B 地区
4
5
6
7
8
9
6 8
1 3 6 43
2 4 5 56 4 2
3 3 4 6 96 8 8 6 4 3
3 2 19 2 8 6 5 1
1 37 5 5 2
x y w 8 2
1
i
i
x x
8 2
1
i
i
w w
8
1
i i
i
x x y y
8
1
i i
i
w w y y
46.
6
563 6.
8
289.8 1.6 1469 108.8
表中 i iw x ,
8
1
1
8 i
i
w w
,
(1)根据散点图判断, y a bx 与 y c d x 哪一个适宜作为年销售量 y 关于年宣传费
x 的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程;
(3)已知这种产品的年利润 z 与 x , y 的关系式 0.2z y x ,根据(2)的结果回答下列问
题:
①年宣传费 49x 时,年销售量及年利润的预报值是多少?
②年宣传费 x 为何值时,年利润的预报值最大?
附:对于一组数据 1 1,u v 2 2,u v ,, ,n nu v ,其回归直线 v u 的斜率和截距的最小
二乘估计分别为
1
2
1
ˆ
n
i i
i
n
i
i
u u v v
u u
, ˆˆ v u .
5.【2016 全国卷 2 理】某险种的基本保费为 a (单元:元),继续购买该险种的投保人称为
续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数 0 1 2 3 4 5≥
保 费 0.85a a 1.25a 1.5a 1.75a 2a
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数 0 1 2 3 4 5≥
概 率 0.30 0.15 0.20 0.20 0.10 0.05
(1)求一续保人本年度的保费高于基本保费的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出 60% 的概率;
(3)求续保人本年度的平均保费与基本保费的比值.
【 解 析 】( 1 ) 设 续 保 人 本 年 度 的 保 费 高 于 基 本 保 费 为 事 件 A , 则
( ) 1 ( ) 1 (0.30 0.15) 0.55P A P A .
(2)设续保人保费比基本保费高出 60% 为事件 B , 0.10 0.05 3( ) 0.55 11P B .
(3)设本年度所交保费为随机变量 X .
X 0.85a a 1.25a 1.5a 1.75a 2a
P 0.30 0.15 0.20 0.20 0.10 0.05
平均保费为:
0.85 0.30 0.15 1.25 0.20 1.5 0.20 1.75 0.10 2 0.05=1.23EX a a a a a a a a ,所以平
均保费与基本保费比值为1.23 .
6.【2016 全国卷 2 理】某公司计划购买 2 台机器,该种机器使用三年后即被淘汰.机器有一
易损零件,在购进机器时,可以额外购买这种零件作为备件,每个 200 元.在机器使用期间,
如果备件不足再购买,则每个 500元.现需决策在购买机器时应同时购买几个易损零件,为此
搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记 X
表示 2 台机器三年内共需更换的易损零件数, n 表示购买 2 台机器的同时购买的易损零件
数.
(1)求 X 的分布列;
(2)若要求 ( ) 0.5P X n
,确定 n 的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在 19n 与 20n 之中选其一,应选用
哪个?
【解析】(1)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为
8 , 9 , 10 , 11 的概率分别为 0.2 , 0.4 , 0.2 , 0.2 . 从而: ( 16) 0.2 0.2 0.04P X ;
( 17) 2 0.2 0.4 0.16P X ;
( 18) 2 0.2 0.2 0.4 0.4 0.24P X ; ( 19) 2 0.2 0.2 2 0.4 0.2 0.24P X ;
( 20) 2 0.2 0.4 0.2 0.2 0.2P X ; ( 21) 2 0.2 0.2 0.08P X ;
( 22) 0.2 0.2 0.04P X .
所以 X 的分布列为:
X 16 17 18 19 20 21 22
P 0.04 0.16 0.24 0.24 0.2 0.08 0.04
(2)由(1)知, ( 18) 0.44P X ≤ , ( 19) 0.68P X ≤ ,故 n 的最小值为19 .
(3)记Y 表示 2 台机器在购买易损零件上所需的费用(单位:元).
当 19n
时 , 19 200 0.68 (19 200 500) 0.2EY
(19 200 2 500) 0.08 (19 200 3 500) 0.04 4040 .
当 20n
时, 20 200 0.88 (20 200 500) 0.08EY (20 200 2 500) 0.04 4080 .
可知当 19n 时所需费用的期望值小于 20n 时所需费用的期望值,故应选 19n .
7.【2016 全国卷 3 理】下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)
的折线图
(1)由折线图看出,可用线性回归模型拟合 y 与t 的关系,请用相关系数加以说明
(2)建立 y 关于t 的回归方程(系数精确到 0.01),预测 2016 年我国生活垃圾无害化处理
量.
参考数据:
7
1
9.32i
i
y
,
7
1
40.17i i
i
t y
,
7
2
1
( ) 0.55i
i
y y
, 7 2.646 .
参考公式:相关系数 1
2 2
1 1
( )( )
( ) (y y)
n
i i
i
n n
i i
i i
t t y y
r
t t
,
回归方程 y a bt 中斜率和截距的最小二乘估计公式分别为:
1
2
1
( )( )
( )
n
i i
i
n
i
i
t t y y
b
t t
,= .a y bt
【 解 析 】( 1 ) 由 折 线 图 中 数 据 和 附 注 中 参 考 数 据 得 4t , 27
1
28i
i
t t
,
27
1
0.55i
i
y y
,
7 7 7
1 1 1
40.17 4 9.32 2.89i i i i i
i i i
t t y y t y t y
, 2.89 0.990.55 2 2.646r
.
因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线性回
归模型拟合 y 与 t 的关系.
(1)变量 y 与 t 的相关系数
7 7 7 7
1 1 1 1
7 7 7 7
2 2 2 2
1 1 1 1
( )( ) 7
( ) ( ) 7 ( ) ( )
i i i i i i
i i i i
i i i i
i i i i
t t y y t y t y
r
t t y y t t y y
,
又
7
1
28i
i
t
,
7
1
9.32i
i
y
,
7
1
40.17i i
i
t y
,
7
2
1
( ) 2 7 5.292i
i
t t
,
7
2
1
( ) 0.55i
i
y y
,
所以 7 40.17 28 9.32 0.997 5.292 0.55r
,
故可用线性回归模型拟合变量 y 与 t 的关系.
(2) 4t , y
7
1
1
7 i
i
y
,所以
7
1
7
2 2
1
17 40.17 7 4 9.327ˆ 0.10287
i i
i
i
i
t y t y
b
t t
,
1ˆˆ 9.32 0.10 4 0.937a y bx ,所以线性回归方程为 ˆ 0.1 0.93y t .
当 9t 时, ˆ 0.1 9 0.93 1.83y .因此,我们可以预测 2016 年我国生活垃圾无害化处理
1.83亿吨.
【热点深度剖析】
1.纵观 2014 年和 2015 年 2016 年的高考题对本热点的考查,可以发现概率和统计、统计案
例相结合是高考命题的热点,在 2012 年高考中,结合实际问题将函数和概率问题巧妙结合
在一起,新颖别致,但是题目难度不大,这也体现了“新题不难”的命题特点,主要考查生活
中的概率统计知识和方法.求离散型随机变量的分布列和数学期望的方法,以及生活中最大
利润的判断; 2014 年主要考查了频率分布直方图,正态分布的 3 原则,二项分布的期望及
回归分析.2015 年分别考查了回归分析、茎叶图;2016 年 3 套试卷分别考查了回归分析、
分布列、期望的应用.这也体现了高考对新课标的新增内容的要求,试题难度不大,但是要求
同学们对相关的基础知识掌握必须准确. 从近几年的高考试题来看,频率分布直方图、茎叶
图、平均数、方差、分布列是高考的热点,题型既有选择题、填空题,又有解答题,客观题考
查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生
应用知识解决问题的能力.独立性检验、回归分析高考对此部分内容考查有加强趋势,主要
是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来考查一些基本的统
计思想,在高考中多为选择、填空题,也有解答题出现.根据这几年高考试题预测 2017 年高
考,频率分布直方图、茎叶图、平均数、方差,离散型随机变量的分布列与期望仍然是考查
的热点,同时应注意和概率、平均数、分布列,期望,二项分布,正态分布等知识的结合,同时
应注意独立性检验在实际生活中的应用,有可能涉及一道与独立检验有关的大题.
【重点知识整合】
一,统计初步
1.简单随机抽样 WWW. iyuan u
简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便
于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主
要有抽签法和随机数法.
2.系统抽样
(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,
从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.
(2)系统抽样的步骤:
①编号.采用随机的方式将总体中的个体编号.
②分段.先确定分段的间隔 .当N
n
(N 为总体中的个体数,n 为样本容量)是整数时, =N
n
;当N
n
不
是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数 N′能被 n 整除,这时
=N′
n
.③确定起始个体编号.在第 1 段用简单随机抽样确定起始的个体编号 S.
④按照事先确定的规则抽取样本.通常是将 S 加上间隔 ,得到第 2 个个体编号 S+ ,再将(S
+ )加上 ,得到第 3 个个体编号 S+2 ,这样继续下去,获得容量为 n 的样本.其样本编号依
次是:S,S+ ,S+2 ,…,S+(n-1) .
3.分层抽样
(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分
成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合
在一起作为样本,这种抽样的方法叫做分层抽样.
分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层
中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一
定的了解,明确分层的界限和数目,分层要恰当.
(2)分层抽样的步骤
①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.
(3)分层抽样的优点
分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有
较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在
实践中有着非常广泛的应用.
4.绘制频率分布直方图中·华.资*源 库 iyuan u
把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率
组距
,
这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布
直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形
的面积表示,各小矩形的面积总和等于 1.
5.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生
长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它
较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.
6.平均数、中位数和众数
(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.
(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的
一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的
中位数.
(3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据
都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众
数).
(4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频
率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数
的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
7.方差、标准差
(1)设样本数据为 x1,x2,…,xn 样本平均数为 x-,则 s2=1
n
[(x1- x-)2+(x2- x-)2+…+(xn-
x-)2]=1
n
[(x1
2+x2
2+…+xn
2)-n x 2]叫做这组数据的方差,用来衡量这组数据的波动大小,
一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本
标准差.
(2)数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最
大幅度.方差则反映一组数据围绕平均数波动的大小.
8.两个变量的线性相关
(1)散点图
将样本中 n 个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两
个变量的一组数据的图形叫做散点图.利用散点图可以判断变量之间有无相关关系.
(2)正相关、负相关
如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另
一个变量的值也由小变大,这种相关称为正相关.
反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值
由小变大时,另一个变量的值由大变小,这种相关称为负相关.
9.回归分析
对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,
②求回归直线方程,③用回归直线方程作预报.
(1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,
我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归直线方程的求法——最小二乘法.
设具有线性相关关系的两个变量 x、y 的一组观察值为(xi,yi)(i=1,2,…,n),则回归直线方
程y^=a^+b^x 的系数为:
b^=
i=1
n
xiyi-n x ·y
i=1
n
xi
2-n x 2
=
i=1
n
xi- x-yi- y-
i=1
n
xi- x-2
a^= y--b^ x
其中 x-=1
n
错误!i, y-=1
n
错误!i,( x-, y-)称作样本点的中心.
a^,b^表示由观察值用最小二乘法求得的 a,b 的估计值,叫回归系数.
10.独立性检验
(1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量.
(2)两个分类变量 X 与 Y 的频数表,称作 2×2 列联表.
二.随机事件的概率
1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件.
(1)在条件 S 下,一定会发生的事件叫做相对于条件 S 的必然事件.
(2)在条件 S 下,一定不会发生的事件叫做相对于条件 S 的不可能事件.
(3)必然事件与不可能事件统称为确定事件.
(4)在条件 S 下可能发生也可能不发生的事件,叫做随机事件.
(5)确定事件和随机事件统称为事件,一般用大写字母 , , ,A B C 表示.
2.频率与概率
(1)在相同的条件 S 下重复 n 次试验,观察某一事件 A 是否出现,称 n 次试验中事件 A 出现
的次数 An 为事件 A 出现的频数,称事件 A 出现的比例 A
n
nf A n
为事件 A 出现的频率.
(2)对于给定的随机事件 A ,如果随着试验次数的增加,事件 A 发生的频率 nf A 稳定在某
个常数上,把这个常数记作 p A ,称为事件 A 的概率,简称为 A 的概率.
3.互斥事件与对立事件
互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即 A B 为不可
能事件( A B ),则称事件 A 与事件 B 互斥,其含义是:事件 A 与事件 B 在任何一次试
验中不会同时发生.
一般地,如果事件 1 2, , , nA A A 中的任何两个都是互斥的,那么就说事件 1 2, , , nA A A 彼此
互斥.
对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即 A B 为不可能
事件,而 A B 为必然事件,那么事件 A 与事件 B 互为对立事件,其含义是:事件 A 与事件 B
在任何一次试验中有且仅有一个发生.
互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.
两个事件互斥是两个事件对立的必要非充分条件.
4.事件的关系与运算
定义 符号表示
包含关系
如果事件 A 发生,则事件 B 一定发生,这时称事件 B 包含事
件 A (或称事件 A 包含于事件 B )
B A (或
A B )
相等关系 若 B A 且 A B ,那么称事件 A 与事件 B 相等 A B
并事件
(和事件)
若某事件发生当且仅当事件 A 发生或事件 B 发生,则称此事
件为事件 A 与事件 B 的并事件(或和事件)
A B
(或 A B )
交事件
(积事件)
若某事件发生当且仅当事件 A 发生且事件 B 发生,则称此事
件为事件 A 与事件 B 的交事件(或积事件)
A B (或
AB )
互斥事件 若 A B 为不可能事件,那么称事件 A 与事件 B 互斥 A B
对立事件
若 A B 为不可能事件, A B 为必然事件,那么称事件 A 与
事件 B 互为对立事件
A B 且
A B
5.随机事件的概率
事件 A 的概率:在大量重复进行同一试验时,事件 A 发生的频率
n
m 总接近于某个常数,在它
附近摆动,这时就把这个常数叫做事件 A 的概率,记作 p A .
由定义可知 0 1p A ,显然必然事件的概率是1,不可能事件的概率是 0 .
5.概率的几个基本性质
(1)概率的取值范围: 0 1p A .
(2)必然事件的概率: 1p A .
(3)不可能事件的概率: 0p A .
(4)互斥事件的概率加法公式:
① p A B p A p B ( ,A B 互斥),且有 1p A A p A p A .
② 1 2 1 2n np A A A p A p A p A ( 1 2, , , nA A A 彼此互斥).
(5)对立事件的概率: 1P A P A .
三.古典概型
1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件
A 由几个基本事件组成.如果一次试验中可能出现的结果有 n 个,即此试验由 n 个基本事件组
成,而且所有结果出现的可能性都相等,那么每一基本事件的概率都是
n
1 .如果某个事件 A 包
含的结果有 m 个,那么事件 A 的概率 P(A)=
n
m .
基本事件的特点
(1)任何两个基本事件是互斥的.
(2)任何事件都可以表示成基本事件的和(除不可能事件).
2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型.
①试验中所有可能出现的基本事件只有有限个,即有限性.
②每个基本事件发生的可能性相等,即等可能性.
概率公式:P(A)=A 包含的基本事件的个数
基本事件的总数
.
四.几何概型
1.(1)随机数的概念:
随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的.
(2)随机数的产生方法
①利用函数计算器可以得到 0~1 之间的随机数;
②在 Scilab 语言中,应用不同的函数可产生 0~1 或 a~b 之间的随机数.
2.几何概型
(1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,
则称这样的概率模型为为几何概率模型,简称几何概型.
(2)特点:①无限性:在一次试验中,可能出现的结果有无限多个;
②等可能性:每个结果的发生具有等可能性.
(3)几何概型的解题步骤:
首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问
题,与两个变量有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的
问题,先确定试验的全部结果和事件 A 构成的区域长度(角度、弧长等),最后代公式
p A 构成事件 A 的区域长度 面积或体积
试验的全部结果所构成的区域长度 面积或体积
;如果是二维、三维的问题,先
设出二维或三维变量,再列出试验的全部结果和事件 A 分别满足的约束条件,作出两个区域,
最后计算两个区域的面积或体积代公式.
(4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联
系.
3.几种常见的几何概型
(1)设线段 l 是线段 L 的一部分,向线段 L 上任投一点.若落在线段 l 上的点数与线段 L 的
长度成正比,而与线段 l 在线段 l 上的相对位置无关,则点落在线段 l 上的概率为:
P=l 的长度/L 的长度
(2)设平面区域 g 是平面区域 G 的一部分,向区域 G 上任投一点,若落在区域 g 上的点数与
区域 g 的面积成正比,而与区域 g 在区域 G 上的相对位置无关,则点落在区域 g 上概率为:
P=g 的面积/G 的面积
(3)设空间区域上 v 是空间区域 V 的一部分,向区域 V 上任投一点.若落在区域 v 上的点数
与区域v的体积成正比,而与区域v在区域v上的相对位置无关,则点落在区域V上的概率为:
P=v 的体积/V 的体积
五.条件概率
1.条件概率及其性质
(1)对于任何两个事件 A 和 B ,在已知事件 A 发生的条件下,事件 B 发生的概率叫做条件概
率,用符号 /p B A 来表示,其公式为
/ p ABp B A P A
.
在古典概型中,若用 n A 表示事件 A 中基本事件的个数,则
/ n ABp B A n A
.
(2)条件概率具有的性质:
① 0 / 1p B A ;
② 如果 B 和C 是两互斥事件,则 / / /p B C A p B A p C A .
2.相互独立事件
(1)对于事件 A 、 B ,若 A 的发生与 B 的发生互不影响,则称 A 、 B 是相互独立事件.
(2)若 A与 B 相互独立,则 /p B A p B ,
/p AB p B A P A P A P B .
(3)若 A与 B 相互独立,则 A与 B , A与 B , A与 B 也都相互独立.
(4)若 p AB P A P B ,则 A与 B 相互独立.
3.独立重复试验
独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验
中每一次试验只有两种结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是一
样的.
六.离散型随机变量的分布列
离散型随机变量的分布列
(1)随机变量
如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量,随机变量常用
字母 X,Y,ξ,η等表示.
(2)离散型随机变量
对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.
若 是随机变量, a b ,其中 ,a b 是常数,则 也是随机变量.
2.常见离散型随机变量的分布列
(1)两点分布:
若随机变量 X 服从两点分布,即其分布列为
X 0 1
P 1 p p
其中 0 1p ,则称离散型随机变量 X 服从参数为 p 的两点分布.其中 1p P X 称为
成功概率.
(2)超几何分布:
在含有 M 件次品的 N 件产品中,任取 n 件,其中恰有 X 件次品,则事件{ X k }发生的概
率为
k n k
M N M
n
N
C CP X k C
, 0,1,2, ,k m ,其中 min ,m M n ,且
, , , ,n N M N n M N N ,称分布列为超几何分布列.
X 0 1 … m
P
0 0n
M N M
n
N
C C
C
1 1n
M N M
n
N
C C
C
…
m n m
M N M
n
N
C C
C
(3)设离散型随机变量 X 可能取得值为 1x , 2x ,…, ix ,… nx , X 取每一个值 ix
( 1,2, ,i n )的概率为 i iP X x p ,则称表
X 1x 2x … ix … nx
P 1p 2p … ip … np
为随机变量 X 的概率分布列,简称 X 的分布列.有时为了表达简单,也用等式
i iP X x p , 1,2, ,i n 表示 X 的分布列.
分布列的两个性质
① 0ip , 1,2, ,i n ;② 1 2 1np p p .
七.二项分布:
1.离散型随机变量的二项分布:在一次随机试验中,某事件可能发生也可能不发生,在
n 次独立重复试验中这个事件发生的次数 是一个随机变量.如果在一次试验中某事件发
生的概率是 p ,那么在 n 次独立重复试验中这个事件恰好发生 k 次的概率是
knkk
nn qpCkP )( ,( 0,1,2,3,k …, pq 1 )于是得到随机变量 的概率分布
如下:
由于 knkk
n qpC
恰好是二项展开式
011100)( qpCqpCqpCqpCpq nn
n
knkk
n
n
n
n
n
n 中的各项的值,所以称
这样的随机变量 服从二项分布,记作 ,B n p ,其中 n , p 为参数,并记
knkk
n qpC = ; ,b k n p .…
2.二项分布的期望与方差:若 ,B n p ,则 E np , 1D np p
八.正态分布
1.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值
的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于
一条光滑曲线,这条曲线叫做总体密度曲线.
0 1 … k … n
P n
n qpC 00 111 n
n qpC … knkk
n qpC … 0qpC nn
n
它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概
率等于总体密度曲线,直线 ,x a x b 及 x 轴所围图形的面积.
2.正态分布密度函数:
2
22
,
1( )
2
x
x e
,( 0 , x )
其中π是圆周率; e 是自然对数的底; x 是随机变量的取值; 为正态分布的均值; 是
正态分布的标准差.正态分布一般记为 ),( 2N
正态分布的定义及表示
函数
,,
2
1)( 2
2
2
, xex
x
,其中实数 和 ( >0)为参数.我们称
)(, x 的图像为正态分布密度曲线,简称正态曲线.
如果对于任何实数 ,a b a b ,随机变量 X 满足 b
a
dxxbXaP ,)()( , 则称
随机变量 X 服从正态分布,正态分布完全由参数 , 确定,因此正态分布常记作
),( 2N ,如果随机变量 X 服从正态分布,则记为 X ~ ),( 2N .正态分布
),( 2N )是由均值 和标准差 唯一决定的分布
u=0
x
O
y
u=-1
x
O
y
u=1
x
O
y
3.正态曲线
,,
2
1)( 2
2
2
, xex
x
有以下性质:
(1)曲线位于 x 轴上方,与 x 轴不相交;
(2)曲线是单峰的,它关于直线 x 对称;
(3)曲线在 x 处达到峰值 1
σ 2π
;
(4)曲线与 x 轴围成的图形的面积为 1;
(5)当 一定时,曲线随着 的变化而沿 x 轴平移;
(6)当 一定时,曲线的形状由 确定, 越小,曲线越“瘦高”,表示总体的分布越集中;
越大,曲线越“矮胖”,表示总体的分布越分散.
4.正态总体在三个特殊区间内取值的概率值
①P(μ-σ