- 283.50 KB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
(六) 概率与统计中的高考热点问题
(对应学生用书第 193 页)
[命题解读] 1.概率与统计是高考中相对独立的一个内容,处理问题的方式、
方法体现了较高的思维含量.该类问题以应用题为载体,注重考查应用意识及阅
读理解能力、分类讨论与化归转化能力.2.概率问题的核心是概率计算,其中事件
的互斥、对立、独立是概率计算的核心,排列组合是进行概率计算的工具,统计
问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样
本的数字特征,但近两年全国卷突出回归分析与独立性检验的考查.3.离散型随机
变量的分布列及其均值的考查是历年高考的重点,难度多为中档类题目,特别是
与统计内容渗透,背景新颖,充分体现了概率与统计的工具性和交汇性.
统计与统计案例
以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出
估计、判断,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,
考查数据处理能力,分析问题,解决问题的能力.
(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的
产量对比,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),
其频率分布直方图如图 1 所示:
图 1
(1)设两种养殖方法的箱产量相互独立,记 A 表示事件“旧养殖法的箱产量
低于 50 kg,新养殖法的箱产量不低于 50 kg”,估计 A 的概率;
(2)填写下面列联表,并根据列联表判断是否有 99%的把握认为箱产量与养
殖方法有关;
箱产量<50 kg 箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精
确到 0.01).
附:
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
,K2= n(ad-bc)2
(a+b)(c+d)(a+c)(b+d).
[解] (1)记 B 表示事件“旧养殖法的箱产量低于 50 kg”,C 表示事件“新养
殖法的箱产量不低于 50 kg”.
由题意知 P(A)=P(BC)=P(B)P(C).
旧养殖法的箱产量低于 50 kg 的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故 P(B)的估计值为 0.62.
新养殖法的箱产量不低于 50 kg 的频率为
(0.068+0.046+0.010+0.008)×5=0.66,
故 P(C)的估计值为 0.66.
因此,事件 A 的概率估计值为 0.62×0.66=0.409 2.
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg 箱产量≥50 kg
旧养殖法 62 38
新养殖法 34 66
K2=200 × (62 × 66-34 × 38)2
100 × 100 × 96 × 104
≈15.705.
由于 15.705>6.635,故有 99%的把握认为箱产量与养殖方法有关.
(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于 50 kg 的直方图面
积为
(0.004+0.020+0.044)×5=0.34<0.5,
箱产量低于 55 kg 的直方图面积为
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新养殖法箱产量的中位数的估计值为 50+0.5-0.34
0.068
≈52.35(kg).
[规律方法] 1.独立性检验就是考察两个分类变量是否有关系,利用独立性检验,
能够帮助我们对日常生活中的实际问题作出合理的推断和预测,并能较为准确地
给出这种判断的可信度;具体做法是根据公式 K2= n(ad-bc)2
(a+b)(c+d)(a+c)(b+d),计
算随机变量的观测值 K2,K2 值越大,说明“两个变量有关系”的可能性越大.
2.频率分布直方图中的众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即是众数;
(2)平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标是中位
数;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的
面积乘以小长方形底边中点的横坐标之和.
[跟踪训练] (2018·成都二诊)某项科研活动共进行了 5 次试验,其数据如下
表所示:
特征量 第 1 次 第 2 次 第 3 次 第 4 次 第 5 次
x 555 559 551 563 552
y 601 605 597 599 598
(1)从 5 次特征量 y 的试验数据中随机地抽取两个数据,求至少有一个大于
600 的概率;
(2)求特征量 y 关于 x 的线性回归方程y^
=b^
x+a^
,并预测当特征量 x 为 570 时,
特征量 y 的值.
( 附 : 回 归 直 线 的 斜 率 和 截 距 的 最 小 二 乘 法 估 计 公 式 分 别 为 b^
=
∑
n
i=1 (xi-x)(yi-y)
∑
n
i=1 (xi-x)2
,a^
=y-b^
x)
[解] (1)记“至少有一个大于 600”为事件 A.
∴P(A)=1-C23
C25
= 7
10.
(2)x=555+559+551+563+552
5
=556,
y=601+605+597+599+598
5
=600.
∴b^
= -1 × 1+3 × 5+(-5) × (-3)+7 × (-1)+(-4) × (-2)
(-1)2+32+(-5)2+72+(-4)2
= 30
100
=0.3.
∵a^
=y-b^
x=600-0.3×556=433.2,
∴线性回归方程为y^
=0.3x+433.2.
当 x=570 时,y^
=0.3×570+433.2=604.2.
∴当 x=570 时,特征量 y 的估计值为 604.2.
常见概率模型的概率
几何概型、古典概型、相互独立事件与互斥事件的概率是高考的热点,几何
概型主要以客观题进行考查,求解的关键在于找准测度(面积、体积或长度);相
互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列、均值与
方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率
公式.
在某校教师趣味投篮比赛中,比赛规则是:每场投 6 个球,至少投
进 4 个球且最后 2 个球都投进者获奖;否则不获奖.已知教师甲投进每个球的概
率都是2
3.
(1)记教师甲在每场的 6 次投球中投进球的个数为 X,求 X 的分布列及均值;
(2)求教师甲在一场比赛中获奖的概率.
[解] (1)X 的所有可能取值为 0,1,2,3,4,5,6.
依 条 件 可 知 , X ~ B(6,2
3), P(X = k) = Ck6·(2
3 )
k
·(1
3 )
6-k
(k =
0,1,2,3,4,5,6).
所以 X 的分布列为
X 0 1 2 3 4 5 6
P 1
729
4
243
20
243
160
729
80
243
64
243
64
729
故 E(X)= 1
729(0×1+1×12+2×60+3×160+4×240+5×192+6×64)=
2 916
729
=4.或因为 X~B6,2
3
,所以 E(X)=6×2
3
=4.
(2)设教师甲在一场比赛中获奖为事件 A,
则 P(A)=C24·(1
3 )
2
·(2
3 )
4
+C14·1
3·(2
3 )
5
+(2
3 )
6
=32
81
,即教师甲在一场比
赛中获奖的概率为32
81.
[规律方法] 首先判断随机变量 X 服从二项分布是问题解决的突破口,对于实际
问题中的随机变量 X,如果能够断定它服从二项分布 B(n,p),则其概率、均值
与方差可直接利用公式 P(X=k)=Cknpk(1-p)n-k(k=0,1,2,…,n),E(X)=np,
D(X)=np(1-p)求得,因此,利用二项分布的相关公式,可以避免烦琐的运算过
程,提高运算速度和准确度.
[跟踪训练] 甲、乙两班进行消防安全知识竞赛,每班出 3 人组成甲乙两支
代表队,首轮比赛每人一道必答题,答对则为本队得 1 分,答错或不答都得 0 分,
已知甲队 3 人每人答对的概率分别为3
4
,2
3
,1
2
,乙队每人答对的概率都是2
3
,设每人
回答正确与否相互之间没有影响,用 ξ 表示甲队总得分.
(1)求 ξ=2 的概率;
(2)求在甲队和乙队得分之和为 4 的条件下,甲队比乙队得分高的概率.
[解] (1)ξ=2,则甲队有两人答对, 一人答错,
故 P(ξ=2)=3
4
×2
3
×(1-1
2)+3
4
×(1-2
3)×1
2
+(1-3
4)×2
3
×1
2
=11
24
;
(2)设甲队和乙队得分之和为 4 为事件 A,甲队比乙队得分高为事件 B.设乙
队得分为 η,则 η~B(3,2
3).
P(ξ=1)=3
4
×(1-2
3)×(1-1
2)+(1-3
4)×2
3
×(1-1
2)+(1-3
4)×(1-2
3)×1
2
=1
4
,
P(ξ=3)=3
4
×2
3
×1
2
=1
4
,
P(η=1)=C13·2
3·(1
3 )
2
=2
9
,
P(η=2)=C23·(2
3 )
2
·1
3
=4
9
,
P(η=3)=C33(2
3 )
3
= 8
27
,
∴P(A)=P(ξ=1)P(η=3)+P(ξ=2)P(η=2)+P(ξ=3)·P(η=1)= 1
4
× 8
27
+11
24
×
4
9
+1
4
×2
9
=1
3
,
P(AB)=P(ξ=3)·P(η=1)=1
4
×2
9
= 1
18
,
∴所求概率为 P(B|A)=P(AB)
P(A) =
1
18
1
3
=1
6.
离散型随机变量的分布列、均值和方差的应用
(答题模板)
离散型随机变量及其分布列、均值与方差及应用是高考的一大热点,每年均
有解答题,属于中档题.复习时应强化应用题的理解与掌握,弄清随机变量的所
有取值是正确列随机变量分布列和求均值与方差的关键,对概率的确定与转化是
解题的基础,准确计算是解题的核心.
(本小题满分 12 分)(2016·全国卷Ⅰ)某公司计划购买 2 台机器,该种
机器使用三年后即被淘汰.
机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个
200 元.在机器使用期间,如果备件不足再购买,则每个 500 元.①
现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了 100 台
这种机器在三年使用期内更换的易损零件数,得下面如图 2 所示的柱状图:②
图 2
以这 100 台机器更换的易损零件数的频率代替 1 台机器更换的易损零件数
发生的概率,记 X 表示 2 台机器三年内共需更换的易损零件数,③
n 表示购买 2 台机器的同时购买的易损零件数.
(1)求 X 的分布列;
(2)若要求 P(X≤n)≥0.5,④确定 n 的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在 n=19 与 n=20 之中
选其一,应选用哪个?
[审题指导]
题眼 挖掘关键信息
① 看到这种条件,想到解题时可能要分类求解.
② 看到柱状图想到频数与频率间的关系,想到横轴中的取值含义.
③ 看到自变量 X 想到柱状图,想到 X 的所有可能取值.
④ 看到 P(X≤n)≥0.5 想到 X 和 n 的含义,想到(1)中的分布列.
[规范解答] (1)由柱状图及以频率代替概率可得,一台机器在三年内需更换
的易损零件数为 8,9,10,11 的概率分别为 0.2,0.4,0.2,0.2. 1 分
由题意可知 X 的所有可能取值为 16,17,18,19,20,21,22.⑤
从而 P(X=16)=0.2×0.2=0.04;
P(X=17)=2×0.2×0.4=0.16;
P(X=18)=2×0.2×0.2+0.4×0.4=0.24;
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;
P(X=20)=2×0.2×0.4+0.2×0.2=0.2;
P(X=21)=2×0.2×0.2=0.08;
P(X=22)=0.2×0.2=0.04. 4 分
所以 X 的分布列为
X 16 17 18 19 20 21 22
P 0.04 0.16 0.24 0.24 0.2 0.08 0.04
6 分
(2)由(1)知P(X ≤ 18)=0.44,P(X ≤ 19)=0.68,⑥
故 n 的最小值为 19. 7 分
(3)记 Y 表示 2 台机器在购买易损零件上所需的费用(单位:元).
当n=19时,⑦
E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+
(19×200+3×500)×0.04=4 040; 9 分
当n=20时,⑧
E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=
4 080. 11 分
可知当 n=19 时所需费用的期望值小于当 n=20 时所需费用的期望值,故应
选 n=19. 12 分
[阅卷者说]
易错点 防范措施
⑤忽视 X 的实际含义导致取值
错误,进而导致概率计算错误.
细心审题,把握题干中的重要字眼,关键
处加标记,同时理解 X 取每个值的含
义.
⑥忽视 P(X≤n)≥0.5 的含义,
导致不会求解.
结合(1)中的分布列及 n 的含义,推理求解
便可.
⑦、⑧忽视 n=19 与 n=20 的
含义导致无法解题.
本题中购买零件所需费用包含两部分,一
部分为购买机器时购买零件的费用,另一
部分为备件不足时额外购买的费用.
[规律方法] 解答离散型随机变量的分布列及相关问题的一般思路:
(1)明确随机变量可能取哪些值.
(2)结合事件特点选取恰当的计算方法计算这些可能取值的概率值.
(3)根据分布列和均值、方差公式求解.
易错警示:明确离散型随机变量的取值及事件间的相互关系是求解此类问题的关
键.
[跟踪训练] 某网站用“10 分制”调查一社区人们的治安满意度.现从调查
人群中随机抽取 16 名,如图 3 茎叶图记录了他们的治安满意度分数(以小数点前
的一位数字为茎,小数点后的一位数字为叶).
图 3
(1)若治安满意度不低于 9.5 分,则称该人的治安满意度为“极安全”.求从
这 16 人中随机选取 3 人,至多有 1 人是“极安全”的概率;
(2)以这 16 人的样本数据来估计整个社区的总体数据,若从该社区(人数很多)
中任选 3 人,记 X 表示抽到“极安全”的人数,求 X 的分布列、均值与方差.
【导学号:97190386】
[解] (1)设 Ai 表示所取 3 人中有 i 个人是“极安全”,且 i=0,1,2,3.至多有 1
人是“极安全”记为事件 A,则 A=A0+A1,
所以 P(A)=P(A0)+P(A1)=C 312
C 316
+C 212C14
C 316
=121
140.
(2)由茎叶图可知,16 人中任取 1 人是“极安全”的概率
P= 4
16
=1
4
,依题意,X~B(3,1
4),
则 P(X=k)=Ck3(1
4 )
k
(3
4 )
3-k
,k=0,1,2,3.
所以 P(X=0)=(3
4 )
3
=27
64
,
P(X=1)=C13×1
4
×(3
4 )
2
=27
64
,
P(X=2)=C23×(1
4 )
2
×3
4
= 9
64
,P(X=3)=(1
4 )
3
= 1
64.
X 的分布列为
X 0 1 2 3
P 27
64
27
64
9
64
1
64
E(X)=0×27
64
+1×27
64
+2× 9
64
+3× 1
64
=3
4.
或 E(X)=np=3
4.
D(X)=np(1-p)=3×1
4
×(1-1
4)= 9
16.
概率与统计的综合应用
概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮
点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键,
复习时要在这些图表上下功夫,把这些统计图表的含义弄清楚,在此基础上掌握
好样本特征数的计数方法、各类概率的计算方法及均值与方差的运算.
(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验
员每天从该生产线上随机抽取 16 个零件,并测量其尺寸(单位:cm).根据长期
生产经验,可以认为这条生产线在正常状态下生产的零件的尺寸服从正态分布
N(μ,σ2).
(1)假设生产状态正常,记 X 表示一天内抽取的 16 个零件中其尺寸在(μ-3σ,
μ+3σ)之外的零件数,求 P(X≥1)及 X 的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认
为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进
行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的 16 个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26
9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得x= 1
16∑
16
i=1xi=9.97,s= 1
16∑
16
i=1 (xi-x)2= 1
16( ∑
16
i=1x2i-16x2)≈0.212,
其中 xi 为抽取的第 i 个零件的尺寸,i=1,2,…,16.
用样本平均数x作为 μ 的估计值μ^
,用样本标准差 s 作为 σ 的估计值σ^
,利用
估计值判断是否需对当天的生产过程进行检查.剔除(μ^
-3σ^
,μ^
+3σ^
)之外的数据,
用剩下的数据估计 μ 和 σ(精确到 0.01).
附:若随机变量 Z 服从正态分布 N(μ,σ2),则 P(μ-3σ