- 374.00 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
高考导航 1.概率与统计是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查学生的应用意识及阅读理解能力、分类讨论与化归转化能力;2.概率问题的核心是概率计算,其中事件的互斥、对立是概率计算的核心.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征.统计与概率内容相互渗透,背景新颖.
热点一 统计与统计案例(教材VS高考)
以统计图表或文字叙述的实际问题为载体,通过对相关数据的统计分析、抽象概括,作出估计、判断.常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查学生的数据处理能力与运算能力及应用意识.
【例1】 (2016·全国Ⅲ卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1 7分别对应年份2008 2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646.
参考公式:相关系数r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:
=,=-.
解 (1)由折线图中数据和附注中参考数据得
=4, (ti-)2=28,=0.55.
(ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,
r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1)得==≈0.103,
=-≈1.331-0.103×4≈0.92.
所以y关于t的回归方程为=0.92+0.10t.
将2016年对应的t=9代入回归方程得=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.
教材探源 1.本题源于教材(必修3P90例)有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
摄氏温度/℃
-5
0
4
7
12
15
19
23
27
31
36
热饮杯数
156
150
132
128
130
116
104
89
93
76
54
(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;
(3)求回归方程;(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数.
2.(1)考题以形求数,教材是由数到形再到数;(2)考题与教材都是“看图说话,回归分析预测”,但考题中以具体数字(相关系数)说明拟合效果,突显数学直观性与推理论证的巧妙融合,进一步考查考生的数据处理能力与运算能力及应用意识,源于教材,高于教材.
【训练1】 (2017·全国Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得=xi=9.97,s==≈0.212,≈18.439, (xi-)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①从这一天抽检的结果看,是否需对当天的生产过程进行检查?
②在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到0.01).
附:样本(xi,yi)(i=1,2,…,n)的相关系数r=,≈0.09.
解 (1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数
r=≈≈-0.18.
由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)①由于=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(-3s,+3s)以外.
因此需对当天的生产过程进行检查.
②剔除离群值,即第13个数据,剩下数据的平均数为
(16×9.97-9.22)=10.02,
这条生产线当天生产的零件尺寸的均值的估计值为10.02.
x≈16×0.2122+16×9.972≈1 591.134,
剔除第13个数据,剩下数据的样本方差为
(1 591.134-9.222-15×10.022)≈0.008,
这条生产线当天生产的零件尺寸的标准差的估计值为≈0.09.
热点二 实际问题中的概率计算
概率应用题侧重于古典概型,主要考查随机事件、等可能事件、互斥事件、对立事件的概率.解决简单的古典概型试题可用直接法(定义法),对于较为复杂的事件的概率,可以利用所求事件的性质将其转化为互斥事件或其对立事件的概率求解.
【例2】 (2018·石家庄调研)某出租车公司响应国家节能减排的号召,已陆续购买了140辆纯电动汽车作为运营车辆.目前我国主流纯电动汽车按续航里程数R(单位:千米)分为3类,即A类:80≤R<150,B类:150≤R<250,C类:R≥250.该公司对这140辆车的行驶总里程进行统计,结果如下表:
类型
A类
B类
C类
已行驶总里程不超过10万千米的车辆数
10
40
30
已行驶总里程超过10万千米的车辆数
20
20
20
(1)从这140辆汽车中任取一辆,求该车行驶总里程超过
10万千米的概率;
(2)公司为了了解这些车的工作状况,决定抽取14辆车进行车况分析,按表中描述的六种情况进行分层抽样,设从C类车中抽取了n辆车.
①求n的值;
②如果从这n辆车中随机选取两辆车,求恰有一辆车行驶总里程超过10万千米的概率.
解 (1)从这140辆汽车中任取一辆,则该车行驶总里程超过10万千米的概率为P1==.
(2)①依题意n=×14=5.
②5辆车中已行驶总里程不超过10万千米的车有3辆,记为a,b,c;
5辆车中已行驶总里程超过10万千米的车有2辆,记为m,n.
“从5辆车中随机选取两辆车”的所有选法共10种:ab,ac,am,an,bc,bm,bn,cm,cn,mn.
“从5辆车中随机选取两辆车,恰有一辆车行驶里程超过10万千米”的选法共6种:am,an,bm,bn,cm,cn,
则选取两辆车中恰有一辆车行驶里程超过10万千米的概率P2==.
探究提高 1.准确区分古典概型与几何概型,其本质区别在于试验结果是有限还是无限.
2.对于较复杂的古典概型的基本事件空间,最易出现“重”和“漏”,要避免这类错误,首先要正确理解题意,明确一些常见的关键词,如“至多”“至少”“只有”等;其次,要按一定的规律列举.
【训练2】 某校为了了解A,B两班学生寒假期间观看《中国诗词大会》的时长,分别从这两个班中随机抽取5名学生进行调查,将他们观看的时长(单位:小时)作为样本,绘制成茎叶图如图所示(图中的茎表示十位数字,叶表示个位数字).
(1)分别求出图中所给两组样本数据的平均值,并据此估计哪个班的学生平均观看的时间较长;
(2)从A班的样本数据中随机抽取一个不超过19的数据记为a,从B班的样本数据中随机抽取一个不超过21的数据记为b,求a>b的概率.
解 (1)A班样本数据的平均值为
(9+11+14+20+31)=17.
由此估计A班学生平均观看时间大约为17小时;
B班数据的平均值为(11+12+21+25+26)=19.
由此估计B班学生平均观看时间大约为19小时;
则19>17.
由此估计B班学生平均观看时间较长.
(2)A班的样本数据不超过19的数据a有3个,分别为9,11,14.
B班的样本数据中不超过21的数据b也有3个,分别为11,12,21,
从A班和B班的样本数据中各随机抽取一个共有9种不同情况,分别为(9,11),(9,12),(9,21),(11,11),(11,12),(11,21),(14,11),(14,12),(14,21),
其中a>b的情况有(14,11),(14,12)两种,
故a>b的概率P=.
热点三 概率与统计的综合问题(规范解答)
统计和概率知识相结合命制概率统计解答题已经是一个新的命题趋向,概率和统计初步综合解答题的主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键,在此基础上掌握好样本数字特征及各类概率的计算.
【例3】 (满分12分)(2018·豫北名校调研)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].
(1)求频率分布直方图中a的值;
(2)估计该企业的职工对该部门评分不低于80的概率;
(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.
满分解答 (1)因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a=0.006.
3分 (得分点1)
(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4.
所以该企业职工对该部门评分不低于80的概率的估计值为0.4.
5分 (得分点2)
(3)受访职工中评分在[50,60)的有:50×0.006×10=3(人),记为A1,A2,A3;
受访职工中评分在[40,50)的有:50×0.004×10=2(人),记为B1,B2,
8分 (得分点3)
从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2}.
11分 (得分点4)
又因为所抽取2人的评分都在[40,50)的结果有1种,即{B1,B2},故所求的概率为P=.
12分 (得分点5)
❶得步骤分:步骤规范,求解完整,解题步骤常见的失分点,第(2)问中,不能用频率估计概率,第(3)问中步骤不完整,没有指出“基本事件总数”与“事件M”包含的基本事件个数,或者只指出事件个数,没有一一列举10个基本事件及事件M包含的基本事件,导致扣3分或2分.
❷得关键分:如第(1)问中,正确求得a=0.006;第(3)问中列出10个基本事件,错写或多写,少写均不得分.
❸得计算分:如第(1)、(2)问中,要理清频率直方图的意义,计算正确,否则导致后续皆错大量失分,第(3)问中利用“频数、样本容量、频率之间的关系”求得各区间的人数,准确列出基本事件,正确计算概率.
第一步:由各矩形的面积之和等于1,求a的值.
第二步:由样本频率分布估计概率.
第三步:设出字母,列出基本事件总数及所求事件M所包含的基本事件.
第四步:利用古典概型概率公式计算.
第五步:反思回顾,查看关键点,易错点和答题规范.
【训练3】 (2018·江西九校联考)某校为了解学生对正在进行的一项教学改革的态度,从500名高一学生和400名高二学生中按分层抽样的方式抽取了45名学生进行问卷调查,结果可以分成以下三类:支持、反对、无所谓,调查结果统计如下:
支持
无所谓
反对
高一年级
18
x
2
高二年级
10
6
y
(1)①求出表中的x,y的值;
②从反对的同学中随机选取2人进一步了解情况,求恰好高一、高二各1人的概率;
(2)根据表格统计的数据,完成下面的2×2列联表,并判断是否有90 的把握认为持支持态度与就读年级有关(不支持包括无所谓和反对).
高一年级
高二年级
总计
支持
不支持
总计
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.10
0.05
0.01
k0
2.706
3.841
6.635
解 (1)①由题意x=×500-(18+2)=5,y=×400-(10+6)=4.
②假设高一反对的同学编号为A1,A2,高二反对的同学编号为B1,B2,B3,B4,
则选取两人的所有结果为(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A2,B1),(A2,B2),(A2,B3),(A2,B4),(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共15种情况.
可得恰好高一、高二各一人包含(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A2,B1),(A2,B2),(A2,B3),(A2,B4)共8种情况.
所以所求概率P=.
(2)如图2×2列联表:
高一年级
高二年级
总计
支持
18
10
28
不支持
7
10
17
总计
25
20
45
K2的观测值为k==2.288<2.706,
所以没有90 的把握认为持支持态度与就读年级有关.
1.(2018·安徽江南十校联考)为了对某校高三(1)班9月调考成绩进行分析,在全班同学中随机抽出5位,他们的数学分数、物理分数、化学分数(均已折算为百分制)对应如下表:
学生编号
1
2
3
4
5
数学分数x
75
80
85
90
95
物理分数y
73
77
80
87
88
化学分数
78
85
87
89
91
(1)求这5位同学数学和物理分数都不小于85分的概率;
(2)从散点图分析,y与x,x与 之间都有较好的线性相关关系,分别求y与x, 与x的线性回归方程,并用相关指数比较所求回归模型的拟合效果.
参考数据:=85,=81,=86, (xi-)(yi-)=200,
(xi-)2=250, (xi-)( i-)=150.
解 (1)这5位同学中数学和物理分数都不小于85分,共有2人,故概率为P=.
(2)设y与x, 与x的线性回归方程分别是=x+,=′x+′,
根据所得数据,可以计算出===0.8.
=-=81-0.8×85=13,
′===0.6,
′=-′=86-0.6×85=35,
∴=0.8x+13,=0.6x+35.
(yi-i)2=02+02+(-1)2+22+(-1)2=6,
(yi-)2=(-8)2+(-4)2+(-1)2+62+72=166;
( i-i)2=(-2)2+22+12+02+(-1)2=10,
( i-)2=(-8)2+(-1)2+12+32+52=100.
又y与x, 与x的相关指数分别是
R2=1-≈0.964,R2=1-≈0.90,
故回归模型=0.8x+13比回归模型=0.6x+35的拟合效果好.
2.(2018·贵阳调研)
微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.
(1)根据女性频率分布直方图估计女性使用微信的平均时间;
(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否有90 的把握认为“微信控”与“性别有关”?
解 (1)女性平均使用微信的时间为:
0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76(小时).
(2)由已知得:2(0.04+a+0.14+2×0.12)=1,解得a=0.08.
由题设条件得列联表
微信控
非微信控
总计
男性
38
12
50
女性
30
20
50
总计
68
32
100
K2的观测值为k=
=≈2.941>2.706.
所以有90 的把握认为“微信控”与“性别”有关.
3.(2018·北京东城区质检)某单位附近只有甲、乙两个临时停车场,它们各有50个车位,为了方便市民停车,某互联 停车公司对这两个停车场在某些固定时刻的剩余停车位进行记录,如下表:
时间
停车场
8时
10时
12时
14时
16时
18时
甲停车场
10
3
12
6
12
17
乙停车场
13
4
3
2
6
19
如果表中某一时刻剩余停车位数低于该停车场总车位数的10 ,那么当车主驱车抵达单位附近时,该公司将会向车主发出停车场饱和警报.
(1)假设某车主在以上六个时刻抵达单位附近的可能性相同,求他收到甲停车场饱和警报的概率;
(2)从这六个时刻中任选一个时刻,求甲停车场比乙停车场剩余车位数少的概率;
(3)当乙停车场发出饱和警报时,求甲停车场也发出饱和警报的概率.
解 (1)事件“该车主收到甲停车场饱和警报”只有10时这一种情况,该车主抵达单位的时刻共有六种情况,所以该车主收到甲停车场饱和警报的概率为P=.
(2)事件 “甲停车场比乙停车场剩余车位数少”有8时、10时、18时三种情况,一共有六个时刻,所以甲停车场比乙停车场剩余车位数少的概率为P==.
(3)事件“乙停车场发出饱和警报”有10时、12时、14时三种情况,事件“甲停车场也发出饱和警报”只有10时一种情况,所以当乙停车场发出饱和警报时,甲停车场也发出饱和警报的概率为P=.
4.(2016·全国Ⅰ卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
解 (1)当x≤19时,y=3 800;
当x>19时,y=3 800+500(x-19)=500x-5 700.
所以y与x的函数解析式为
y=(x∈N).
(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.
(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为
(3 800×70+4 300×20+4 800×10)=4 000,
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为
(4 000×90+4 500×10)=4 050.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
5.已知向量a=(-2,1),b=(x,y).
(1)若x,y分别表示将一枚质地均匀的正方体骰子(六个面的点数分别为1,2,3,4,5,6)先后抛掷两次时第一次、第二次出现的点数,求满足a·b=-1的概率;
(2)若x,y在连续区间[1,6]上取值,求满足a·b<0的概率.
解 (1)将一枚质地均匀的正方体骰子先后抛掷两次,所包含的基本事件总数为6×6=36(个);由a·b=-1,得-2x+y=-1,
用A表示事件“a·b=-1”,A包含的基本事件为(1,1),(2,3),(3,5),共3种情形.故P(A)==.
(2)若x,y在连续区间[1,6]上取值,则全部基本事件的结果为Ω={(x,y)|1≤x≤6,1≤y≤6};
满足a·b<0的基本事件的结果为A={(x,y)|1≤x≤6,1≤y≤
6且-2x+y<0};画出图形如图,正方形的面积为S正方形=25,
阴影部分的面积为S阴影=25-×2×4=21,
故满足a·b<0的概率为.
6.(2018·成都诊断)某项 研活动共进行了5次试验,其数据如下表所示:
特征量
第1次
第2次
第3次
第4次
第5次
x
555
559
551
563
552
y
601
605
597
599
598
(1)从5次特征量y的试验数据中随机地抽取两个数据,求至少有一个大于600的概率;
(2)求特征量y关于x的线性回归方程=x+,并预测当特征量x为570时,特征量y的值.
(附:回归直线的斜率和截距的最小二乘法估计公式分别为
=,=-)
解 (1)记“至少有一个大于600”为事件A.
基本事件有{601,605},{601,597},{601,599},{601,598},{605,597},{605,599},{605,598},{597,599},{597,598},{599,598},共10个.
其中包含事件A的基本事件有{601,605},{601,597},{601,599},{601,598},{605,597},{605,599},{605,598},共7个.
∴P(A)=.
(2)==556,
==600.
∴===0.3.
∵=-=600-0.3×556=433.2,
∴线性回归方程为=0.3x+433.2.
当x=570时,=0.3×570+433.2=604.2.
∴当x=570时,特征量y的估计值为604.2.