- 2.38 MB
- 2021-07-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
复习指导系列一
统计与概率
统计与概率在高考考查中一般有一道选择题或填空题、一道解答题,共2道题,分值为17分.高考对这一部分的考查难度相对稳定,选择、填空题为容易题, 解答题为中等难度题.选择题在前六题的位置,填空题在前二题的位置,解答题在前三题的位置.选择、填空题常考古典概型、几何概型(理 时而考查对立事件、相互独立事件概率及独立重复试验的概率);解答题以频率分布表、频率分布直方图、柱形图、折线图、茎叶图等五个样本频率分布图表为载体,理 侧重考查随机变量的分布列及期望,文 侧重考查样本数字特征的应用,突出了对应用意识、数据处理能力及创新能力的考查.下面对学生存在的主要问题进行剖析,并提出相应的教学对策.
一、存在的问题及原因分析
1.概念理解不透
本专题中,概念理解不到位的有事件、模型的判断等;容易混淆的概念有互斥事件与对立事件、超几何分布与二项分布、二项展开式的通项公式与次独立重复试验中事件发生次的概率等.
【例1】已知5只动物中有1只患有某种疾病,需要通过化验血液 确定患病的动物.血液化验结果呈阳性的即为患病动物,呈阴性的即没患病.下面是两种化验方案
方案甲 逐个化验,直到能确定患病动物为止.
方案乙 先任取3只,将它们的血液混在一起化验.若结果呈阳性则表明患病动物为这3只中的1只,然后再逐个化验,直到能确定患病动物为止;若结果呈阴性,则在另外2只中任取l只化验.
(Ⅰ)求依方案甲所需化验次数不少于依方案乙所需化验次数的概率;
(Ⅱ)表示依方案乙所需化验次数,求的期望.
【解析】(Ⅰ)设、已分别表示依方案甲和依方案乙需化验的次数,表示对应的概率,则方案甲中的分布列为
1
2
3
4
方案乙中的分布列为
1
2
3
若甲化验的次数不少于乙化验的次数,则
.
(Ⅱ).
【评析】本题易错的主要原因是对事件不清.对于方案甲,患有疾病的一只动物在每一次化验时出现的概率是等可能的,学生对事件不清,易误认为化验次数的可能取值是1,2,3,4,5,且.事实上,若前4次化验为阴性,第5次不需再化验即知最后一只是患病动物,所以化验次数只能取l,2,3,4.类似地,对于方案乙,第一次化验呈阳性,再化验3只中的前2只呈阴性后也不需再化验,或第一次化验呈阴性,再化验另外2只中的第l只呈阴性或阳性后也不需再化验,即只能取2,3.在解决问题时,要理清事件,求随机变量的分布列时,要弄清随机变量可能取到的每一个值以及取每一个值时所表示的意义,然后再利用所学的概率知识求出随机变量取每一个值时的概率,从而求出分布列.
2.审题析题不到位
审题析题不清是本专题解答错误的主要原因,主要包括题意不清,茫然作答;阅读肤浅,丢失信息;条件欠缺,鲁莽下笔;图形不准,缺乏严密;方向不明,目标模糊等情况.审题不清的最主要原因在于学生的阅读理解能力欠缺.
【例2】(2017年全国卷Ⅰ理19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位 cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布.
(Ⅰ)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在之外的零件数,求及的数学期望;
(Ⅱ)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,其中为抽取的第
个零件的尺寸,.用样本平均数作为的估计值,用样本标准差作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除之外的数据,用剩下的数据估计和(精确到0.01).
附 若随机变量服从正态分布,则,
,.
【解析】(Ⅰ)抽取的一个零件的尺寸在之内的概率为0.9974,从而零件的尺寸在之外的概率为0.0026,故,
因此,的数学期望为.
(Ⅱ)(i)如果生产状态正常,一个零件尺寸在之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
(ii)由,得的估计值为的估计值为,由样本数据可以看出有一个零件的尺寸在之外,因此需对当天的生产过程进行检查.
剔除之外的数据9.22,剩下数据的平均数为
因此的估计值为10.02.,
剔除之外的数据9.22,剩下数据的样本方差为
,因此的估计值为.
【评析】面对试题中冗长的文字表述,学生方寸大乱,不知所措,从而失去读题、解题信心;没有形成通读全题的习惯,未能发现试题所附相关公式;未能根据试题提供的相关公式,提取零件的尺寸在之外的概率为0.0026;未能准确把握较长问句“生产线在这一天的生产过程可能出现了异常情况”的关键词等,导致回答问题含混不清、词不达意.
3.读图识图能力弱
学生面对一堆数据无从下手,主要原因是对数据、图表的直观印象和积累储备的知识经验不够;没有形成“用数据说话”的统计观念;对抽象数据的数字特征理解不到位.
【例3】(2016年全国卷Ⅲ理4)某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中点表示十月的平均最高气温约为,点表示四月的平均最低气温约为.下面叙述不正确的是( )
(A)各月的平均最低气温都在以上
(B)七月的平均温差比一月的平均温差大
(C)三月和十一月的平均最高气温基本相同 (D)平均最高气温高于的月份有5个
【解析】由图可知均在虚线框内,所以各月的平均最低气温都在以上,A正确;由图可知七月的平均温差大于,而一月的平均温差小于,B正确;由图可知三月和十一月的平均最高气温都大约在,基本相同,C正确;由图可知平均气温高于的月份只有7、8两个月,D错误.
【评析】解答本题错误主要是读图识图能力弱,对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;其次,不会从图表中读取有用数据并进行判断;第三,估计平均温差时易出现错误,错选B.
4.知识缺漏较严重,特别是“冷门知识”缺失
从学生认知的方面看,学生对相关的概念、公式理解掌握不到位,知识缺漏较严重,如对正态分布、条件概率等概念不清楚.另一方面由于老师淡化章节阅读与思考、实习作业等教学,导致学生忽视了相关“冷门知识”的学习,如相关系数等.
【例4】(2012年课标Ⅰ文3)在一组样本数据,,…,(,,,…,不全相等)的散点图中,若所有样本点()都在直线上,则这组样本数据的样本相关系数为 ( )
(A) (B) (C) (D)
【评析】错误的原因在于学生对相关系数这一概念不清楚,导致无从下手.全国Ⅰ卷在2014年及2017年理 均考查到正态分布、2015年文理 考查非线性回归转化线性回归、2012年及2017年文 均考查相关系数等,这个问题应值得引起我们关注.在复学过程中,应关注阅读与思考、实习作业等教学,应注意对学生的认知进行补缺补漏,如正态分布、条件概率、相关系数、残差图、拟合效果等知识.
5.解题规范性较差
涉及本专题内容的考查,学生失误和失分最多的是会而不对、对而不全和全而不准,如不能用字母表示事件,导致在利用简单事件表示复杂事件书写混乱;解答过程缺失关键步骤,丢三落四,导致丢分等.
【例5】端午节吃粽子是我国的传统习俗,设一盘中装有10个粽子,其中豆沙粽2个,肉粽3个,白粽5个,这三种粽子的外观完全相同,从中任意选取3个.
(Ⅰ)求三种粽子各取到1个的概率;
(Ⅱ)设表示取到的豆沙粽个数,求X的分布列与数学期望.
【解析】(Ⅰ)设A表示事件“三种粽子各取到l个”,
则由古典概型的概率计算公式有.
(Ⅱ)的所有可能值为,
则,,,
所以的分布列为
1
2
3
故个.
【评析】从解题规范方面看,学生常出现错误有,没有用字母表示事件,即缺少“设A表示事件‘三种粽子各取到l个’”这一步骤;直接写出,过程没写出 ,应写为,一但答案错误,就失去过程分数;忽视“的所有可能值为”,导致丢分等.
6. 运算能力弱
运算求解能力主要是指会根据法则、公式进行正确运算、变形和数据处理,能根据问题的条件寻找与设计合理、简捷的运算途径,能根据要求对数据进行估计和近似计算.本专题中,学生运算能力弱主要体现在不能根据问题的条件寻找与设计合理、简捷的运算途径,不能根据要求对数据进行估计和近似计算.
【例6】(2017年全国卷Ⅰ文19)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位 cm).下面是检验员在一天内依次抽取的16个零件的尺寸
抽取次序
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,其中为抽取的第个零件的尺寸,.
(Ⅰ)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若
,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(Ⅱ)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附 样本的相关系数..
【解析】(Ⅰ)由样本数据得的相关系数为.
由于,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(Ⅱ)(i)由于,由样本数据可以看出抽取的第13个零件的尺寸在以外,因此需对当天的生产过程进行检查.
(ii)剔除离群值,即第13个数据,剩下数据的平均数为,这条生产线当天生产的零件尺寸的均值的估计值为10.02,,
剔除第13个数据,剩下数据的样本方差为.
这条生产线当天生产的零件尺寸的标准差的估计值为.
【评析】从运算方面看,学生不懂从中解出;不会计算的值,不懂根据保留小数点后两位的要求,实施近似处理以简化运算;不懂直接由采用放缩方法判断是否满足
;不会由和计算出区间的端点值;计算时,不懂得先做相反数相消处理或各项统一分离后转化为计算;计算时,不懂得转化为,再利用简化运算;计算
,不懂得各项统一提取的技巧;计算时,不懂得在保证精确度要求的前提下作近似处理以简化运算.
二、解决问题的思考与对策
1.关注统计图表的教学
高考试卷的解答题往往以频率分布表、频率分布直方图、柱形图、折线图、茎叶图五个样本频率分布图表为载体,理 侧重考查随机变量的分布列及期望,文 侧重考查样本数字特征的应用,突出了对应用意识、数据处理能力及创新能力的考查.复习过程中,应充分利用五个样本频率分布图表,让学生会图表中读取有用数据,或根据问题需要选择合适图表,依据统计学中的方法对数据进行分析,作出合理的决策.
【例7】【2015年全国卷Ⅱ文、理3】根据下面给出的2004年至2013年我国二氧化硫排放量(单位 万吨)柱形图.以下结论不正确的是( )
2004年
2005年
2006年
2007年
2008年
2009年
2010年
2011年
2012年
2013年
1900
2000
2100
2200
2300
2400
2500
2600
2700
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以 我国二氧化硫年排放量呈减少趋势
D.2006年以 我国二氧化硫年排放量与年份正相关
【解析】对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,正确;对于B选项,由图知,由2006年到2007年矩形高度明显下降,正确;对于
C选项,由图知,从2006年以后除2011年稍有上升外,其余年份都是逐年下降,C正确;由图知,2006年以 我国二氧化硫年排放量与年份负相关,D错误.
2.关注样本数字特征的含义
在复习中,应关注众数、中位数、平均数(期望)、方差与标准差有的含义,并能根据解决问题的需要选择合理的数字特征说明问题.
【例8】【2014年课标卷Ⅱ文19】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下
(Ⅰ)分别估计该市的市民对甲、乙部门评分的中位数;
(Ⅱ)分别估计该市的市民对甲、乙部门的评分高于90的概率;
(Ⅲ)根据茎叶图分析该市的市民对甲、乙两部门的评价.
【解析】(Ⅰ)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75. 50位市民对乙部门的评分由小到大排序,排在第25,26位 的是66,68,故样本中位数为,所以该市的市民对乙部门评分的中位数的估计值是67.
(Ⅱ)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为,,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为,.
(Ⅲ)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注 考生利用其他统计量进行分析,结论合理的同样给分)
3. 厘清事件及其概率
复习过程中,应厘清事件间的关系,准确计算相关事件的概率.特别要求学生能将复杂事件进行分解,先分解为互斥事件,每个互斥事件又分解为两个相互独立事件的积事件.
【例9】(2013年全国卷Ⅰ理19)一批产品需要进行质量检验,检验方案是 先从这批产品中任取4件作检验,这4件产品中优质品的件数记为.如果,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为
,即取出的每件产品是优质品的概率都为,且各件产品是否为优质品相互独立.
(Ⅰ)求这批产品通过检验的概率;
(Ⅱ)已知每件产品的检验费用为100元,且抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位 元),求X的分布列及数学期望.
【解析】(Ⅰ)设第一次取出的4件产品中恰有3件优质品为事件A1,第一次取出的4件产品全是优质品为事件A2,第二次取出的4件产品都是优质品为事件B1,第二次取出的1件产品是优质品为事件B2,这批产品通过检验为事件A,依题意有A=(A1B1)∪(A2B2),且A1B1与A2B2互斥,
所以P(A)=P(A1B1)+P(A2B2)=P(A1)P(B1|A1)+P(A2)P(B2|A2)=.
(Ⅱ)X可能的取值为400,500,800,并且P(X=400)=,P(X=500)=,P(X=800)=,
所以X的分布列为
X
400
500
800
P
EX==506.25.
4.关注概率模型的识别与应用
复习过程中,应关注概率模型的识别与应用,一定要注意弄清题意,找出题中的关键字词,厘清各种概率模型及适用范围.如超几何分布和二项分布是教材中两个重要概率分布,二项分布与超几何分布的区别为,二项分布是有放回的抽样,每做一次事件,事件A发生的概率是相同的;超几何分布是不放回的抽样,每做一次事件,事件A发生的概率是不相同的.
【例10】某食品厂为了检查一条自动包装流水线的生产情况,从该流水线上随机抽取40件产品作为样本,测得它们的重量(单位 克),将重量按如下区间分组 ,,,,,得到样本的频率分布直方图(如图所示).若规定重量超过495克但不超过510克的产品为合格产品,且视频率为概率,回答下列问题
(Ⅰ)在上述抽取的40件产品中任取2件,设为合格产品的数量,求的分布列和数学期望;
(Ⅱ)若从流水线上任取3件产品,求恰有2件合格产品的概率.
【解析】(Ⅰ)由样本的频率分布直方图得,合格产品的频率为.
所以抽取的40件产品中,合格产品的数量为. 则可能的取值为0,1,2,
所以;;,
因此的分布列为
0
1
2
故数学期望.
(Ⅱ)因为从流水线上任取1件产品合格的概率为,
所以从流水线上任取3件产品,恰有2件合格产品的概率为.
5.关注用样本估计总体的思想分析解决问题
复习过程中,应让学生掌握,为了考察一个总体的情况,在统计中通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况.这种估计大体分为两类 用样本的频率分布估计总体的分布、用样本的数字特征估计总体的数字特征.其次,“预测与决策”与人们的生活休戚相关.随着社会的不断进步,人们对许多实际问题会有多种解决方案,但哪种方案最有利于解决问题,需要进行 学的决策.而通过期望、方差等的计算,并进行大小比较,就是其中的一种 学预测与决策的手段.
【例11】【2016年课标Ⅰ理19】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记表示2台机器三年内共需更换的易损零件数,表示购买2台机器的同时购买的易损零件数.
(Ⅰ)求的分布列;
(Ⅱ)若要求,确定的最小值;
(Ⅲ)以购买易损零件所需费用的期望值为决策依据,在与之中选其一,应选用哪个?
【解析】(Ⅰ)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,从而;;
;;
;;.
所以的分布列为
16
17
18
19
20
21
22
(Ⅱ)由(Ⅰ)知,,故的最小值为19.
(Ⅲ)记表示2台机器在购买易损零件上所需的费用(单位 元).
当时,.
当时,.
可知当时所需费用的期望值小于时所需费用的期望值,故应选.
6.关注“冷门”知识的复习
高考是对高中阶段学习结果的大检阅,统计与概率的考查,在突出核心知识考查的同时,也关注知识点的覆盖面.因此,在复习教学中,要全面检索高中阶段的所有知识,特别是不能忽视对所谓的“冷门知识”的复习,如正态分布、条件概率、相关系数、残差图、拟合效果等.
【例12】【2015年课标Ⅰ理18】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位 千元)对年销售量(单位 )和年利润(单位 千元)的影响,对近8年的年宣传费和年销售量()数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
56.3
6.8
289.8
1.6
1469
108.8
表中,
(Ⅰ)根据散点图判断,y与哪一个适宜作为年销售量关于年宣传费的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立关于的回归方程;
(Ⅲ)以知这种产品的年利率与、的关系为.根据(Ⅱ)的结果回答下列问题
(i)年宣传费时,年销售量及年利润的预报值是多少?
(ii)年宣传费为何值时,年利率的预报值最大?
附 对于一组数据,,其回归直线的斜率和截距的最小二乘估计分别为,.
【解析】(Ⅰ)由散点图可以判断,适宜作为年销售量关于年宣传费的回归方程类型.
(Ⅱ)令,先建立关于的线性回归方程.
由于,,
所以关于的线性回归方程为,因此关于的回归方程为.
(Ⅲ) (i)由(Ⅱ)知,当时,年销售量的预报值,
年利润的预报值.
②根据(Ⅱ)的结果知,年利润的预报值,
所以当,即时,取得最大值.
7.加强阅读理解能力培养与训练
统计与概率进一步强化应用意识的考查,已成高考命题改革的必然趋势,试卷试题文字阅读量的逐年增加,或成高考试卷的发展趋势.复习中,应规范教学的阅读指导.应该呈现读题提取关键信息、析题形成解题思路、解题示范规范表达、反思积淀解题经验的“四步曲”完整过程,才能充分发挥解题教学的效益.其次,加强平时的阅读训练.需要适当增加平时作业习题的阅读量,尤其是应用性试题的读题训练,
提高学生的阅读理解能力及应试心态.
【例13】【2014年课标Ⅰ理18】从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图
(Ⅰ)求这500件产品质量指标值的样本平均数和样本方差(同一组数据用该区间的中点值作代表);
(Ⅱ)由频率分布直方图可以认为,这种产品的质量指标值服从正态分布,其中近似为样本平均数,近似为样本方差.
(i)利用该正态分布,求;
(ii)某用户从该企业购买了100件这种产品,记表示这100件产品中质量指标值为于区间(187.8,212.2)的产品件数,利用(i)的结果,求.
附 ≈12.2.若~,则=0.6826,=0.9544.
【解析】(Ⅰ) 抽取产品质量指标值的样本平均数和样本方差分别为
,
(Ⅱ)(ⅰ)由(Ⅰ)知~,
从而,
(ⅱ)由(ⅰ)知,一件产品中质量指标值为于区间(187.8,212.2)的概率为0.6826,
依题意知,所以.
8.规范答题表达形式
规范答题,一方面,思考问题要规范.也就是从知识的 头出发,弄清知识的 龙去脉.知识是怎么要求的,就怎么想、怎么用、怎么写,不能模棱两可,要会运用知识进行思考;另一方面,书写要规范.书写规范是一个重要的高考增分点,这一点应引起足够重视.如解题中应注意用字母表示事件,注意作答等.
【例14】(2015年全国卷Ⅱ理18)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下
A地区 62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89
B地区 73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79
(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可);
(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
记时间C “A地区用户的满意度等级高于B地区用户的满意度等级” .假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
【解析】(Ⅰ)略
(Ⅱ)记表示事件 “A地区用户的满意度等级为满意或非常满意”;
表示事件 “A地区用户的满意度等级为非常满意”;
表示事件 “B地区用户的满意度等级为不满意”;
表示事件 “B地区用户的满意度等级为满意”,
则与独立,与独立,与互斥,,
,
由所给数据得发生的频率分别为,
故,
所以.
三、典型问题剖析
典型一 关注统计图表应用
【例15】(2014年课标Ⅰ卷文18)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
频数
6
26
38
22
8
(Ⅰ)在答题卡上作出这些数据的频率分布直方图
(Ⅱ)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(Ⅲ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80 ”的规定?
【解析】 (Ⅰ)
(Ⅱ)质量指标值的样本平均数为.
质量指标值的样本方差为
.
(Ⅲ)质量指标值不低于95 的产品所占比例的估计值为 0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品“质量指标值不低于95 的产品至少要占全部产品80 ”的规定.
【评析】本题主要考查考查频数分布表、频率分布直方图、平均数、标准差以及概率.在能力层面上,结合频数分布表,考查对数据的处理能力,结合利用样本的数字特征估计总体的数字特征,考查了样本估计总体的思想;统计与概率问题离不开图表的“读”、“画”、“识”、“断”,“直观感知已知数据一动手操作体验数据一客观推断作出评价”是本题考查的一大特色,基于此,解题的关键是,以频数分布表为基础,要会画频率分布直方图,并能利用频率分布直方图计算平均数和方差,能结合样本数据对总体进行估计.应注意由于不能正确作出频率分布直方图引起的失分.
典型二 突出核心知识考查
【例15】(2017年课标Ⅲ卷理18)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位 ℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间,需求量为300瓶;如果最高气温低于20,需求量为200瓶,为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表
最高气温
天数
2
16
36
25
7
4
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(Ⅰ)求六月份这种酸奶一天的需求量(单位 瓶)的分布列;
(Ⅱ)设六月份一天销售这种酸奶的利润为(单位 元).当六月份这种酸奶一天的进货量(单位 瓶)为多少时,的数学期望达到最大值?
【解析】(Ⅰ)由题意知, 所有可能取值为200,300,500,由表格数据知
,,.
因此的分布列为
200
300
500
0.2
0.4
0.4
(Ⅱ)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑200500.
当时,
若最高气温不低于25,则;
若最高气温位于区间[20,25),则;
若最高气温低于20,则,
因此.
当时,
若最高气温不低于20,则;
若最高气温低于20,则,
因此,
所以时,的数学期望达到最大值,最大值为520元.
【评析】本题主要考查频数分布表、离散型随机分布列及期望、分段函数等;解题的关键在于根据频数分布表,正确列出随机变量的分布列;其次应对六月份这种酸奶一天的进货量进行合理的分类讨论;应注意由于所有可能取值计算错误引起的失分.
典型三 注重学 知识交会
【例15】(2016年全国卷Ⅰ文19)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位 元),表示购机的同时购买的易损零件数.
(Ⅰ)若=19,求y与x的函数解析式;
(Ⅱ)若要求“需更换的易损零件数不大于”的频率不小于0.5,求的最小值;
(Ⅲ)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
【解析】(Ⅰ)当时,;当时,,
所以y与x的函数解析式为
(Ⅱ)由柱状图知,需更换零件数不大于18的频率为0.46,不大于19的频率为0.7,故的最小值为19.
(Ⅲ)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800,20台的费用为4300,10台的费用为4800,因此这100台机器在购买易损零件上所需费用的平均数为.
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000,10台的费用为4500,因此这100台机器在购买易损零件上所需费用的平均数为.
比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
【评析】本题以购买机器易损零件的规划设计为背景,将统计与概率问题与简单优化问题自然融合,主要考查了分段函数、频率、随机变量数字特征等基础知识,综合考查学生的建模能力和运用所学数学分析与解决问题的能力.解题的关键在于根据读懂柱状图,其次在解决问题(Ⅲ)应能进行合理的分类讨论;
应注意由于若对题意及柱状图理解不到位,频率计算错误导致失分.
典型四 关注实际生活应用
【例15】(2017年省质检理18)某学校为鼓励家校互动,与某手机通讯商合作,为教师办理流量套餐.为了解该校教师手机流量使用情况,通过抽样,得到100位教师近2年每人手机月平均使用流量L(单位 M)的数据,其频率分布直方图如下
0.0008
100
200
300
400
500
600
流量L/M
0.0002
0.0022
0.0025
0.0035
700
若将每位教师的手机月平均使用流量分别视为其手机月使用流量,并将频率视为概率,回答以下问题
(Ⅰ)从该校教师中随机抽取3人,求这3人中至多有1人手机月流量不超过300M的概率;
(Ⅱ)现该通讯商推出三款流量套餐,详情如下
套餐名称
月套餐费(单位 元)
月套餐流量(单位 M)
A
20
300
B
30
500
C
38
700
这三款套餐都有如下附加条款 套餐费月初一次性收取,手机使用流量一旦超出套餐流量,系统就自动帮用户充值200M流量,资费20元,如果又超出充值流量,系统就再次自动帮用户充值200M流量,资费20元/次,以类类推.如果当月流量有剩余,系统将自动清零,无法转入次月使用.
学校欲订购其中一款流量套餐,为教师支付月套餐费,并承担系统自动充值的流量资费的75 ,其余部分由教师个人承担.问学校订购哪一款套餐最经济?说明理由.
【解析】(Ⅰ)记“从该校教师中随机抽取一名教师,该教师手机月流量不超过300M”为事件D.
依题意,.从该校教师中随机抽取3人,设这3人中至多有1人手机月流量不超过300M的人数为X, 则,
所以从该校教师中随机抽取3人,至多有1人手机月流量不超过300M的概率为
.
(Ⅱ) 依题意,从该校教师中随机抽取一名教师,该教师手机月流量的概率为;的概率为
当学校订购A套餐时,设学校为一位教师承担的月费用为元,则的所有可能取值为20,35,50,且,所以的分布列为
20
35
50
0.3
0.6
0.1
所以元
当学校订购B套餐时,设学校为一位教师承担的月费用为元,则的所有可能取值为30,45,且,所以的分布列为
30
45
0.9
0.1
所以元.
当学校订购C套餐时,设学校为一位教师承担的月费用为元,则的所有可能取值为33,且,所以元.
因为,所以学校订购B套餐最经济.
【评析】本题以生活中常见的手机月使用流量为背景,具有很强的现实意义和时代气息,不但考查了概率分布列、期望与方差,而且潜移默化地教给了考生一种决策的方法;解题的关键是应识别概率的模型,其次要选择哪个数字特征 解决问题;应注意由于不会根据解决问题的需要选择合理的数字特征说明问题引起的失分.
典型五 凸显数据处理能力
【例15】(2017年全国卷Ⅲ理3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位 万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
【解析】月接待游客量有增有减,A错误.
【评析】本题主要考查折线图,考查学生的数据处理能力;解题的关键是,要从大量数据中抽取对研究问题有用的信息,系统地整理和描述数据,做出合理推断,并能对推断做出符合实际的评价.应注意由于不能从大量数据中抽取对研究问题有用的信息进行分析推断引起的失分.
四、过关练习
【练习1】某省2015年全省高中男生身高统计调查数据显示 全省100000名男生的身高服从正态分布.现从某校高三年级男生中随机抽取50名测量身高,测量发现被测学生身高全部介于和之间,将测量结果按如下方式分成6组 第一组,第二组 ,,第6组,下图是按上述分组方法得到的频率分布直方图.
(Ⅰ)试评估我校高三年级男生在全省高中男生中的平均身高状况;
(Ⅱ)求这50名男生身高在以上()的人数;
(Ⅲ)在这50名男生身高在以上(含)的人中任意抽取2人,该2人中身高排名(以高到低)在全省前130名的人数记为,求的数学期望.
参考数据 若,,,
.
【解析】(Ⅰ)由直方图,经过计算我校高三年级男生平均身高为
,高于全省的平均值.
(Ⅱ)由频率分布直方图知,后两组频率为,人数为,
即这50名男生身高在以上(含)的人数为10人.
(Ⅲ)因为,
所以,.
所以,全省前130名的身高在以上,这50人中以上的有5人.
随机变量可取,于是,,,.
【练习2】未 制造业对零件的精度要求越 越高.打印通常是采用数字技术材料打印机 实现的,常在模具制造、工业设计等领域被用于制造模型,后逐渐用于一些产品的直接制造,已经有使用这种技术打印而成的零部件.该技术应用十分广泛,可以预计在未 会有广阔的发展空间.某制造企业向高校打印实验团队租用一台打印设备,用于打印一批对内径有较高精度要求的零件.该团队在实验室打印出了一批这样的零件,从中随机抽取件零件,度量其内径的茎叶图如如图3所示(单位 ) .
(Ⅰ) 计算平均值与标准差;
(Ⅱ) 假设这台打印设备打印出品的零件内径服从正态分布,该团队到工厂安装调试后,试打了个零件,度量其内径分别为(单位 ) 、、、、,试问此打印设备是否需要进一步调试,为什么?
参考数据 ,,,
,.
【解析】(Ⅰ),
, 所以.
(Ⅱ)结论 需要进一步调试.
解法一 理由如下 如果机器正常工作,则服从正态分布,
,
零件内径在之外的概率只有,
而,根据原则,知机器异常,需要进一步调试.
解法二 理由如下 如果机器正常工作,则服从正态分布,
.
正常情况下个零件中恰有一件内径在外的概率为
,
为小概率事件,而,小概率事件发生,说明机器异常,需要进一步调试.
解法三 理由如下 如果机器正常工作,则服从正态分布,
.
正常情况下件零件中恰有件内径在外的概率为
,
此为小概率事件,而,,小概率事件发生,说明机器异常,需要进一步调试.
【练习3】经销商经销某种农产品,在一个销售季度内,每售出该产品获利润500元,未售出的产品,每亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了该农产品.以(单位 ,)表示下一个销售季度内的市场需求量,(单位 元)表示下一个销售季度内经销该农产品的利润.
(Ⅰ)将表示为的函数;
(Ⅱ)根据直方图估计利润不少于元的概率;
(Ⅲ)在直方图的需求量分组中,以各组的区间中点值代表该组的各个需求量,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如 若,则取,且的概率等于需求量落入的概率),求的数学期望.
【解析】(Ⅰ)当时,,
当时,,
所以
(Ⅱ)由(Ⅰ)知,利润T不少于57000元当且仅当,
由直方图需求量的频率为,所以下一个销售季度内的利润T不少于57000元的概率的估计值为.
(Ⅲ)由题意知的分布列为
45000
53000
61000
65000
所以.
【练习4】心理学家分析发现视觉和空间能力与性别有关,某数学兴趣小组为了验证这个结论,从兴趣小组中按分层抽样的方法抽取50名同学 (男30女20), 给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表 (单位 人)
几何题
代数题
总计
男同学
22
8
30
女同学
8
12
20
总计
30
20
50
(Ⅰ)能否据此判断有97.5 的把握认为视觉和空间能力与性别有关?
(Ⅱ)经过多次测试后,甲每次解答一道几何题所用的时间在5—7分钟,乙每次解答一道几何题所用的时间在6—8分钟,现甲、乙各解同一道几何题,求乙比甲先解答完的概率.
(Ⅲ)现从选择做几何题的8名女生中任意抽取两人对她们的答题情况进行全程研究,记甲、 乙两女生被抽到的人数为X, 求X的分布列及数学期望E(X).
附表及公式
0.150
0.100
0.050
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【解析】(Ⅰ)由表中数据得的观测值,
所以根据统计有的把握认为视觉和空间能力与性别有关.
(Ⅱ)设甲、乙解答一道几何题的时间分别为分钟,
则基本事件满足的区域为(如图所示),
设事件为“乙比甲先做完此道题” 则满足的区域为,
由几何概型, 即乙比甲先解答完的概率为.
(Ⅲ)由题可知在选择做几何题的8名女生中任意抽取两人,抽取方法有种,其中甲、乙两人没有一个人被抽到有种;恰有一人被抽到有种;两人都被抽到有种,
所以可能取值为,, , ,
的分布列为
1
所以.
【练习5】某中药种植基地有两处种植区的药材需在下周一、周二两天内采摘完毕.基地员工一天可以完成一处种植区的采摘.由于下雨会影响药材品质,基地收益如下表所示
周一
无雨
无雨
有雨
有雨
周二
无雨
有雨
无雨
有雨
收益
20万元
15万元
10万元
7.5万元
若基地额外聘请工人,可在周一当天完成全部采摘任务.无雨时收益为20万元;有雨时收益为10万元.额外聘请工人的成本为万元.
巳知下周一和下周有雨的概率相同,两天是否下雨互不影响,基地收益为20万元的概率为.
(Ⅰ)若不额外聘请工人,写出基地收益的分布列及基地的预期收益;
(Ⅱ)该基地是否应该外聘工人,请说明理由.
【解析】(Ⅰ)设下周一有雨的概率为,由题意,,
基地收益的可能取值为,
则
所以基地收益的分布列为
20
15
10
7.5
0.36
0.24
0.24
0.16
基地的预期收益,
所以,基地的预期收益为万元.
(Ⅱ)设基地额外聘请工人时的收益为万元,则其预期收益(万元),
,
综上,当额外聘请工人的成本高于万元时,不外聘工人;成本低于万元时,外聘工人;成本恰为万元时,是否外聘工人均可以.
【练习6】某厂用鲜牛奶在某台设备上生产两种奶制品.生产1吨产品需鲜牛奶2吨,使用设备1小时,获利1000元;生产1吨产品需鲜牛奶1.5吨,使用设备1.5小时,获利1200元.要求每天产品的产量不超过产品产量的2倍,设备每天生产两种产品时间之和不超过12小时.假定每天可获取的鲜牛奶数量W(单位 吨)是一个随机变量,其分布列为
W
12
15
18
P
0.3
0.5
0.2
该厂每天根据获取的鲜牛奶数量安排生产,使其获利最大,因此每天的最大获利(单位 元)是一个随机变量.
(Ⅰ)求的分布列和均值;
(Ⅱ) 若每天可获取的鲜牛奶数量相互独立,求3天中至少有1天的最大获利超过10000元的概率.
【解析】(Ⅰ)设每天两种产品的生产数量分别为,相应的获利为,则有
(1)
第20题解答图1
第20题解答图2
第20题解答图3
目标函数为.
当时,(1)表示的平面区域如图1,三个顶点分别为.
将变形为,
当时,直线 在轴上的截距最大,
最大获利.
当时,(1)表示的平面区域如图2,三个顶点分别为.
将变形为,
当时,直线 在轴上的截距最大,
最大获利.
当时,(1)表示的平面区域如图3,四个顶点分别为.
将变形为,
当时,直线 在轴上的截距最大,
最大获利.
故最大获利的分布列为
8160
10200
10800
0.3
0.5
0.2
因此,
(Ⅱ)由(Ⅰ)知,一天最大获利超过10000元的概率,
由二项分布,3天中至少有1天最大获利超过10000元的概率为
.
(福建省高三毕业班复习教学指导组,执笔 林少安)