- 2.64 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
热点六 概率与统计解答题(文)
【名师精讲指南篇】
【高考真题再现】
1. 【2017课标1,文19】为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,其中为抽取的第个零件的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看, . 是否需对当天的生产过程进行检查?
(ⅱ)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:样本的相关系数,.
【解析】
(ii)剔除离群值,即第13个数据,剩下数据的平均数为,这条生产线当天生产的零件尺寸的均值的估计值为10.02.
,
剔除第13个数据,剩下数据的样本方差为,
这条生产线当天生产的零件尺寸的标准差的估计值为.
2.【2017课标II,文19】海水养殖场进行某水产品的新、旧 箱养殖方法的产量对比,收获时各随机抽取了100个 箱,测量各箱水产品的产量(单位: g), 其频率分布直方图如下:
(1) 记A表示事件“旧养殖法的箱产量低于50 g”,估计A的概率;
(2) 填写下面列联表,并根据列联表判断是否有99 的把握认为箱产量与养殖方法有关:
箱产量<50 g
箱产量≥50 g
旧养殖法
新养殖法
(3) 根据箱产量的频率分布直方图,对两种养殖方法的优劣进行较。
附:
P()
0.050
0.010
0.001
3.841
6.635
10.828
【解析】
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 g
箱产量≥50 g
旧养殖法
62
38
新养殖法
34
66
2=
由于15.705>6.635,故有99 的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图平均值(或中位数)在45 g到50 g之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
3.【2017课标3,文18】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7[ : XX ]
4
以最高气温位于各区间的频率代替最高气温位于该区间的概率。
(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出的所有可能值,并估计大于零的概率.
【解析】
试题解析:(1)需求量不超过300瓶,即最高气温不高于,从表中可知有54天,
∴所求概率为.
4【2016全国卷2文】某险种的基本保费为(单元:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
保 费
0.85a
a
1.25a
1.5a
1.75a
2a
随机调查了该险种的名续保人在一年内的出险情况,得到如下统计表:
出险次数
频数
(1)记为事件:“一续保人本年度的保费不高于基本保费”,求的估计值;
(2)记为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的”,求的估计值;
(3)求续保人本年度平均保费的估计值.
【解析】(1)由所给数据知,事件发生当且仅当一年内出险次数小于,所以.
(2)由所给数据知,事件发生当且仅当一年内出险次数大于等于且小于等于,所以.
(3)由题所求分布列为:
保 费
频率
调查名续保人的平均保费为:
.
5.【2016全国卷1文】某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图.
记表示台机器在三年使用期内需更换的易损零件数,表示台机器在购买易损零件上所需的费用(单位:元),表示购机的同时购买的易损零件数.
(1)若,求与的函数解析式;
(2)若要求 “需更换的易损零件数不大于”的频率不小于,求的最小值;
(3)假设这台机器在购机的同时每台都购买个易损零件,或每台都购买个易损零件,分别计算这台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买台机器的同时应购买个还是个易损零件?
【解析】(1)当时,(元);
当时,(元),
所以.
(2)由柱状图可知更换易损零件数的频率如表所示.
更换的易损零件数
16
17
18
19
20
21
频率
0.06
0.16
0.24
0.24
0.20
0.10
所以更换易损零件数不大于18的频率为:,
更换易损零件数不大于19的频率为:,故最小值为.
6.【2016全国卷3文】下图是我国年至年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码分别对应年份.
(1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程(系数精确到),预测年我国生活垃圾无害化处理量.
附注:
参考数据:,,,.
参考公式:相关系数
回归方程中斜率和截距的最小二乘估计公式分别为:
(2),,所以,
,所以线性回归方程为.
当时,.因此,我们可以预测年我国生活垃圾无害化处理亿吨.
【热点深度剖析】
从近几年的高考试题来看,古典概型、频率分布直方图、茎叶图、平均数、方差是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查 生应用知识解决问题的能力.根据近三年高考趋势预测2018年高考,概率、频率分布直方图、茎叶图、平均数、方差仍然是考查的热点,由于连续3年大题都没考古典概型,故应注意和概率知识的结合,同时应注意回归分析独立性检验在实际生活中的应用,有可能涉及一道与回归分析或独立检验有关的大题.
【重点知识整合】
一,统计初步
1.简单随机抽样
简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法.
2.系统抽样
(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.
(2)系统抽样的步骤:
①编号.采用随机的方式将总体中的个体编号.
②分段.先确定分段的间隔 .当(N为总体中的个体数,n为样本容量)是整数时, =;当不是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数N′能被n整除,这时 =.③确定起始个体编号.在第1段用简单随机抽样确定起始的个体编号S.
④按照事先确定的规则抽取样本.通常是将S加上间隔 ,得到第2个个体编号S+ ,再将(S+ )加上 ,得到第3个个体编号S+2 ,这样继续下去,获得容量为n的样本.其样本编号依次是:S,S+ ,S+2 ,…,S+(n-1) .
3.分层抽样
(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法叫做分层抽样.
分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,分层要恰当.
(2)分层抽样的步骤
①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.
(3)分层抽样的优点
分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用.
4.绘制频率分布直方图
把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1.
5.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.
6.平均数、中位数和众数
(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.
(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数.
(3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数).
(4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
7.方差、标准差
(1)设样本数据为x1,x2,…,xn样本平均数为,则s2=[(x1-)2+(x2-)2+…+(xn-)2]=[(x12+x22+…+xn2)-n2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.
(2)数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则反映一组数据围绕平均数波动的大小.
8.两个变量的线性相关
(1)散点图
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图.利用散点图可以判断变量之间有无相关关系.
(2)正相关、负相关
如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.
反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.
9.回归分析
对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.
(1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归直线方程的求法——最小二乘法.
设具有线性相关关系的两个变量x、y的一组观察值为(xi,yi)(i=1,2,…,n),则回归直线方程=+x的系数为:
其中=i,=i,(,)称作样本点的中心.
,表示由观察值用最小二乘法求得的a,b的估计值,叫回归系数.
10.独立性检验
(1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量.
(2)两个分类变量X与Y的频数表,称作2×2列联表.
二.随机事件的概率
1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件.
(1)在条件下,一定会发生的事件叫做相对于条件的必然事件.
(2)在条件下,一定不会发生的事件叫做相对于条件的不可能事件.
(3)必然事件与不可能事件统称为确定事件.
(4)在条件下可能发生也可能不发生的事件,叫做随机事件.
(5)确定事件和随机事件统称为事件,一般用大写字母表示.
2.频率与概率
(1)在相同的条件下重复次试验,观察某一事件是否出现,称次试验中事件出现的次数为事件出现的频数,称事件出现的比例为事件出现的频率.
(2)对于给定的随机事件,如果随着试验次数的增加,事件发生的频率稳定在某个常数上,把这个常数记作,称为事件的概率,简称为的概率.
3.互斥事件与对立事件
互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即为不可能事件(),则称事件与事件互斥,其含义是:事件与事件在任何一次试验中不会同时发生.
一般地,如果事件中的任何两个都是互斥的,那么就说事件彼此互斥.
对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即为不可能事件,而为必然事件,那么事件与事件互为对立事件,其含义是:事件与事件在任何一次试验中有且仅有一个发生.
互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.两个事件互斥是两个事件对立的必要非充分条件.
4.事件的关系与运算
[ : XX ]
定义
符号表示
包含关系
如果事件发生,则事件一定发生,这时称事件包含事件 (或称事件包含于事件)
(或)
相等关系
若且,那么称事件与事件相等
并事件
(和事件)
若某事件发生当且仅当事件发生或事件发生,则称此事件为事件与事件的并事件(或和事件)
(或)
交事件
(积事件)
若某事件发生当且仅当事件发生且事件发生,则称此事件为事件与事件的交事件(或积事件)
(或)
互斥事件
若为不可能事件,那么称事件与事件互斥
对立事件
若为不可能事件,为必然事件,那么称事件与事件互为对立事件
且
5.随机事件的概率
事件的概率:在大量重复进行同一试验时,事件发生的频率总接近于某个常数,在它附近摆动,这时就把这个常数叫做事件的概率,记作.
由定义可知,显然必然事件的概率是,不可能事件的概率是.
5.概率的几个基本性质
(1)概率的取值范围:.
(2)必然事件的概率:.
(3)不可能事件的概率:.
(4)互斥事件的概率加法公式:
①(互斥),且有.
② (彼此互斥).
(5)对立事件的概率:.
三.古典概型
1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件A由几个基本事件组成.如果一次试验中可能出现的结果有n个,即此试验由n个基本事件组成,而且所有结果出现的可能性都相等,那么每一基本事件的概率都是.如果某个事件A包含的结果有m个,那么事件A的概率P(A)=.
基本事件的特点
(1)任何两个基本事件是互斥的.
(2)任何事件都可以表示成基本事件的和(除不可能事件).
2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型.
①试验中所有可能出现的基本事件只有有限个,即有限性.
②每个基本事件发生的可能性相等,即等可能性.
概率公式:P(A)=.
四.几何概型
1.(1)随机数的概念:
随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的.[ : xx ]
(2)随机数的产生方法
①利用函数计算器可以得到0~1之间的随机数;
②在Scilab语言中,应用不同的函数可产生0~1或a~b之间的随机数.
2.几何概型
(1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,则称这样的概率模型为为几何概率模型,【 :全简称几何概型.,品…中 高*考+ 】
(2)特点:①无限性:在一次试验中,可能出现的结果有无限多个;
②等可能性:每个结果的发生具有等可能性.
(3)几何概型的解题步骤:
首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问题,与两个变量有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的问题,先确定试验的全部结果和事件构成的区域长度(角度、弧长等),最后代公式
;如果是二维、三维的问题,先设出二维或三维变量,再列出试验的全部结果和事件分别满足的约束条件,作出两个区域,最后计算两个区域的面积或体积代公式.
(4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联系.
3.几种常见的几何概型
(1)设线段l是线段L的一部分,向线段L上任投一点.若落在线段l上的点数与线段L的长度成正比,而与线段l在线段l上的相对位置无关,则点落在线段l上的概率为:
P=l的长度/L的长度
(2)设平面区域g是平面区域G的一部分,向区域G上任投一点,若落在区域g上的点数与区域g的面积成正比,而与区域g在区域G上的相对位置无关,则点落在区域g上概率为:
P=g的面积/G的面积
(3)设空间区域上v是空间区域V的一部分,向区域V上任投一点.若落在区域v上的点数与区域v的体积成正比,而与区域v在区域v上的相对位置无关,则点落在区域V上的概率为:
P=v的体积/V的体积
五.条件概率
1.条件概率及其性质
(1)对于任何两个事件和,在已知事件发生的条件下,事件发生的概率叫做条件概率,用符号来表示,其公式为.
在古典概型中,若用表示事件中基本事件的个数,则.
(2)条件概率具有的性质:
①;
② 如果和是两互斥事件,则.
2.相互独立事件
(1)对于事件、,若的发生与的发生互不影响,则称、是相互独立事件.
(2)若与相互独立,则,
.
(3)若与相互独立,则与,与,与也都相互独立.
(4)若,则与相互独立.
【应试技巧点拨】
1.三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的机会均等[ : XX ][ : xx ][ : XX ]
从总体中逐个抽取
总体中的个体数较少
系统抽样[ : X X ]
将总体均匀分成几部分,按事先确定的规则在各部分抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层抽样
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
2.样本频率直方图与样本的数字特征
在频率分布直方图中,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;中位数的估计值,应使中位数左右两边的直方图面积相等;最高小长方形的中点所对应的数据值即为这组数据的众数.
3.方差是刻画一组数据离散程度的量,方差越大,这组数据波动越大,越分散.讨论产品质量、售价高低、技术高低、产量高低、成绩高低、寿命长短等等问题,一般都是通过方差来体现.
5.判断两变量是否有相关关系很容易将相关关系与函数关系混淆.相关关系是一种非确定性关系,即是非随机变量与随机变量之间的关系,而函数关系是一种因果关系.
6.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同)
7.回归分析是处理变量相关关系的一种数 方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数 表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出回归直线方程.
8.独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的随机变量,对假设的正确性进行判断.
【考场经验分享】
1.进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠;
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性应相同;
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
2.在作茎叶图时,容易出现茎两边的数字不是从小到大的顺序排列,从而导致结论分析错误,在使用茎叶图整理数据时,要注意:一是数据不能遗漏,二是数据最好按从小到大顺序排列,对三组以上的数据,也可使用茎叶图,但没有表示两组记录那么直观、清晰.
3.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.
4.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
5.r的大小只说明是否相关并不能说明拟合效果的好坏,R2才是判断拟合效果好坏的依据.
6.独立性检验的随机变量 2=2.706是判断是否有关系的临界值, 2<2.076应判断为没有充分证据显示X与Y有关系,而不能作为小于90 的量化值来判断.
7. 概率计算题的核心环节就是把一个随机事件进行类似本题的分拆,这中间有三个概念,事件的互斥,事件的对立和事件的相互独立,在概率的计算中只要弄清楚了这三个概念,根据实际情况对事件进行合理的分拆,就能把复杂事件的概率计算转化为一个个简单事件的概率计算,达到解决问题的目的.
8.在解含有相互独立事件的概率题时,首先把所求的随机事件分拆成若干个互斥事件的和,其次将分拆后的每个事件分拆为若干个相互独立事件的乘积,这两个事情做好了,问题的思路就清晰了,接下来就是按照相关的概率值进行计算的问题了.
9.相当一类概率应用题都是比如掷硬币、掷骰子、摸球等概率模型赋予实际背景后得出来的,我们在解题时就要把实际问题再还原为我们常见的一些概率模型,这就要根据问题的具体情况去分析,对照常见的概率模型,把不影响问题本质的因素去除,抓住问题的本质.
【名题精选练兵篇】
1.【山东省 12联盟2018届高三开年迎春考】为了治理大气污染,某市2017年初采用了一系列措施,比如“煤改电”,“煤改气”,“整治散落污染企业”等.下表是该市2016年11月份和2017年11月份的空气质量指数()(指数越小,空气质量越好)统计表.根据表中数据回答下列问题:
(1)将2017年11月的空气质量指数
数据用该天的对应日期作为样本编号,再用系统抽样方法从中抽取6个数据,若在2017年11月16日到11月20日这五天中用简单随机抽样抽取到的样本的编号是19号,写出抽出的样本数据;
(2)从(1)中抽出的6个样本数据中随机抽取2个,求这2个数据之差的绝对值小于30的概率;
(3)根据《环境空气质量指数()技术规定(试行)》规定:当空气质量指数为(含50)时,空气质量级别为一级,求出这两年11月空气质量指数为一级的概率,你认为该市2017年初开始采取的这些大气污染治理措施是否有效?
(3)2016年11月指数为一级的概率,
2017年11月指数为一级的概率,
,说明这些措施是有效的.
2.【延安市2018届高三高考模拟】某种植园在芒果临近成熟时,随机从一些芒果树上摘下100个芒果,其质量(单位:克)分别在,,,,,中,经统计得频率分布直方图如图所示.
(1)现按分层抽样从质量为,的芒果中随机抽取6个,再从这6个中随机抽取3个,求这3个芒果中恰有1个在内的概率;
(2)某经销商来收购芒果,以各组数据的中间数代表这组数据的平均值,用样本估计总体,该种植园中还未摘下的芒果大约还有10000个,经销商提出如下两种收购方案:
方案:所有芒果以10元/千克收购;
方案:对质量低于250克的芒果以2元/个收购,高于或等于250克的以3元/个收购.
通过计算确定种植园选择哪种方案获利更多?
【解析】(1)设质量在内的4个芒果分别为,,,,质量在内的2个芒果分别为,.从这6个芒果中选出3个的情况共有,,,,,,,,,,,,,,,,,,,共计20种,其中恰有1个在内的情况有,, ,,,,,,,,,共计12种,
因此概率.
(2)方案:
元.
方案:
由题意得低于250克:元;
高于或等于250克:元;
由于,
故方案获利更多,应选方案.
3.【内蒙古鄂伦春自治旗2018届高三下 期二模】根据以往的经验,某建筑工程施工期间的降水量(单位:)对工期的影响如下表:
降水量
工期延误天数
0
1
3
6
根据某气象站的资料,某调查小组抄录了该工程施工地某月前天的降水量的数据,绘制得到降水量的折线图,如下图所示.
(1)求这天的平均降水量;
(2)根据降水量的折线图,分别估计该工程施工延误天数的概率.
【解析】
(1)这天的平均降水量为
(2)∵的天数为
∴的频率为,故估计的概率为.
∵的天数为
∴的频率为,故估计的概率为.
∵的天数为
∴的频率为,故估计的概率为.
∵的天数为
∴的频率为,故估计的概率为.
4.【】经销商第一年购买某工厂商品的单价为(单位:元),在下一年购买时,购买单价与其上年度销售额(单位:万元)相联系,销售额越多,得到的优惠力度越大,具体情况如下表:
上一年度
销售额/万元
商品单价/元
4.【陕西省汉中市2017届高三下 期第二次教 质量检测(4月模拟)】为调查某地人群年龄与高血压的关系,用简单随机抽样方法从该地区年龄在20~60岁的人群中抽取200人测量血压,结果如下:
高血压
非高血压
总计
年龄20到39岁
12
100
年龄40到60岁
52
100
总计
60
200
(1)计算表中的、、值;是否有99 的把握认为高血压与年龄有关?并说明理由.
(2)现从这60名高血压患者中按年龄采用分层抽样的方法抽取5人,再从这5人中随机抽取2人,求恰好一名患者年龄在20到39岁的概率.
附参考公式及参考数据: =
P( 2≥ 0)
0.100
0.050
0.025
0.010
0.001
0
2.706
3.841
5.024
6.635
10.828
【解析】(1)由, ,解得=88, =48; =52+ =140,
∴=≈30.857,
由于30.857>10.828,所以有99.9 的把握认为“高血压与年龄有关”.
5.【重庆市2017届高三4月调研测试(二诊)】“微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:
(1)若采用样本估计总体的方式,试估计小王的所有微信好友中每日走路步数超过5000步的概率;
(2)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的列联表,并据此判断能否有95 以上的把握认为“评定类型”与“性别”有关?
附: ,
0.10
0.05
0.025
0.010
2.706
3.841
5.024
6.635
【解析】(Ⅰ)由题知,40人中该日走路步数超过5000步的有34人,频率为
,所以估计他的所有微信好友中每日走路步数超过5000步的概率为;
(Ⅱ)
,故没有95 以上的把握认为二者有关.
6.【2017届湖南省长沙市高三上 期统一模拟】某研究型 习小组调查研究”中 生使用智能手机对 习的影响”.部分统计数据如下表:
参考数据:
参考公式: ,其中
(Ⅰ)试根据以上数据,运用独立性检验思想,指出有多大把握认为中 生使用智能手机对 习有影响?
(Ⅱ)研究小组将该样本中使用智能手机且成绩优秀的4位同 记为组,不使用智能手机且成绩优秀的8位同 记为组,计划从组推选的2人和组推选的3人中,随机挑选两人在 校升旗仪式上作“国旗下讲话”分享 习经验.求挑选的两人恰好分别来自、两组的概率.
【解析】(Ⅰ)根据上方公式求得,
因为
所以该研究小组有99.5 的把握认为中 生使用智能手机对 习有影响.
(Ⅱ)记组推选的两名同 为, 组推选的三名同 为,
则从中随机选出两名同 包含如下10个基本事件:
记挑选的两人恰好分别来自两组为事件,
则事件包含如下6 个基本事件:
故.
即挑选的两人恰好分别来自两组的概率是.
7.【湖北省六校联合体2017届高三4月联考】2015年12月,华中地区数城市空气污染指数“爆表”,此轮污染为2015年以来最严重的污染过程,为了探究车流量与的浓度是否相关,现采集到华中某城市2015年12月份某星期星期一到星期日某一时间段车流量与的数据如表:
时间
星期一
星期二
星期三
星期四
星期五
星期六
星期日
车流量(万辆)
1
2
3
4
5
6
7
的浓度(微克/立方米)
28
30
35
41
49
56
62
(1)由散点图知与具有线性相关关系,求关于的线性回归方程;(提示数据: )
(2)(I)利用(1)所求的回归方程,预测该市车流量为12万辆时的浓度;(II)规定:当一天内的浓度平均值在内,空气质量等级为优;当一天内的浓度平均值在内,空气质量等级为良,为使该市某日空气质量为优或者为良,则应控制当天车流量不超过多少万辆?(结果以万辆为单位,保留整数)参考公式:回归直线的方程是,其中, .
【解析】(1)由数据可得:
,
,(注:用另一个公式求运算量小些)
故关于的线性回归方程为. (2)(ⅰ)当车流量为12万辆时,即时, .故车流量为12万辆时, 的浓度为91微克/立方米. (ⅱ)根据题意信息得: ,即, 故要使该市某日空气质量为优或为良,则应控制当天车流量在13万辆以内.
8.【四川省资阳市2017届高三4月模拟】共享单车是指由企业在校园、公交站点、商业区、公共服务区等场所提供的自行车单车共享服务,由于其依托“互联 +”,符合“低碳出行”的理念,已越来越多地引起了人们的关注.某部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照[50,60),[60,70),…,[90,100] 分成5组,制成如图所示频率分直方图.
(Ⅰ) 求图中的值;
(Ⅱ) 已知满意度评分值在[90,100]内的男生数与女生数的比为2:1,若在满意度评分值为[90,100]的人中随机抽取2人进行座谈,求所抽取的两人中至少有一名女生的概率. =
所以,抽取的两人中至少有一名女生的概率为,即为
9.【北京市海淀区2017届高三下 期期中】某地区以“绿色出行”为宗旨开展“共享单车”业务.该地有, 两种“共享单车”(以下简称型车, 型车).某 习小组7名同 调查了该地区共享单车的使用情况.
(Ⅰ)某日该 习小组进行一次市场体验,其中4人租到型车,3人租到型车.如果从组内随机抽取2人,求抽取的2人中至少有一人在市场体验过程中租到型车的概率;
(Ⅱ)根据已公布的2016年该地区全年市场调查报告,小组同 发现3月,4月的用户租车情况城现如表使用规律.例如,第3个月租型车的用户中,在第4个月有的用户仍租型车.
第3个月
第4个月
租用型车
租用型车
租用型车
租用型车
若认为2017年该地区租用单车情况与2016年大致相同.已知2017年3月该地区租用, 两种车型的用户比例为1:1,根据表格提供的信息,估计2017年4月该地区租用两种车型的用户比例.
【解析】(Ⅰ)依题意租到型车的4人为, , , ;租到型车的3人为, , ;
设事件为“7人中抽到2人,至少有一人租到型车”,
则事件为“7人中抽到2人都租到型车”.
如表格所示:从7人中抽出2人共有21种情况,事件发生共有3种情况,
所以事件概率.
(Ⅱ)依题意,市场4月份租用型车的比例为,
租用型车的比例为,
所以市场4月租用, 型车的用户比例为.
10.【吉林省梅河口市2017届高三一模】已知某中 高三文 班 生共有800人参加了数 与地理的水平测试,现 校决定利用随机数表法从中抽取100人进行成绩抽样统计,先将800人按001,002,003,…,800进行编号.
(Ⅰ)如果从第8行第7列的数开始向右读,请你依次写出最先检测的3个人的编号:(下面摘取了第7行至第9行)
(Ⅱ)抽的100人的数 与地理的水平测试成绩如下表:
成绩优秀、良好、及格三个等级,横向、纵向分别表示地理成绩与数 成绩,例如:表中数 成绩为良好的共有20+18+4=42人,若在该样本中,数 成绩优秀率为30 ,求
的值.
(Ⅲ)将, 的表示成有序数对,求“地理成绩为及格的 生中,数 成绩为优秀的人数比及格的人数少”的数对的概率.
其中数 成绩为优秀的人数比及格的人数少有: 共6组.
∴数 成绩为优秀的人数比及格的人数少的概率为.
11.【四川省宜宾市2017届高三二诊】某企业为了对生产的一种新产品进行合理定价,将该产品按事先拟定的价格进行试销,得到以下数据:
单价x(元/件)
60
62
64
66
68
70
销量y(件)
91
84
81
75
70
67
(I)画出散点图,并求关于的回归方程;
(II)已知该产品的成本是36元/件,预计在今后的销售中,销量与单价仍然服从(I)中的关系,为使企业获得最大利润,该产品的单价应定为多少元(精确到元)?
附:回归直线的斜率和截距的最小二乘法估计公式分别为:
【解析】(I)散点图如图
由图得销量与单价线性相关
回归直线方程为
(II)利润
当时,利润最大,这时
故定价约为元时,企业获得最大利润.
【名师原创测试篇】
1.从某高校男生中随机抽取名 生,测得他们的身高(单位: cm)情况如表1:
分组
频数
频率
合计
表1
(1)求的值;
(2)按表1的身高组别进行分层抽样, 从这名 生中抽取名担任广州国际马拉松志愿者, 再从身高不低于cm的志愿者中随机选出名担任迎宾工作, 求这名担任迎宾工作的志愿者中至少有名的身高不低于cm的概率.
【解析】(1)由,得.由,得, 由,得.
(2)依据分层抽样的方法,抽取的名志愿者中身高在区间上的有名,记为;而身高在区间上的有名,记为.记“这名担任迎宾工作的志愿者中至少有名的身高不低于cm”为事件,从身高不低于cm的志愿者中随机选出名担任迎宾工作,共有种不同取法:,,,,. 事件包含的基本事件有种:,,,,. ∴为所求.
2.某体育杂志针对2014年巴西世界杯发起了一项调查活动,调查“各球队在世界杯的名次与该队历史上的的实力和表现有没有关系”,在所有参与调查的人中,持“有关系”“无关系”“不知道”态度的人数如表所示:
有关系
无关系
不知道
40岁以下
800
450
200
40岁以上(含40岁)
100
150
300
(1)在所有参与调查的人中,用分层抽样的方法抽取n个人,已知从持“有关系”态度的人中抽取45人,求n的值,并求从持其他两种态度的人中应抽取的人数;
(2)在持“不知道”态度的人中,用分层抽样的方法抽取5人看成一个总体,从这5人中任选取2人,求至少一人在40岁以下的概率.
【解析】(Ⅰ)由题意,得, ;从持“无关系”态度的人中,应抽取人,从持“不知道”态度的人中,应抽取人
3.某校高一某班的一次数 测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,(阴影部分为破坏部分)其可见部分如下,据此解答如下问题:
5 6 8
6 2 3 3 5 6 8 9
7 1 2 2 3 4 5 6 7 8 9
8
9 5 8
(Ⅰ)计算频率分布直方图中[80,90)间的矩形的高;
(Ⅱ)若要从分数在之间的试卷中任取两份分析 生失分情况,求在抽取的试卷中,至少有一份的分数在之间的概率;
(Ⅲ)根据频率分布直方图估计这次测试的平均分.
【解析】(Ⅰ)分数在的频率为,由茎叶图知:分数在
之间的频数为,所以全班人数为, ∴分数在之间的人数为人. 则对应的频率为, 所以间的矩形的高为.
(Ⅲ)全班人数共人,根据各分数段人数计算得各分数段的频率为:
分数段
频率
所以估计这次测试的平均分为:
.
4.某中 有教职工500人参加植树节活动,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如下图所示.
(1)左图是年龄的频数分布表,求正整数a,b的值;
(2)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,年龄在第1,2,3组的人数分别是多少?
(3)在(2)的前提下,从这6人中随机抽取2人参加宣传交流活动,求至少有1人年龄在第3组的概率.
【解析】(1)由题设可知, .
(2)因为第1,2,3组共有50+50+200=300人,利用分层抽样在300名 生中抽取6名 生,每组抽取的人数分别为: 第1组的人数为,第2组的人数为,第3组的人数为,
所以第1,2,3组分别抽取1人,1人,4人.
5. 2015国际滑联世界花样滑冰锦标赛于3月23日至29日在上海举行,为调查市民喜欢这项赛事是否与年龄有关,随机抽取了55名市民,得到如下数据表:
喜 欢
不 喜 欢
合 计
大于40岁
20
5
25
20岁至40岁
10
20
30
合 计
30
25
55
(I)判断是否有的把握认为喜欢这项赛事与年龄有关?
(II)用分层抽样的方法从喜欢这项赛事的市民中随机抽取6人作进一步调查,将这6位市民作为一个样本,从中任选2人,求恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民的概率.
下面的临界值表供参考:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:,其中)
【解析】(I)由公式得,所以有的把握认为喜欢这项赛事与年龄有关.
(II)设所抽样本中有个“大于40岁”市民,则,解得,所以样本中有4个“大于40岁”市民,同理可得样本中有2个“20岁至40岁”的市民,他们分别记作从中任选2人的基本事件有共15个,其中恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民含基本事件共8个,所以从中任选2人,恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民的概率为.
6. 某校高三有800名同 参加 校组织的化 竞赛, 其成绩的频率分布直方图如图所示,规定90分及其以上为获优胜奖.
(Ⅰ)下表是这次考试成绩的频数分布表,求正整数a, b的值;
区间
[75,80)
[80,85)
[85,90)
[90,95)
[95,100]
人数
40
a
280
240
b
(II)现在要用分层抽样的方法从这800人中抽取5人参加某项活动,求其 中获优胜奖的 生人数;
(Ⅲ)在(II)中抽取的5名 生中,要随机选取2名 生参加市全省化 竞赛,求选取的两名 生中恰有含1名获优胜奖的概率.