- 1.12 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
专题10 概率与统计
一、简单随机抽样
1.定义
设一个总体含有N个个体,从中逐个不放回抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.最常用的简单随机抽样的方法:抽签法和随机数法.
3.应用范围:总体中的个体数较少.注意:不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.
二、系统抽样
1.定义
当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样.
2.系统抽样的操作步骤
第一步编号:先将总体的N个个体编号;
第二步分段:确定分段间隔 ,对编号进行分段,当(n是样本容量)是整数时,取 =;
第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤ );
第四步获取样本:按照一定的规则抽取样本,通常是将l加上间隔 得到第2个个体编号,再加 得到第3个个体编号,依次进行下去,直到获取整个样本.
3.应用范围:总体中的个体数较多.注意:系统抽样是等距抽样,抽样个体的编号相差的整数倍.
三、分层抽样
1.定义
在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
2.应用范围
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
四、三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随
机抽样
不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等
从总体中逐个抽取
—
总体中的个数较少
系统
抽样
将总体均分成几部分,按事先确定的规则在各部分抽取
在起始部分抽样时,采用简单随机抽样
总体中的个数比较多
将总体分成几层,分层进行抽取
各层抽样采用简单随机抽样或者系统抽样
总体由差异明显的几部分组成
分层
抽样
五、数字特征
1.众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
2.极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
3.性质
(1)若的平均数为,那么的平均数为.
(2)数据与数据的方差相等,即数据经过平移后方差不变.
(3)若的方差为s2,那么的方差为.
六、茎叶图
1.定义
茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
2.表示方法
(1)对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.
(2)对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎.
七、统计表
1.频率分布直方图
(1)画频率分布直方图的步骤:①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
(2)频率分布直方图的性质:①落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1;②频率分布直方图与众数、中位数与平均数的关系
a.最高的小长方形底边中点的横坐标即是众数;学!
b.中位数左边和右边的小长方形的面积和是相等的;
c.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.各种统计表的优点与不足
优点
不足
频率
分布表
表示数据较确切
分析数据分布的总体态势不方便
频率分布直方图
表示数据分布情况非常直观
原有的具体数据信息被抹掉了
能反映数据的变化趋势
不能显示原有数据
频率分布折线图
茎叶图
所有的信息都可以从这个茎叶图中得到;茎叶图便于记录和表示,能够展示数据的分布情况
样本数据较多或数据位数较多时,不方便表示数据
八、随机事件及其概率
1.事件的分类
2.频率与概率
(1)事件的频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数为事件A出现的频数,称事件A出现的比例为事件A出现的频率.
(2)事件的概率:对于给定的随机事件A,由于事件A发生的频率随着试验次数的增加稳定在某个常数上,把这个常数记作,称为事件A的概率,因此可以用来估计概率.
注意:频率是事件A发生的次数与试验总次数的比值,与试验次数有关.概率是一个确定的数,是客观存在的,与试验做没做、做多少次完全无关.
九、事件间的关系及运算
定义
符号表示
包含关系
如果事件A发生,则事件B一定发生,这时称事件B包含事件A
B⊇A(或A⊆B)
相等关系
若B⊇A且A⊇B,则事件A与事件B相等
A=B
并事件
若某事件发生当且仅当事件A发生或事件B发生,称此事件为事件A与事件B的并事件
A∪B
交事件
若某事件发生当且仅当事件A发生且事件B发生,则称此事件为事件A与事件B的交事件
A∩B
互斥事件
若A∩B为不可能事件,则称事件A与事件B互斥
对立事件
若A∩B为不可能事件,A∪B为必然事件,
那么称事件A与事件B互为对立事件
且
注意:互斥事件与对立事件都是指两个事件的关系,互斥事件是不可能同时发生的两个事件,而对立事件除要求这两个事件不同时发生外,还要求必须有一个发生.因此,对立事件一定是互斥事件,而互斥事件未必是对立事件.
十、概率的基本性质
1.由于事件的频数总是小于或等于试验的次数,所以频率在0 1之间,从而任何事件的概率都在0 1之间,即.必然事件的概率为1,不可能事件的概率为0.
2.当事件A与事件B互斥时,,该公式为概率的加法公式.当一个事件包含多个结果且各个结果彼此互斥时,要用到概率加法公式的推广,即.
3.若事件A与事件B互为对立事件,则为必然事件,.再由加法公式得.
十一、古典概型
1.基本事件
在一次试验中,可能出现的每一个基本结果叫做基本事件.
基本事件有如下特点:
(1)任何两个基本事件是互斥的.
(2)任何事件(除不可能事件)都可以表示成基本事件的和.
2.古典概型的概念及特点
把具有特点:①试验中所有可能出现的基本事件只有有限个;②每个基本事件出现的可能性相等的概率模型称为古典概率模型,简称古典概型.
3.古典概型的概率计算公式
.
【必记结论】(1)古典概型中的基本事件都是互斥的.
(2)在计算古典概型中基本事件数和事件发生数时,易忽视它们是否是等可能的.
十二、几何概型
1.几何概型的概念
如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,
则称这样的概率模型为几何概率模型,简称为几何概型.
2.几何概型的特点
(1)试验中所有可能出现的结果(基本事件)有无限多个.
(2)每个基本事件发生的可能性相等.
3.几何概型的概率计算公式
.
【必记结论】(1)与长度有关的几何概型,其基本事件只与一个连续的变量有关.
(2)与面积有关的几何概型,其基本事件与两个连续的变量有关,若已知图形不明确,可将两个变量分别作为一个点的横坐标和纵坐标,这样基本事件就构成了平面上的一个区域,可借助平面区域解决问题.
(3)与体积有关的几何概型.
1.某校为了解学生学习的情况,采用分层抽样的方法从高一1000人、高二1200人、高三人中,抽取81人进行问卷调查,已知高二被抽取的人数为30,那么________________.
2.现有2个正方体,3个三棱柱,4个球和1个圆台,从中任取一个几何体,则该几何体是旋转体的概率为________________.
3.某地区有大型商场个,中型商场个,小型商场个,且,为了掌握该地区商场的营业情况,采用分层抽样的方法抽取一个容量为45的样本,则抽取的中型商场的个数为________________.
4.若任取,则点满足的概率为________________.
5.某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为l到24,现用系统抽样方法,抽取4个班进行调查,若抽到编号之和为48,则抽到的最小编号为________________.
6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬菜类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是________________.
7.某校航模小组在一个棱长为6米的正方体房间内试飞一种新型模型飞机,为保证模型飞机安全,模型飞机在飞行过程中要始终保持与天花板、地面和四周墙壁的距离均大于1米,则模型飞机“安全飞行”的概率为________________.
8.某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如下图所示,若130 140分数段的人数为90人,则90 100分数段的人数为________________.
9.2000辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,时速在的汽车大约有________________辆.
10.北京市2016年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是第________________季度.
11.某仪器厂从新生产的一批零件中随机抽取40个检测.如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为、,、、、、、,则样本的中位数在第________________组.
12.某市开展“魅力教师”原创 文大赛,各校上传文章的时间为10月1日至30日,评委会把各校上传的文章数按5天一组分组统计,绘制了频率分布直方图(如图).已知从左至右各长方形的高的比为2∶3∶4∶6∶4∶1,第二组的频数为180.那么本次活动收到的文章数是________________.
13.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________________.
14.某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是________________(米).
15.口袋中装有一些大小相同的红球和黑球,从中取出2个球.两个球都是红球的概率是,都是黑球的概率是,则取出的2个球中恰好一个红球一个黑球的概率是________________.
16.某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业中抽取40名学生进行调查,则应从丙专业抽取的学生人数为________________.
17.甲、乙两人有三个不同的学习小组A,B,C可以参加,若每人必须参加并且仅能参加一个学习小组,则两人参加同一个小组的概率为________________.
18.等差数列的公差为1,若以为样本,则此样本的方差为________________.
19.某车间共有6名工人,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数,日加工零件个数大于样本均值的工人为优秀工人.从该车间6名工人中,任取2名,则至少有1名优秀工人的概率为________________.
20.记函数的定义域为.在区间上随机取一个数,则的概率是________________.
21.从分别标有,,,的张卡片中不放回地随机抽取2次,每次抽取1张.则抽到的2张卡片上的数奇偶性不同的概率是________________.
22.在长度为10的线段AB上任取一点C(不同于A,B),则以AC,BC为半径的圆的面积之和小于58π的概率为________________.
23.圆O内有一内接正三角形,向圆O内随机投一点,则该点落在正三角形内的概率为________________.
24.如图,在一个棱长为2的正方体鱼缸内放入一个倒置的无底圆锥形容器,圆锥的上底圆周与鱼缸的底面正方形相切,圆锥的顶点在鱼缸的缸底上,现在向鱼缸内随机地投入一粒鱼食,则“鱼食落在圆锥外面”的概率是________________.
25.在内任取一个实数,则的概率为________________.
26.如图,在矩形ABCD中,AB=,BC=1,以A为圆心、1为半径作圆弧DE,点E在线段AB上,在圆弧DE上任取一点P,则直线AP与线段BC有公共点的概率是________________.
(1)应用简单随机抽样应注意的问题:①一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.②在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.③简单随机抽样需满足:被抽取的样本总体的个体数有限,逐个抽取,是不放回抽取,是等可能抽取.
(2)抽签法与随机数法的适用情况:抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
(3)分层抽样分层的原则:分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.
(4)平均数反映了数据取值的平均水平,方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
(5)明确数字特征的意义:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(6)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示,
其缺点是当样本容量较大时,作图较繁琐.
(7)随机事件在一次试验中是否发生虽然不能事先确定,但是在大量重复试验的情况下,随机事件的发生呈现一定的规律性,因而,可以从统计的角度,通过计算事件发生的频率去估算事件发生的概率.
(8)对互斥事件要把握住不能同时发生,而对于对立事件除不能同时发生外,其并事件应为必然事件,而且事件的发生与否都是对于同一次试验而言的,不能在多次试验中判断.具体应用时,可把所有试验结果写出来,看所求事件包含哪些试验结果,从而断定所给事件的关系.
(9)概率加法公式应用的前提是“各事件是互斥事件”,对于较难判断关系的,必要时可利用Venn图或列出全部的试验结果进行分析.
(10)求解古典概型的关键是求试验的基本事件的总数和事件A包含的基本事件的个数,这就需要正确列出基本事件.基本事件的表示方法有列举法、列表法、树状图法和计数原理法,具体应用时可根据需要灵活选择.对于求较复杂事件的古典概型的概率问题,可以将所求事件转化成彼此互斥的事件的和,或者先求对立事件的概率,再用互斥事件的概率加法公式或对立事件的概率公式求出所求事件的概率.
1.高三(2)班现有64名学生,随机编号为0,1,2,,63,依编号顺序平均分成8组,组号依次为1,2,3,,8.现用系统抽样方法抽取一个容量为8的样本,若在第一组中随机抽取的号码为5,则在第6组中抽取的号码为________________.
2.某校高中部共名学生,其中高一年级450人,高三年级250人,现采用分层抽样的方法从全校学生中随机抽取60人,其中从高一年级中抽取27人,则高二年级的人数为________________.
3.某商场对一个月内每天的顾客人数进行统计,得到如图所示的样本茎叶图,则该样本的中位数为________________,众数为________________.
4.一个样本,3,5,7的平均数是,且,分别是数列的第2项和第4项,则这个样本的方差是________________.
5.一次数学考试中,4位同学各自在第22题和第23题中任选一题作答,
则第22题和第23题都有同学选答的概率为________________.
6.袋子中有四个小球,分别写有“甲、乙、丙、丁”四个字,从中任取一个小球,取到“丙”就停止,用随机模拟的方法估计直到第二次停止的概率:先由计算器产生1到4之间取整数值的随机数,且用1,2,3,4表示取出小球上分别写有“甲、乙、丙、丁”四个字,以每两个随机数为一组,代表两次的结果,经随机模拟产生了20组随机数:
13 24 12 32 43 14 24 32 31 21
23 13 32 21 24 42 13 32 21 34
据此估计,直到第二次就停止的概率为________________.
7.福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如图所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列和第10列的数字开始从左到右依次选取两个数字,则第四个被选中的红色球号码为________________.
附:随机数表中第1行和第2行各数如下:
8.某初级中学领导采用系统抽样方法,从该校初一年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数,即每16人抽取一个人.在1 16中随机抽取一个数,如果抽到的是7,则从33 48这16个数中应取的数是________________.
9.《中国诗词大会》的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成绩按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词能手”称号的人数为________________.
10.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,若这200名学生中每周的自习时间不超过小时的人数为164,则的值约为________________.
11.在一次随机试验中,三个事件的概率分别是0.2,0.3,0.5,则下列说法正确的个数是________________.
①与是互斥事件,也是对立事件; ②是必然事件;
③; ④.
12.在上随机地取一个数 ,则事件“直线y= x与圆相交”发生的概率为________________.
13.公共汽车在7:00到7:20内随机到达某站,李老师从家里赶往学校上班,7:15到达该站,则她能等到公共汽车的概率为________________.
14.在中任取个不同的数,则这个数的和小于的概率为________________.
15.袋中共有6个除颜色外完全相同的球,其中有1个红球,2个白球和3个黑球,从袋中任取两个球,则两个球的颜色为一白一黑的概率等于________________.
16.已知集合A={-2,3,5,7},从A中随机抽取两个不同的元素a,b,作为复数 =a+bi(i为虚数单位)的实部和虚部.则复数 在复平面内的对应点位于第一象限的概率为________________.
17.在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1,那么这组数据的方差可能的最大值是________________.
1
8.《九章算术》中有如下问题:“今有勾八步,股一十五步,问勾中容圆,径几何?”其大意:“已知直角三角形两直角边长分别为步和步,问其内切圆的直径为多少步?”现若向此三角形内随机投一粒豆子,则豆子落在其内切圆外的概率是________________.
1.【答案】1040
【解析】分层抽样是按比例抽样,可得,可得.
2.【答案】
【解析】共有10个几何体,其中旋转体有5个,所以从中任取一个几何体,则该几何体是旋转体的概率为.
5.【答案】3
【解析】系统抽样的间隔为,设抽到的最小编号为x,则,解得.
6.【答案】6
【解析】由已知得抽样比为=,所以抽取植物油类与果蔬类食品种数之和为×(10+20)=6.
7.【答案】
【解析】依题意得,模型飞机“安全飞行”的概率为()3=.
8.【答案】810
【解析】设学生总数为x,则0.05x=90,∴x=1800,∴1800×0.45=810.
9.【答案】600
【解析】依题设中提供的频率分布直方图可以看出:时速在的汽车大约有.
10.【答案】二
【解析】通过对第一季度、第二季度、第三季度、第四季度的图象的起伏进行观察,发现第二季度的三个月的数值变化最小,故其方差最小.
11.【答案】4
【解析】由图计算可得前四组的频数是22,其中第4组的频数为8,故样本的中位数在第4组.
【名师点睛】本题考查的是总体特征数的估计,重点考查了方差的计算,本题有一定的计算量,属于简单题.认真梳理统计学的基础理论,特别是系统抽样和分层抽样、频率分布直方图、方差等,针对训练近几年的高考类似考题,直观了解本考点的考查方式,强化相关计算能力.
14.【答案】1.76
【解析】将这6位同学的身高按照从低到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中位数是1.75与1.77的平均数,显然为1.76.
15.【答案】
【解析】由题意知,从袋中取出2个球包含事件:2个都是红球,2个都是黑球,1个红球和1个黑球.由互斥事件的性质知,取出的2个球中恰好一个红球一个黑球的概率是.
16.【答案】16
【解析】因为高校甲、乙、丙、丁四个专业分别有名学生,所以本校共有学生
名,因为用分层抽样的方法从该校四个专业共抽取名学生进行调查,所以每个个体被抽到的概率是,因为丙专业有人,所以要抽取人.
17.【答案】
【解析】甲、乙两人参加三个不同的学习小组共包含个基本事件,
其中两人参加同一个小组包含个基本事件,
则所求概率为.
18.【答案】
【解析】由等差数列的性质得样本的平均数为,
所以该组数据的方差为.
20.【答案】
【解析】由,即,得,根据几何概型的概率计算公式得的概率是.
【名师点睛】(1)当试验的结果构成的区域为长度、面积或体积等时,应考虑使用几何概型求解.
(2)利用几何概型求概率时,关键是试验的全部结果构成的区域和事件发生的区域的寻找,有时需要设出变量,在坐标系中表示所需要的区域.
(3)几何概型有两个特点:①无限性,②等可能性.基本事件可以抽象为点,尽管这些点是无限的,但它们所占据的区域都是有限的,因此可用“比例解法”求解几何概型的概率.
21.【答案】
【解析】标有的张卡片中,标奇数的有张,标偶数的有张,所以抽到的2张卡片上的数奇偶性不同的概率是.
【名师点睛】概率问题的考查,侧重于对古典概型和对立事件的概率考查,属于简单题.
22.【答案】
【解析】设AC=x,则BC=10-x,0