- 537.92 KB
- 2022-08-15 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
专题二概率统计(文科)(一)统计【背一背基础知识】一.抽样方法抽样方法包含简单随机抽样、系统抽样、分层抽样三种方法,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.二.用样本估计总体1.频率分布直方图:画一个只有横、纵轴正方向的直角坐标系,把横轴分成若干段,每一段对应一个组的组距,然后以此段为底作一矩形,它的高等于该组的,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图.在频率分布直方图中,每个小矩形的面积等于相应数据的频率,各小矩形的面积之和等于;2.茎叶图:茎叶图是一种将样本数据有条理地列出来,从中观察样本分布情况的图.在茎叶图中,“茎”表示数的高位部分,“叶”表示数的低位部分.3.样本的数字特征:(1)众数:一组数据中,出现次数最多的数据就是这组数据的众数(一组数据中的众数可能只有一个,也可能有多个).在频率分布直方图中,最高的矩形的中点的横坐标即为该组数据的众数;[QQ群:学&科&网](2)中位数:将一组数据由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.在频率分布直方图中,中位数对应的直线的左右两边的矩形面积之和均为,可以根据这个特点求频率分布直方图中的中位数;(3)平均数:设个数分别为、、、,则叫做这个数的算数平均数.在频率分布直方图中,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;(4)方差:设个数分别为、、、,则叫做这个数的方差,方差衡量样本的稳定\n性的强弱.一般来讲,方差越大,样本的稳定性越差;方差越小越接近于零,样本的稳定性越强;(5)标准差:设个数分别为、、、,则叫做这个数的标准差,标准差也可以衡量样本稳定性的强弱.三.独立性检验(1)分类变量:对于变量的“值”表示个体所属的不同类别,像这样的变量称为分类变量;(2)列联表:列出的两个分类变量的频数表,称为列联表.(3)与表格相比,三维柱形图与二维条形图更能直观地反映出相关数据的总体状况.(4)利用随机变量来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验(5)两个分类变量的独立性检验的一般步骤:①列出两个分类变量的列联表:②假设两个分类变量、无关系;③计算(其中n=a+b+c+d为样本容量);④把的值与临界值比较,确定、有关的程度或无关系.临界值附表:四.两个变量的相关关系(1)作出两个变量的散点图,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)回归方程为,其中=,.\n【讲一讲基本技能】1.必备技能:在求解样本的众数、中位数、平均数以及方差时,首先一般要将样本的数据按照一定的顺序进行列举,并根据这些数的定义进行计算;在综合题中求解相应事件的概率时,可以利用树状图作为巩固辅助基本事件的列举,最后在作答时一般利用点列法进行列举.2.典型例题例1【2016高考新课标1文数】某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),表示购机的同时购买的易损零件数.(I)若=19,求y与x的函数解析式;(II)若要求“需更换的易损零件数不大于”的频率不小于0.5,求的最小值;(III)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?\n例2某校在一次期末数学统测中,为统计学生的考试情况,从学校的名学生中随机抽取名学生的考试成绩,被测学生成绩全部介于到分之间(满分分),将统计结果按如下方式分成八组:第一组,第二组,,第八组,图1是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)估计该校名学生这次考试成绩的平均分(可用中值代替各组数据的平均值);(3)若从样本成绩属于第六组合第八组的所有学生中随机抽取两名,求他们的分差不不小于分的概率.\n例3某研究机构为了研究人的脚的大小与身高之间的关系,随机抽测20人,得到如下数据:序号12345678910身高x(厘米)192164172177176159171166182166脚长y(码)48384043443740394639序号11121314151617181920身高x(厘米)169178167174168179165170162170脚长y(码)43414043404438423941(1)若“身高大于175厘米”的为“高个”,“身高小于等于175厘米”的为“非高个”;“脚长大于42码”的为“大脚”,“脚长小于等于42码”的为“非大脚”,请根据上表数据完成下面的列联表:高个非高个合计大脚非大脚12合计20(2)根据(1)中表格数据,若按99%的可靠性要求,能否认为脚的大小与身高之间有关系?附:0.0500.0100.0013.8416.63510.828\n【练一练趁热打铁】1.【2016高考新课标Ⅲ文数】下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(I)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;(II)建立关于的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:,,,≈2.646.参考公式:相关系数回归方程中斜率和截距的最小二乘估计公式分别为:.\n2.【2016高考北京文数】某市民用水拟实行阶梯水价,每人用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(I)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(II)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.\n3.为了调查某高中学生每天的睡眠时间,现随机对20名男生和20名女生进行问卷调查,结果如下:女生:睡眠时间(小时)[4,5)[5,6)[6,7)[7,8)[8,9]人数24842男生:睡眠时间(小时)[4,5)[5,6)[6,7)[7,8)[8,9]人数15653(1)现把睡眠时间不足5小时的定义为“严重睡眠不足”,从睡眠时间不足6小时的女生中随机抽取3人,求此3人中恰有一人为“严重睡眠不足”的概率;(2)完成下面2x2列联表,并回答是否有90%的把握认为“睡眠时间与性别有关”?睡眠时间少于7小时睡眠时间不少于7小时合计男生女生合计[QQ群:Z*xx*k.Com]P()0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.887910.828(,其中n=a+b+c+d)\n(二)概率【背一背基础知识】1.随机事件的概率(1)古典概型:①计算公式P(A)=;②解题关键是弄清基本事件的总数n以及某个事件A所包含的基本事件的个数m,常用排列组合知识及公式P(A)=解决.(2)几何概型:①计算公式P(A)=;②解题关键在于把基本事件空间转化为与之对应的区域来解决.(3)互斥事件有一个发生的概率:①计算公式P(A+B)=P(A)+P(B)(A、B互斥);②对于较复杂的互斥事件的概率求法可考虑利用对立事件去求.【讲一讲基本技能】1.必备技能:求解独立性检验的基本问题时,一般只需按照独立性检验的基本步骤进行即可,即第一步——提出假设,第二步——计算的值,第三步——计算犯错误的概率,第四步——下结论.2.典型例题例1【2016高考山东文数】某儿童乐园在“六一”儿童节推出了一项趣味活动.参加活动的儿童需转动如图所示的转盘两次,每次转动后,待转盘停止转动时,记录指针所指区域中的数.设两次记录的数分别为x,y.奖励规则如下:①若,则奖励玩具一个;②若,则奖励水杯一个;③其余情况奖励饮料一瓶.假设转盘质地均匀,四个区域划分均匀.小亮准备参加此项活动.(I)求小亮获得玩具的概率;(II)请比较小亮获得水杯与获得饮料的概率的大小,并说明理由.\n例2某班位同学,期中数学考试成绩全部落在上,加将成绩分成组:、、、、、,加以统计,得到如图4所示的频率分布直方图.(1)求成绩在上的学生人数,并将频率分布直方图补充完整;(2)成绩不低于的学生中随机抽取两名,至少有一名学生的成绩不低于的概率.\n【练一练趁热打铁】1.某班为了调查同学们周末的运动时间,随机对该班级50名同学进行了不记名的问卷调查,得到了如下表所示的统计结果:运动时间不超过2小时运动时间超过2小时合计男生102030女生13720合计232750(1)根据统计结果,能否在犯错误概率不超过0.05的前提下,认为该班同学周末的运动时间与性别有关?(2)用分层抽样的方法,从男生中抽取6名同学,再从这6名同学中随机抽取2名同学,求这两名同学中恰有一位同学运动时间超过2小时的概率.附:,其中.\n2.某航空公司进行空乘人员的招聘,记录了前来应聘的名男生和名女生的身高,数据用茎叶图表示如图(单位:),应聘者获知:男性身高在区间,女性身高在区间的才能进入招聘的下一环节.(1)求名男生的平均身高和名女生身高的中位数;(2)现从能进入下一环节的应聘者中抽取人,求人中至少有一名女生的概率.3.已知关于的一元二次方程(1)若是一枚骰子掷两次所得到的点数,求方程有两正根的概率.(2)若,求方程没有实根的概率.\n自我检测解答题(20*5=100分)1.【2016高考新课标2文数】某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:上年度出险次数01234保费[QQ群:QQ群ZXXK]随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:出险次数01234频数605030302010(Ⅰ)记A为事件:“一续保人本年度的保费不高于基本保费”.求的估计值;(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求的估计值;(III)求续保人本年度的平均保费估计值.\n2.某车间将10名技工平均分为甲,乙两组加工某种零件,在单位时间内每个技工加工零件若干,其中合格零件的个数如下表:(1)分别求出甲,乙两组技工在单位时间内完成合格零件的平均数及方差,并由此分析两组技工的技术水平;(2)质检部门从该车间甲,乙两组中各随机抽取1名技工,对其加工的零件进行检测,若两人完成合格零件个数之和超过12件,则称该车间“质量合格”,求该车间“质量合格”的概率.\n3.某校高三学生数学调研测试后,随机地抽取部分学生进行成绩统计,如图所示是抽取出恶报的所有学生的测试成绩统计结果的频率分布直方图.(1)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计该校高三学生数学调研测试的平均分;(2)用分层抽样的方法在分数段为的学生中抽取一个容量为的样本,则、的学生分别抽取多少人?(3)将(2)中抽取的样本看成一个总体,从中任取人,求恰好有人在分数段的概率.\n4.【2016高考四川文科】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……[4,4.5]分成9组,制成了如图所示的频率分布直方图.(I)求直方图中的a值;(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;(Ⅲ)估计居民月均用水量的中位数.\n5.是指空气中直径小于或等于微米的颗粒物(也称可入肺颗粒物).为了探究车流量与的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与的数据如下表:时间周一周二周三周四周五车流量(万辆)的浓度(微克/立方米)(1)根据上表数据,请在下列坐标系中画出散点图;5052545658727074767880(2)根据上表数据,用最小二乘法求出关于的线性回归方程;(3)若周六同一时间段车流量是万辆,试根据(2)求出的线性回归方程预测,此时的浓度为多少(保留整数)?