• 796.66 KB
  • 2021-07-01 发布

2019届高考数学(理)二轮复习专题透析课件和讲义专题5 概率与统计

  • 26页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
·1· 专题 5 概率与统计 一、计数原理 1.分类加法计数原理和分步乘法计数原理的区别是什么? 分类加法计数原理针对“分类”问题,其中各种方法相互独立,用其中 任何一种方法都可以做完这件事;分步乘法计数原理针对“分步”问题,各 个步骤相互依存,只有各个步骤都完成了才算完成这件事. 2.排列数、组合数的公式及性质是什么? 公 式 (1) =n(n-1)(n-2)…(n-m+1)= (2) = = = (n,m∈N+,且 m≤n) 特别地, =1 性 质 (1)0!=1; =n! (2) = ; = + 3.二项式系数的性质是什么? 性质 性质描述 对称 性 与首末两端“等距离”的两个二项式系数相等,即 = ·2· 增减 性 二项式系 数 当 k< (n∈N+)时,二项式系数是递增的 当 k> (n∈N+)时,二项式系数是递减的 二项 式 系数 的 最大 值 当 n 为偶数时,中间的一项 取得最大值 当 n 为奇数时,中间的两项 与 取得最大值并且相等 4.各二项式系数的和是什么? (1)(a+b)n 展开式的各项二项式系数的和为 + + +…+ =2n. (2)偶数项的二项式系数的和等于奇数项的二项式系数的和,即 + + +…= + + +…=2n-1. 二、概率 1.互斥事件与对立事件有什么区别与联系? 互斥与对立都是两个事件的关系,互斥事件是不可能同时发生的两个事 件,而对立事件除要求这两个事件不同时发生外,还要求二者之一必须有一 个发生.因此,对立事件是互斥事件的特殊情况,而互斥事件不一定是对立事 件. 2.基本事件的三个特点是什么? (1)每一个基本事件发生的可能性都是相等的; (2)任何两个基本事件都是互斥的; (3)任何事件(除不可能事件)都可以表示成基本事件的和. ·3· 3.古典概型、几何概型的概率公式分别是什么? 古典概型的概率公式: P(A)= . 几何概型的概率公式: P(A)= . 三、统计初步与统计案例 1.分层抽样的适用范围是什么? 当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法. 2.如何作频率分布直方图? (1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图. 3.频率分布直方图的特点是什么? (1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示 ,频 率=组距× . (2)在频率分布直方图中,各小长方形的面积总和等于 1.因为在频率分 布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比. ·4· (3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前 者准确,后者直观. 4.如何进行回归分析? (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中 ( , )称为样本点的中心. (3)相关系数 当 r>0 时,表明两个变量正相关; 当 r<0 时,表明两个变量负相关. r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的绝对值越 接近于 0,表明两个变量之间的线性相关性越弱.通常当|r|大于 0.75 时,认 为两个变量有很强的线性相关性. 5.独立性检验的一般步骤是什么? 解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论. 独立性检验的一般步骤: (1)根据样本数据制成 2×2 列联表; (2)根据公式 K2= 计算 K2 的观测值 k; (3)比较 k 与临界值的大小关系,做出统计推断. 四、随机变量及其应用 ·5· 1.离散型随机变量的分布列及性质是什么? (1)离散型随机变量的分布列:若离散型随机变量 X 所有可能的取值为 x1,x2,…,xi,…,xn,X 取每一个值 xi(i=1,2,…,n)的概率为 p1,p2,…,pn,则表 X x1 x2 … xi … xn P p1 p2 … pi … pn 称为离散型随机变量 X 的概率分布列或称为离散型随机变量 X 的分布 列. (2)离散型随机变量的分布列的性质: ①0≤pi≤1(i=1,2,3,…,n); ②p1+p2+…+pn=1; ③P(xi≤X≤xj)=pi+pi+1+…+pj. 2.事件的相互独立性的概念及公式是什么? (1)相互独立的定义:事件A是否发生对事件B是否发生的概率没有影响, 即 P(B|A)=P(B).这时,称事件 A 与事件 B 相互独立,并把这两个事件叫作相 互独立事件. (2)概率公式 条件 公式 事件 A,B 相互 独立 P(A∩B)=P(A)·P(B ) 事件 A1,A2,…,An 相 互 独立 P(A1∩A2∩…∩An) =P(A1)·P(A2)·… ·P(An) 3.独立重复试验与二项分布的概念和公式是什么? ·6· (1)独立重复试验 ①定义:在相同条件下,重复地做 n 次试验,各次试验相互独立,那么一 般就称它们为 n 次独立重复试验. ②概率公式:在一次试验中事件 A 发生的概率为 p,则 n 次独立重复试验 中,事件 A 恰好发生 k 次的概率为 Pn(k)= pk(1-p)n-k(k=0,1,2,…,n). (2)二项分布:在 n 次独立重复试验中,事件 A 发生的次数设为 X,事件 A 不发生的概率为 q=1-p,则 n 次独立重复试验中事件 A 恰好发生 k 次的概率 是 P(X=k)= pkqn-k,其中 k=0,1,2,…,n,于是 X 的分布列: X 0 1 … k … n P p0 qn pq n-1 … pkqn -k … pnq 0 此时称离散型随机变量 X 服从参数为 n,p 的二项分布,记作 X~B(n,p). 4.正态分布的概念及性质是什么? (1)正态曲线:正态变量的概率密度函数的图象叫作正态曲线,其函数表 达 式 为 f(x)= · ,x∈R, 其 中 μ,σ 为 参 数 , 且 σ>0,-∞<μ<+∞. (2)正态曲线的性质 ①曲线位于 x 轴上方,与 x 轴不相交,与 x 轴之间的面积为 1; ②曲线是单峰的,它关于直线 x=μ对称; ·7· ③曲线在 x=μ处达到峰值 ; ④当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总 体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散. (3)正态总体在三个特殊区间内取值的概率值 ①P(μ-σP2 B.P1100,D 正确.故 选 C. 答案▶ C 13.(2017·全国Ⅲ卷·理 T3)某城市为了解游客人数的变化规律,提高旅游 服务质量,收集并整理了 2014 年 1 月至 2016 年 12 月期间月接待游客量(单 位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是( ). A.月接待游客量逐月增加 ·15· B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在 7,8 月 D.各年 1 月至 6 月的月接待游客量相对于 7 月至 12 月,波动性更小,变 化比较平稳 解析▶ 对于选项 A,由图易知,月接待游客量每年 7,8 月份明显高于 12 月份,故 A 错误;对于选项 B,观察折线图的变化趋势可知,年接待游客量逐年 增加,故 B 正确;对于选项 C,D,由图可知显然正确. 答案▶ A (八)考查离散型随机变量分布列、超几何分布、条件概率、正态分布、 数学期望与方差,求离散型随机变量的数学期望是全国卷高考重点考查的内 容,在选择题、填空题中有时会出现.主要考查离散型随机变量的分布列、数 学期望、正态分布等. 14.(2018·全国Ⅲ卷·理 T8 改编)某群体中的每位成员使用移动支付的概 率都为 p,各成员的支付方式相互独立,设 X 为该群体的 10 位成员中使用移 动支付的人数,D(X)=2.1,P(X=4)0.5.故 p=0.7. ·16· 答案▶ A 15.(2017·全国Ⅱ卷·理 T13 改编)一批产品的二等品率为 0.08,从这批产 品中每次随机取一件,有放回地抽取 100 次,X 表示抽到的二等品件数,则 D(X)= . 解析▶ 有放回地抽取,是一个二项分布模型,其中 p=0.08,n=100,则 D(X)=np(1-p)=100×0.08×0.92=7.36. 答案▶ 7.36 二、解答题的命题特点 概率与统计综合试题的题干阅读量大,容易造成考生在数学模型转化过 程中失误,得分率不高.这些试题主要考查古典概型,用样本估计总体,利用 回归方程进行预测,独立性检验的应用,离散型随机变量的分布列和数学期 望,正态分布等.概率、随机变量的数学期望交汇命题,高考对此类题目的要 求是能根据给出的或通过统计图表给出的相关数据求线性回归方程. 1.(2018·全国Ⅱ卷·理 T18)下图是某地区 2000 年至 2016 年环境基础设施 投资额 y(单位:亿元)的折线图. 为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两 个线性回归模型.根据 2000 年至 2016 年的数据(时间变量 t 的值依次为 ·17· 1,2,…,17)建立模型①: =-30.4+13.5t;根据2010年至2016年的数据(时间 变量 t 的值依次为 1,2,…,7)建立模型②: =99+17.5t. (1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测 值. (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 解析▶ (1)利用模型①,从 2000 年开始算起,2018 年即 t=19,所以该地 区 2018 年的环境基础设施投资额的预测值为 =-30.4+13.5×19=226.1(亿 元). 利用模型②,从 2010 年开始算起,2018 年即 t=9,所以该地区 2018 年的 环境基础设施投资额的预测值为 =99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠. 理由如下: (i)从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布 在直线 y=-30.4+13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线 性模型①不能很好地描述环境基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的 点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化 规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型 =99+17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势, 因此利用模型②得到的预测值更可靠. (ii)从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由 ·18· 模型①得到的预测值 226.1 亿元的增幅明显偏低,而利用模型②得到的预测 值的增幅比较合理,说明利用模型②得到的预测值更可靠. 2.(2018·全国Ⅰ卷,理 T20)某工厂的某种产品成箱包装,每箱 200 件,每一 箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格 品.检验时,先从这箱产品中任取 20 件作检验,再根据检验结果决定是否对 余下的所有产品作检验.设每件产品为不合格品的概率都为 p(00,f(p)单调递增;当 p∈ 时,f'(p)<0,f(p)单调递减. 故 f(p)max=f(p0)=f ,即 p0= . (2)(i)由题意,剩余未作检验的产品有180件,其中Y表示不合格品的件 数,其服从二项分布 Y~B . 故 E(Y)=180× =18. 又 X=40+25Y, 故 E(X)=E(40+25Y)=40+25×18=490(元). (ii) 若 对 这 箱 余 下 的 所 有 产 品 作 检 验 , 则 需 要 的 检 验 费 为 200×2=400(元). 因为 E(X)=490>400,所以需要对这箱余下的所有产品作检验. 3.(2018·全国Ⅲ卷·理 T18)某工厂为提高生产效率,开展技术创新活动, 提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率, 选取 40 名工人,将他们随机分成两组,每组 20 人,第一组工人用第一种生产 方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单 位:min)绘制了如下茎叶图: ·20· (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由. (2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需 时间超过 m 和不超过 m 的工人数填入下面的列联表: 超过 m 不超过m 第一种生产方 式 第二种生产方 式 (3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差 异? 附:K2= , P(K2≥k0 ) 0.050 0.010 0.001 k0 3.841 6.635 10.828 解析▶ (1)第二种生产方式的效率更高. 理由如下: (i)由茎叶图可知,用第一种生产方式的工人中,有 75%的工人完成生产 任务所需时间至少 80 分钟,用第二种生产方式的工人中,有 75%的工人完成 生产任务所需时间至多 79 分钟,因此第二种生产方式的效率更高. (ii)由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间的 中位数为 85.5 分钟,用第二种生产方式的工人完成生产任务所需时间的中 位数为 73.5 分钟,因此第二种生产方式的效率更高. (iii)由茎叶图可知,用第一种生产方式的工人完成生产任务平均所需 ·21· 时间高于 80 分钟,用第二种生产方式的工人完成生产任务平均所需时间低 于 80 分钟,因此第二种生产方式的效率更高. (iv)由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间分 布在茎8上的最多,关于茎 8大致呈对称分布;用第二种生产方式的工人完成 生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种 生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二 种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所 需的时间更少,因此第二种生产方式的效率更高. (2)由茎叶图知 m= =80. 列联表如下: 超过 m 不超过m 第一种生产方 式 15 5 第二种生产方 式 5 15 (3)因为 K2 的观测值 k= =10>6.635,所以有 99% 的把握认为两种生产方式的效率有差异. 4.(2017·全国Ⅰ卷·理 T19)为了监控某种零件的一条生产线的生产过程, 检验员每天从该生产线上随机抽取 16 个零件,并测量其尺寸(单位:cm).根 据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正 态分布 N(μ,σ2). (1)假设生产状态正常,记 X 表示一天内抽取的 16 个零件中其尺寸在 ·22· (μ-3σ,μ+3σ)之外的零件数,求 P(X≥1)及 X 的数学期望. (2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就 认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产 过程进行检查. (i)试说明上述监控生产过程方法的合理性. (ii)下面是检验员在一天内抽取的 16 个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经 计 算 得 = xi=9.97,s= = ≈0.212,其中 xi 为抽取的第 i 个零件的尺寸,i=1,2,…,16. 用样本平均数 作为μ的估计值 ,用样本标准差s作为σ的估计值 ,利用估 计值判断是否需对当天的生产过程进行检查?剔除( -3 , +3 )之外的数据, 用剩下的数据估计μ和σ(精确到 0.01). 附 : 若 随 机 变 量 Z 服 从 正 态 分 布 N(μ,σ2), 则 P(μ-3σ