- 1.49 MB
- 2021-07-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计图与样本数字特征及概率是高考的必考点,题目难度中等。只要考生对常见的
统计图如;频率分布直方图,茎叶图等能准确读取需要信息,能够计算数字特征
(平均数,方差等)及事件的概率,进而做出相应推断。常见问题归纳如下;
类型一 频率分布直方图读取与样本数据特征 类型二 频率分布
直方图与概率
【基础知识整合】
1.频率分布直方图
作图的步骤;(1)求极差(即一组数据中最大值与最小值的差).
(2)决定 组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频
率分布直方图.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图;连接频率分布直方图中各小长方形上端的中点,就得到
频率分布折线图.
(2)总体密度曲线;随着样本容量的增加,作图时所分的组数增加,组距减小,
相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为
总体密度曲线.
3.样本的数字特征及意义
(1)众数、中位数、平均数
数字特征 定义与求法
众数 一组数据中重复出现次数最多的数
中位数
把一组数据按大小顺序排列,处在最中间位置的一个数据(或两个数据的
平均数)
平均数 如果有 n 个数据 x1,x2,…,xn,那么这 n 个数的平均数x=1
n(x1+x2+…+
xn)
(2)标准差、方差
①标准差: 表示样本数据到平均数的一种平均距离,一般用 s 表示,
s= 1
n[(x1-x o(x))2+(x2-x o(x))2+…+(xn-x o(x))2].
②方差:标准差的平方 s2 叫做方差;s2=1
n(x1-x)2+(x2-x)2+…+(xn-x)2],
其中 xi(i=1,2,3,…,n)是样本数据,n 是样本容量,x是样本平均数.
名师点睛:(1)频率分布直方图与众数、中位数与平均数的关系:
①最高的小长方形底边中点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长
方形的面积乘以小长方形底边中点的横坐标之和.
(2)平均数、方差公式的推广;若数据 x1,x2,…,xn 的平均数为 x-
,方差为 s2,
则数据
ax1+b,ax2+b,…,axn+b 的平均数为 a x-
+b,方差为 a2s2.
(3)方差 s2=1
n(x1-x)2+(x2-x)2+…+(xn-x)2]=1
n(x21+x22+…+x2n)-nx2].
类型一 频率分布直方图的读取与样本数据特征
【典例 1】【2014 课标全国Ⅰ(文)18】从某企业生产的某种产品中抽取 100 件,测量
这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标
值分组
75,85) 85,95) 95,105) 105,115) 115,125)
频数 6 26 38 22 8
(1)在 答题卡上作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中
点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值
不低于 95 的产品至
少要占全部产品 80%”的规定?
【答案】(1)见试题解析 (2)100 , 104. (3)不能
考点;频率分布直方图,样本的数字特征
【思路点拨】在第(1)问中,按照画频率分布直方图的步骤,先求出各组的频率,再结合组距求
出各个小矩形的高即可作出各个小矩形,从而作出频率分布直方图;在第(2)问中,可
结合提示与(1)中的频率分布直方图,根据平均数与方差的计算公式代入相关数据进行
求解;第(3)问主要考查用样本估计总体,可通过样本数据中“质量指标值不低于 95”的
频率是否大于 0.8 来作出判断.
【变式练习】
1.【2016 高考山东(文)】某高校调查了 200 名学生每周的自习时间(单位:小时),制
成了如图所示的频率分布直方图,其中自习时间的范围是 17.5,30],样本数据分组为
17.5,20), 20,22.5), 22.5,25),25,27.5),27.5,30).根据直方图,这 200 名学生中每
周的自习时间不少于 22.5 小时的人数是( )
(A)56 (B)60 (C)120 (D)140
【答案】D
【解析】由频率分布直方图知,自习时间不少于 22.5 小时的有
,
选 D.
考点:频率分布直方图
2. 【2016 高考北京(文)18】某市民用水拟实行阶梯水价,每人用水量中不超过 w 立方米的
部分按 4 元/立方米收费,超出 w 立方米的部分按 10 元/立方米收费,从该市随机调查了 10000
位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
200 (0.16 0.08 0.04) 2.5 140× + + × =
(I) 如果 w 为整数,那么根据此次调查,为使 80%以上居民在该月的用水价格为 4 元/立
方米,
w 至少定为多少?
(II)假设同组中的每个数据用该组区间的右端点值代替,当 w=3 时,估计该市居民该月的人
均水费.
【答案】(Ⅰ)3; (Ⅱ)10.5 元.
考点:频率分布直方图求频率,频率分布直方图求平均数的估计值.
【思路点拨】1.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估
计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上
比较准确,直方图比较直观.2.频率分布表中的频数之和等于样本容量,各组中的频率
之和等于 1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,
所有小长方形的面积的和等于 1.
3.【2016 高考四川(文)】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居
民用水情况进行了调查,通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),
将数据按照 0,0.5), 0.5,1),……4,4.5]分成 9 组,制成了如图所示的频率分布直方图.
(I)求直方图中的 a 值;
(II)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数.说明理由;
(Ⅲ)估计居民月均用水量的中位数.
【答案】(Ⅰ) ;(Ⅱ)36000;(Ⅲ)2.04.
考点:频率分布直方图、频率、频数的计算公式
【思路点拨】(Ⅰ)由高×组距=频率,计算每组中的频率,因为所有频率之和为 1,计算出 a 的
值;(Ⅱ)利用高×组距=频率,先计算出每人月均用水量不低于 3 吨的频率,再利
用频率×样本总数=频数,计算所求人数;(Ⅲ)将前 5 组的频率之和与前 4 组的频
率之和进行比较,得出 2≤x<2.5,再进行计算.
4.【2015 高考广东(文)17】某城市 户居民的月平均用电量(单位:度),以 ,
, , , , , 分组的频率分
布直方图如图.
(1)求直方图中的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为 , , , 的四组用户中,
用分层抽样的
0.30a =
100 [ )160,180
[ )180,200 [ )200,220 [ )220,240 [ )240,260 [ )260,280 [ ]280,300
[ )220,240 [ )240,260 [ )260,280 [ ]280,300
方法抽取 户居民,则月平均用电量在 的用户中应抽取多少户?
【答案】(1) ; (2) , ;(3).
( 2 ) 月 平 均 用 电 量 的 众 数 是 , 因 为
,
所以月平均用电量的中位数在 内,设中位数为,
由 得: ,所以月平均用
电量的
中位数是
( 3 ) 月 平 均 用 电 量 为 的 用 户 有 户 , 月 平 均 用 电 量 为
的用户
有 户,月平均用电量为 的用户有 户,
月平均用
电量为 的用户有 户,抽取比例 ,所
以月平均用
电量在 的用户中应抽取 户
考点:1、频率分布直方图;2、样本的数字特征(众数、中位数);3、分层抽样.
11 [ )220,240
0.0075 230 224
220 240 2302
+ =
( )0.002 0.0095 0.011 20 0.45 0.5+ + × = <
[ )220,240
( ) ( )0.002 0.0095 0.011 20 0.0125 220 0.5a+ + × + × − = 224a =
224
[ )220,240 0.0125 20 100 25× × =
[ )240,260
0.0075 20 100 15× × = [ )260,280 0.005 20 100 10× × =
[ ]280,300 0.0025 20 100 5× × = 11 1
25 15 10 5 5
= =+ + +
[ )220,240 125 55
× =
【思路点拨】本题主要考查的是频率分布直方图、样本的数字特征(众数、中位数)和分层抽
样,属于中档题.解题时一定要注意频率分布直方图的纵轴是 ,否则很容易出
现错误.解本题需要掌握的知识点是频率分布直方图、样本的数字特征(众数、中
位数)和分层抽样,即在频率分布直方图中,各小长方形的面积的总和等于,众数
是最高矩形的横坐标中点,中位数左边和右边的直方图的面积相等,
, .
类型二 频率分布直方图与概率
【典例 1】【2015 新课标 2(文)18】某公司为了了解用户对其产品的满意度,从 A,B 两地区分别随
机调查了 40 个用户,根据用户对其产品的满意度的评分,得到 A 地区用户满意度评分的
频率分布直方图和 B 地区用户满意度评分的频率分布表.
A 地区用户满意度评分的频率分布直方图
B 地区用户满意度评分的频率分布表
满意度评分分组
频数 2 8 14 10 6
(I)在答题卡上作出 B 地区用户满意度评分的频率分布直方图,并通过此图比较两地区满意度
评分的平均值及分散程度.(不要求计算出具体值,给出结论即可)
B 地区用户满意度评分的频率分布直方图
频率
组距
= × 频率频率 组距 组距
= 样本容量抽取比例 总体容量
[50,60) [50,60) [50,60) [50,60) [50,60)
(II)根据用户满意度评分,将用户的满意度评分分为三个等级:
满意度评分 低于 70 分 70 分 到 89
分
不低于 90 分
满意度等级 不满意 满意 非常满意
估计那个地区的用户的满意度等级为不满意的概率大,说明理由.
【答案】(I)见试题解析(II)A 地区的用户的满意度等级为不满意的概率大.
【解析】(I)
考点; 频率分布直方图及概率估计.
【思路点拨】本题考查主要内容是频率分布直方图及应用,注意在制作频率分布直方图或利用频
率分布直方图估计概率时容易出现的一个错误是误将频率当作纵坐标画图错误或
估计概率错误,故提醒考生:频率分布直方图中纵坐标是频率/组距,而不是频率.
【变式练习】
1.【2015 高考安徽(文)17】某企业为了解下属某部门对本企业职工的服务情况,随机访问 50
名职工,根据这 50 名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数
据分组区间为
(Ⅰ)求频率分布图中的值;
(Ⅱ)估计该企业的职工对该部门评分不低于 80 的概率;
(Ⅲ)从评分在 的受访职工中,随机抽取 2 人,求此 2 人评分都在 的概率.
【答案】(Ⅰ)0.006;(Ⅱ) ;(Ⅲ)
【解析】 (Ⅰ)因为 ,所以
( Ⅱ ) 由 所 给 频 率 分 布 直 方 图 知 , 50 名 受 访 职 工 评 分 不 低 于 80 的 频 率 为
,
所以该企业职工对该部门评分不低于 80 的概率的估计值为 .
[40,50],[50,60], ,[80,90],[90,100]
[40,60] [40,50]
0.4 1
10
110)028.02022.00018.0004.0( =×+×+++ a 006.0=a
4.010)018.0022.0( =×+
0.4
考点;本题主要考查了频率分布直方图、概率和频率的关系、古典概型等基础知识.
【思路点拨】利用频率分布直方图解题的时,注意其表达的意义,同时要理解频率是概率的估
计值这一基础知识;在利用古典概型解题时,要注意列出所有的基本事件,千万
不可出现重、漏的情况.
2.【2014 高考北京(文)18】 从某校随机抽取 100 名学生,获得了他们一周课外阅读时间(单
位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于 12 小时的概率;
(2)求频率分布直方图中的 a,b 的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的 100 名学生该周课
外阅读时间的平均数在第几组(只需写出结论)
【答案】(1) ;(2) , ;(3)第 4 组.0.9 0.085a = 0.125b =
考点:本小题主要考查频率分布表、频率分布直方图、频率与概率
3.【2014 高考重庆(文)17】20 名学生某次数学考试成绩(单位:分)的频数分布直
方图如下:
(I)求频率分布直方图中的值;
(II)分别球出成绩落在 与 中的学生人数;
(III)从成绩在 的学生中人选 2 人,求此 2 人的成绩都在 中的概率.
【答案】(I) ;(II)2,3;(III) .
[ )6050, [ )7060,
[ )7050, [ )7060,
0.005a = 3
10
考点:1、频率分布直方图;2、古典概型.
【解题技巧与方法总结】
1.绘制频率分布直方图时需注意;
(1)制作好频率分布表后,可以利用各组的频率之和是否为 1 来检验该表是否正确.
(2)频率分布直方图的纵坐标是频率
组距,而不是频率.
2.由频率分布直方图进行相关计算时,需掌握下列关系式;
(1)频率
组距×组距=频率.
(2) 频数
样本容量=频率,此关系式的变形为频数
频率=样本容量,样本容量×频率=频
数.
3. 频率分布直方图与众数、中位数与平均数的关系:
①最高的小长方形底边中点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面
积乘以小长方形底边中点的横坐标之和.
4.计算频率分布直方图问题中的概率时,要准确读出需要数据,然后运用古典概型进行计算。