- 469.91 KB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
2018年高考数学讲练测【新课标版理】【讲】第十一章 统计,统计案例
第02节 用样本估计总体
【考纲解读】
考 点
考纲内容
五年统计
分析预测
样本估计总体
(1) 了解分布的意义和作
用会列频率分布表,会画频率分布直方图、频率折线图、茎叶
图,理解它们各自的特点.
(2) 理解样本数据标准差
的意义和作用,会计算数据标准差.
(3) 能从样本数据中提取
基本的数字特征(如平均数、标准差),并给出合理的解释.
(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
(5) 会用随机抽样的基本
方法和样本估计总体的思想解决一些简单的实际问题.
2017课标Ⅲ,理3
2016课标Ⅲ,理4
2015课标Ⅱ,理18
2013课标I,理3
1.样本估计总体跟其他知识进行综合考查.
【知识清单】
一.频率分布直方图
1.频率分布直方图
(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的特征数估计总体的特征数.
(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图
连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.
(2)总体密度曲线
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.统计中称之为总体分布的密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.
对点练习:
某市某年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)作出频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
【答案】见解析.
【解析】(1)频率分布表:
(2)频率分布直方图:
二.茎叶图
茎叶图:
定义
是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数
画法
对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.
对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎
优缺点
用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图中得到;(2)便于记录和读取,能够展示数据的分布情况.缺点是:当样本数据较多或数据位数较多时,茎叶图就显得不太方便
对点练习:
某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412, 414,415,421,423,423,427,430,430,434,443,445,445,451,454
品种B:363,371,374,383,385,386,391,392,394,394,395, 397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)作出茎叶图;
(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
【答案】(1)见解析;(2)品种A的亩产稳定性较差.
【解析】(1)
(2)结合茎叶图可知:①品种A的亩产平均数比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.
三.用样本的数字特征估计总体的数字特征
1.用样本的特征数估计总体的特征数
(1)众数、中位数、平均数
众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
平均数:样本数据的算术平均数,即.
在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(2)样本方差、标准差
样本方差
标准差.
其中xn是样本数据的第n项,n是样本容量,是平均数.
2.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
对点练习:
对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )
A.46,45,56
B.46,45,53
C.47,45,56
D.45,47,53
【答案】
【考点深度剖析】
本节主要考查学生在应用问题中构造抽样模型、识别模型、选择适当的抽样方法抽取样本.
【重点难点突破】
考点1频率分布直方图
【1-1】【2017届山东肥城市高三上学期升级统测数学】如图是某居民小区年龄在岁到岁的居民上网
情况的频率分布直方图,现已知年龄在的上网人数呈现递减的等差数列,则年龄在的频率是( )
A. B. C. D.
【答案】C
【1-2】【2017全国3卷】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月份
D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳
【答案】A
【解析】由折线图,7月份后月接待游客量减少,A错误;
本题选择A选项.
【领悟技法】
1. 频率分布条形图的纵轴(矩形的高)表示频率;频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其各小组的频率等于该小组上的矩形的面积.
2. 作频率分布直方图的步骤:
【触类旁通】
【变式一】【2017届河北唐山市高三上学期调研统考一数学】某班学生一次数学考试成绩频率分布直方图如图所示,数据分组依次为,若成绩大于等于分的人数为,则成绩在的人数为( )
A. B.
C. D.
【答案】A
【解析】
试题分析:的频率为,大于的频率为,总人数为人,故人数为.
【变式二】【2016四川理16】我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨)、一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年位居民每人的月均用水量(单位:吨),将数据按照, ,, 分成组,制成了如图所示的频率分布直方图.
(1)求直方图中的值;
(2)设该市有万居民,估计全市居民中月均用水量不低于吨的人数,请说明理由;
(3)若该市政府希望使的居民每月的用水量不超过标准(吨),估计的值,并说明理由.
【答案】(1)(2)36000;(3)2.9
【解析】(1)由频率分布直方图知,月均用水量在中的频率为,同理,在,,, ,,中的频率分别为, , , , , .
由,解得.
考点2 茎叶图
【2-1】【改编自2013年重庆】以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为 .
【答案】
【解析】因为甲组数据的中位数为,由茎叶图可得.因乙组数据的平均数为,则,解得,答案为
【2-2】【吉林省长春市普通高中2018届高三一模】已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )
A. 92,94 B. 92,86 C. 99,86 D. 95,91
【答案】B
【解析】 由茎叶图可知,中位数为92,众数为86. 故选B.
【领悟技法】
1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.
2.茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.
3.当样本数据较少时,用茎叶图表示数据的效果较好,而样本数据较多时,则不方便记录
【触类旁通】
【变式一】【2015高考湖南2】在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图I所示;
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为( )
A、3 B、4 C、5 D、6
【答案】B
【解析】根据茎叶图中的数据,得;成绩在区间[139,151]上的运动员人数是20,用系统抽样方法从35人
中抽取7人,成绩在区间[139,151]上的运动员应抽取 (人),故选B.
【变式二】【天津市十二重点中学2017届高三第二次联考】甲、乙两名篮球运动员在10场比赛中得分的茎叶图如图所示,则“”是“甲运动员得分平均数大于乙运动员得分平均数”的( )
A. 充分不必要条件 B. 必要不充分条件
C. 充分必要条件 D. 既不充分也不必要条件
【答案】A
考点3 用样本的数字特征估计总体的数字特征
【3-1】【2017届河北石家庄市高三9月联考】我国是世界上严重缺水的国家,城市缺水尤为突出.某市为了制定合理的节水方案,从该市随机调查了100位居民,获得了他们某月的用水量,整理得到如图的频率分布直方图.
(1)求图中的值并估计样本的众数;
(2)设该市计划对居民生活用水试行阶梯水价,即每位居民用水量不超过吨的按2元/吨收费,超过吨不超过2吨的部分按4元/吨收费,超过2吨的部分按照10元/吨收费.
①用样本估计总体,为使75%以上居民在该月的用水价格不超过4元/吨,至少定为多少?
②假设同组中的每个数据用该组区间的右端点值代替,当时,估计该市居民该月的人均水费.
【答案】(1),众数为;(2)①;②元.
【解析】
试题分析:(1)由频率分布直方图中各矩形面积总和为列出方程可求的值;最高矩形的中点值即为众数;
(2)①由(1)可知月用水量在[0,2.5]内的频率为0.04+0.08+0.15+0.22+0.26=0.75, 区间[0,2.5]的中点值即为所求;②当时,用矩形的右端点值乘以频率再乘以相应的水费求和即可求出居民月平人均用水费.
试题解析:
(1)由频率分布直方图可知每段内的频率:[0,0.5]:0.04;
(0.5,1]:0.08;(1,1.5]:0. 15; (1.5,2]:0.22; (2,2.5]:0.26; (2.5,3]:0.5;(3,3.5]:0.06;
(3.5,4]:0.04;(4.4.5]:0.02 则由0.04+0.08+0.15+0.22+0.26+0.5+0.06+0.04+0.02=1
解得,
众数为[2,2.5]的中点值2.25
(2)①由(1)可知月用水量在[0,2.5]内的频率为0.04+0.08+0.15+0.22+0.26=0.75,
的值至少为1.25;
②若,
当居民月用水量在[0,2]时,居民该月的人均水费为:
(0.04×0.5+0.08×1+0.15×1.5+0.22×2)×2=1.53
当居民月用水量在(2,2.5]时,居民该月的人均水费为:
(2×2+0.5×4) ×0.26=1.56
当居民月用水量在(2.5,3]时,居民该月的人均水费为:
(2×2+1×4) ×0.13=1.04
当居民月用水量在(3,3.5]时,居民该月的人均水费为:
(2×2+1.5×4) ×0.06=0.6
当居民月用水量在(3.5,4]时,居民该月的人均水费为:
(2×2+2×4) ×0.04=0.489分
当居民月用水量在(4,4.5]时,居民该月的人均水费为:
(2×2+2×4+0.5×10) ×0.02=0.3410分
居民月人均水费为1.53+1.56+1.04+0. 6+0.48+0.34=5.55元.
【3-2】【”超级全能生”2018届高考全国卷26省9月联考节选】某研究小组为了研究某品牌智能手机在正常使用情况下的电池供电时间,分别从该品牌手机的甲、乙两种型号中各选取部进行测试,其结果如下:
甲种手机供电时间(小时)
乙种手机供电时间(小时)
(1)求甲、乙两种手机供电时间的平均值与方差,并判断哪种手机电池质量好;
【答案】(1)甲种手机电池质量更好
【解析】试题分析:(1)由平均值公式和方差公式分别求平均值与方差,得==
=甲的稳定性更好,甲质量更好。
试题解析:(1)甲的平均值,
乙的平均值,
甲的方差
乙的方差
因为甲、乙两种手机的平均数相同,甲的方差比乙的方差小,所以认为甲种手机电池质量更好.
【领悟技法】
1. 在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.
2.平均数与方差都是重要的特征数,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,掌握公式不难求出,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
【触类旁通】
【变式一】【湖南师范大学附属中学2017届高三下学期高考模拟(二)】下边的茎叶图记录了甲、乙两名同学在10次英语听力比赛中的成绩(单位:分),已知甲得分的中位数为76分,乙得分的平均数是75分,则下列结论正确的是( )
A. x甲=76,x乙=75
B. 甲数据中x=3,乙数据中y=6
C. 甲数据中x=6,乙数据中y=3
D. 乙同学成绩较为稳定
【答案】C
【解析】因为甲得分的中位数为76分,所以x=6,因为乙得分的平均数是75分,所以,解得y=3,故选C.
【变式二】【2017届湖南省衡阳市高三下学期第二次联考】一组数据共有7个数,记得其中有10、2、5、2、4、2,还有一个数没记清,但知道这组数的平均值、中位数、众数依次成等差数列,这个数的所有可能值的和为( )
A. B. 3 C. 9 D. 17
【答案】C
【解析】设没记清的数为,若,则这列数: ,2,2,2,4,5,10,平均数为,中位数为2,众数为2,所以, ,若,则这列数为2,2,2, ,4,5,10,则平均数为,中位数为,众数为2,所以,若,则这列数为
2,2,2,4,5, ,10,或 2,2,2,4,5,10, ,则平均数为,中位数4,众数2,所以,所以-11+3+17=9
易错试题常警惕
易错典例:某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
易错分析:(1)对频率分布直方图中纵轴的含义不明确,频率分布直方图中纵轴表示,而不是相应的频率值;
(2)利用频率分布直方图求平均值时,应是用每组的频率乘以每组的组中值,而不是每组的频率乘以每组的端点值;
(3)通过表格分析计算时,比例关系对应不准出现错误..
正确解析:(1)由频率分布直方图可知
(2)估计该100名学生的语文成绩的平均分为
(分)
(3)由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得表:
10分
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x
5
40
30
20
x∶y
1∶1
2∶1
3∶4
4∶5
y
5
20
40
25
于是数学成绩在[50,90)之外的人数为
100-(5+20+40+25)=10.
温馨提醒:(1)频率分布直方图中纵轴表示,而不是相应的频率值;
(2)利用频率分布直方图求平均值时,应是用每组的频率乘以每组的组中值,而不是每组的频率乘以每组的端点值.
学科素养提升之思想方法篇
创新题型
平均数与方差的性质
样本的平均数和方差是样本的两个重要的数字特征,在统计上一般用样本的平均数和方差去估计总体的平均数和方差.计算样本的平均数和方差,用样本的平均数和方差对实际问题作出统计解释,是高考考查统计的重点.下面介绍平均数和方差的一些性质.
1.平均数的性质
(1)若给定一组数据x1,x2,…,xn的平均数为,则ax1,ax2,…,axn的平均数为a.
(2)若给定一组数据x1,x2,…,xn的平均数为,则ax1+b,ax2+b,…,axn+b的平均数为a+b.
(3)若M个数的平均数是X,N个数的平均数是Y,则这M+N个数的平均数是;若两组数x1,x2,…,xn和y1,y2,…,yn的平均数分别是和,则x1+y1,x2+y2,…,xn+yn的平均数是+.
2.方差的性质
(1)若给定一组数据x1,x2,…,xn,方差为s2,则ax1,ax2,…,axn的方差为a2s2;
(2)若给定一组数据x1,x2,…,xn,方差为s2,则ax1+b,ax2+b,…,axn+b的方差为a2s2,特别地,当a=1时,有x1+b,x2+b,…,xn+b的方差为s2,这说明将一组数据的每一个数据都加上一个相同的常数,方差是不变的,即不影响数据的波动性.
【典例】如果数据x1,x2,…,xn的平均数为,方差为s2,则2x1+3,2x2+3,…,2xn+3的平均数和方差分别为( )
A.和s2 B.2+3和4s2
C.2+3和s2 D.2+3和4s2+12s+9
【答案】B
温馨提醒 解决平均数与方差的问题,不要盲目求解,要先观察数据的特征,寻找运算的捷径,做到事半功倍.