- 1.49 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第2节 用样本估计总体
[
考纲展示
]
1.
了解分布的意义和作用
,
能根据频率分布表画频率分布直方图、频率折线图、茎叶图
,
体会它们各自的特点
.
2.
理解样本数据标准差的意义和作用
,
会计算数据标准差
.
3.
能从样本数据中提取基本的数字特征
(
如平均数、标准
差
),
并作出合理的解释
.
4.
会用样本的频率分布估计总体分布
,
会用样本的基本数字特征估计总体的基本数字特征
,
理解用样本估计总体的思想
.
5.
会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题
.
知识链条完善
考点专项突破
知识链条完善
把散落的知识连起来
知识梳理
1.作频率分布直方图的步骤
2.
频率分布折线图和总体密度曲线
(1)
频率分布折线图
:
连接频率分布直方图中各小长方形上端的
,
就得频率分布折线图
.
(2)
总体密度曲线
:
随着
的增加
,
作图时所分的组数增加
,
减小
,
相应的频率折线图会越来越接近于一条光滑曲线
,
即总体密度曲线
.
中点
样本容量
组距
3.
茎叶图
定义
统计中用来表示数据的一种图
,
茎是指中间的一列数
,
叶就是从茎的旁边生长出来的数
画法
对于样本数据较少
,
且分布较为集中的一组数据
:
若数据是两位整数
,
则将十位数字作茎
,
个位数字作叶
;
若数据是三位整数
,
则将百位、十位数字作茎
,
个位数字作叶
.
样本数据为小数时做类似处理
.
对于样本数据较少
,
且分布较为集中的两组数据
,
关键是找到两组数据共有的茎
优缺点
用茎叶图表示数据的优点是
(1)
所有的信息都可以从茎叶图中得到
;(2)
便于记录和读取
,
能够展示数据的分布情况
.
缺点是当样本数据较多或数据位数较多时
,
茎叶图就显得不太方便
4.
样本的数字特征
数字
特征
定义
特点
众数
在一组数据中出现次数最多的数据
体现了样本数据的最大集中点
,
不受极端值的影响
,
而且可能不唯一
中位数
将一组数据按大小顺序依次排列
,
处在最中间位置的一个数据
(
或最中间两个数据的平均数
)
中位数不受极端值的影响
,
仅利用了排在中间数据的信息
【
重要结论
】
1.
频率分布直方图中各个小矩形的面积之和为
1,
纵轴上的数据是各组的频率除以组距的结果
.
2.
在频率分布直方图中
,
各组的中点值乘以各组的频率之和即为样本数据平均值的估计值
.
3.
在频率分布直方图中
,
垂直于横轴的直线如果把各个小矩形的面积等分
,
则其对应的数据即为中位数的估计值
.
对点自测
1.
如图是某样本数据的茎叶图
,
则该样本的中位数、众数、极差分别是
(
)
(A)32
34
32
(B)33
45
35
(C)34
45
32
(D)33
36
35
B
解析
:
根据茎叶图所给样本数据易知中位数、众数、极差分别是
33,45,35.
故选
B.
2.2 000
辆汽车通过某一段公路时的时速的频率分布直方图如图所示
,
时速在
[50,60)
内的汽车大约有
(
)
(A)300
辆
(B)400
辆
(C)600
辆
(D)800
辆
C
解析
:
由题目频率分布直方图可以看出
,
时速在
[50,60)
内的汽车大约有
0.03×10×2 000=600(
辆
).
故选
C.
3.(
2017
·
全国
Ⅰ
卷
)
为评估一种农作物的种植效果
,
选了
n
块地作试验田
.
这
n
块地的亩产量
(
单位
:kg)
分别为
x
1
,x
2
,…,x
n
,
下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
(
)
(A)x
1
,x
2
,…,x
n
的平均数
(B)x
1
,x
2
,…,x
n
的标准差
(C)x
1
,x
2
,…,x
n
的最大值
(D)x
1
,x
2
,…,x
n
的中位数
B
解析
:
标准差衡量样本的稳定程度
,
故选
B.
4.(
2018
·
云南昆明联考
)CPI
是居民消费价格指数的简称
.
居民消费价格指数
,
是一个反映居民家庭一般所购买的消费品价格水平变动情况的宏观经济指标
.
下面是根据统计局发布的
2017
年
1
月~
7
月的
CPI
同比增长与环比增长涨跌幅数据绘制的折线图
.(
注
:2017
年
2
月与
2016
年
2
月相比较
,
叫同比
;2017
年
2
月与
2017
年
1
月相比较
,
叫环比
)
根据该折线图
,
则下列结论错误的是
(
)
(A)2017
年
1
月~
7
月分别与
2016
年
1
月~
7
月相比较
,CPI
有涨有跌
(B)2017
年
1
月~
7
月
CPI
有涨有跌
(C)2017
年
1
月~
7
月分别与
2016
年
1
月~
7
月相比较
,1
月
CPI
涨幅最大
(D)2017
年
2
月~
7
月
CPI
涨跌波动不大
,
变化比较平稳
A
解析:
2017年1月~7月同比都是正增长,只是增长的幅度有大有小,同比增长最大是1月为2.5%,环比增长幅度不大,2月~7月CPI变化不大,相对稳定,故选A.
5.
下列说法正确的是
.
①
在频率分布直方图中
,
小矩形的高表示频率
.
②
频率分布直方图中各个长方形的面积之和为
1.
③
茎叶图中的数据要按从小到大的顺序写
,
相同的数据可以只记一次
.
④
平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
.
⑤
一组数据的方差越大
,
说明这组数据的波动越大
.
答案
:
②④⑤
6.(
人教
A
版教材习题改编
)
如图是
100
位居民月均用水量的频率分布直方图
,
则月均用水量为
[2,2.5)
范围内的居民数有
人
.
答案
:
25
考点专项突破
在讲练中理解知识
考点一 频率分布直方图
(
折线图
)
【
例
1】
(1)(2
017
·
全国
Ⅲ
卷
)
某城市为了解游客人数的变化规律
,
提高旅游服务质量
,
收集并整理了
2014
年
1
月至
2016
年
12
月期间月接待游客量
(
单位
:
万人
)
的数据
,
绘制了下面的折线图
.
根据该折线图
,
下列结论错误的是
(
)
(A)
月接待游客量逐月增加
(B)
年接待游客量逐年增加
(C)
各年的月接待游客量高峰期大致在
7,8
月
(D)
各年
1
月至
6
月的月接待游客量相对于
7
月至
12
月
,
波动性更小
,
变化比较平稳
解析
:
(1)
由折线的变化趋势可知
,A
错误
.
故选
A.
(2)(
2016
·
山东卷
)
某高校调查了
200
名学生每周的自习时间
(
单位
:
小时
),
制成了如图所示的频率分布直方图
,
其中自习时间的范围是
[17.5,30],
样本数据分组为
[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].
根据直方图
,
这
200
名学生中每周的自习时间不少于
22.5
小时的人数是
(
)
(A)56 (B)60 (C)120 (D)140
解析
:
(2)
每周自习时间不少于
22.5
小时的频率为
1-(0.02+0.10)×2.5=0.7.
则人数为
200×0.7=140.
故选
D.
(1)
纵轴上的数据是频率除以组距
;(2)
各组的频率之和等于
1;(3)
各组的频率等于各组的频数除以样本容量
.
反思归纳
【
跟踪训练
1】
某高校调查了
200
名学生每周的自习时间
(
单位
:
小时
),
制成了如图所示的频率分布直方图
,
其中自习时间的范围是
[17.5,30],
样本数据分组为
[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30].
根据直方图
,
若这
200
名学生中每周的自习时间不超过
m
小时的人数为
164,
则
m
的值约为
(
)
(A)26.25 (B)26.5 (C)26.75 (D)27
考点二 茎叶图
【
例
2】
(
2018
·
山东滨州二模
)
甲、乙两位射击运动员的
5
次比赛成绩
(
单位
:
环
)
如茎叶图所示
,
若两位运动员平均成绩相同
,
则成绩较稳定
(
方差较小
)
的那位运动员成绩的方差为
(
)
(A)2 (B)4 (C)6 (D)8
反思归纳
(1)
注意从茎叶图得出样本数据
;(2)
注意利用茎叶图比较
(
不一定计算
)
两组数据的平均程度、集中与分散程度
.
【
跟踪训练
2】
(1)(
2018
·
河南安阳二模
)
在某校连续
5
次考试成绩中
,
统计甲、乙两名同学的数学成绩得到如图所示的茎叶图
.
已知甲同学
5
次成绩的平均数为
81,
乙同学
5
次成绩的中位数为
73,
则
x+y
的值为
(
)
(A)3 (B)4
(C)5 (D)6
答案:
(1)A
考点三 样本的数字特征
(
多维探究
)
考查角度
1:
样本的数字特征与直方图交汇
【
例
3】
甲、乙两人在一次射击比赛中各射靶
5
次
,
两人成绩的条形统计图如图所示
,
则
(
)
(A)
甲的成绩的平均数小于乙的成绩的平均数
(B)
甲的成绩的中位数等于乙的成绩的中位数
(C)
甲的成绩的方差小于乙的成绩的方差
(D)
甲的成绩的极差小于乙的成绩的极差
反思归纳
平均数反映了数据的中心
,
是平均水平
,
而方差和标准差反映的是数据围绕平均数的波动大小
.
进行平均数与方差的计算
,
关键是正确运用公式
.
【
跟踪训练
3】
如图是一组样本数据的频率分布直方图
,
则依据图形中的数据
,
可以估计总体的平均数与中位数分别是
(
)
(A)12.5,12.5
(B)13,13
(C)13.5,12.5
(D)13.5,13
解析
:
第
1
组的频率为
0.04×5=0.2,
第
2
组的频率为
0.1×5=0.5,
则第
3
组的频率为
1-0.2-0.5=0.3,
估计总体平均数为
7.5×0.2+12.5×0.5+17.5× 0.3=13.
由题意知
,
中位数在第
2
组内
,
设为
10+x,
则有
0.1x=0.3,
解得
x=3,
从而中位数是
13.
故选
B.
考查角度
2:
样本的数字特征与茎叶图交汇
【
例
4】
(
2018
·
石家庄市模拟
)
某学校
A,B
两个班的数学兴趣小组在一次数学对抗赛中的成绩绘制茎叶图如图
,
通过茎叶图比较两个班数学兴趣小组成绩的平均值及方差
①
A
班数学兴趣小组的平均成绩高于
B
班的平均成绩
②
B
班数学兴趣小组的平均成绩高于
A
班的平均成绩
③
A
班数学兴趣小组成绩的方差大于
B
班成绩的方差
④
A
班数学兴趣小组成绩的方差小于
B
班成绩的方差
其中正确结论的编号为
(
)
(A)①④ (B)②③ (C)②④ (D)①③
反思归纳
若给出茎叶图
,
一方面可以由图形得到相应的样本数据
,
再计算平均数、方差
(
标准差
);
另一方面
,
可以从图形直观分析样本数据的分布情况
,
大致判断平均数的范围
,
并利用数据的波动性大小比较方差
(
标准差
)
的大小
.
【
跟踪训练
4】
为比较甲、乙两地某月
14
时的气温情况
,
随机选取该月中的
5
天
,
将这
5
天中
14
时的气温数据
(
单位
:℃)
制成如图所示的茎叶图
.
考虑以下结论
:
①
甲地该月
14
时的平均气温低于乙地该月
14
时的平均气温
;
②
甲地该月
14
时的平均气温高于乙地该月
14
时的平均气温
;
③
甲地该月
14
时的气温的标准差小于乙地该月
14
时的气温的标准差
;
④
甲地该月
14
时的气温的标准差大于乙地该月
14
时的气温的标准差
.
其中根据茎叶图能得到的统计结论的编号为
(
)
(A)①③ (B)①④ (C)②③ (D)②④
考查角度
3:
样本的数字特征与优化决策问题
【
例
5】
甲、乙、丙、丁四人参加某运动会射击项目选拔赛
,
四人的平均成绩和方差如表所示
:
从这四个人中选择一人参加该运动会射击项目比赛
,
最佳人选是
(
)
(A)
甲
(B)
乙
(C)
丙
(D)
丁
解析
:
由题目表格中数据可知
,
丙平均环数最高
,
且方差最小
,
说明技术稳定
,
且成绩好
,
故选
C.
反思归纳
用样本估计总体时
,
样本的平均数、标准差只是总体的平均数、标准差的近似
.
实际应用中
,
需先计算数据的平均数
,
分析平均水平
,
再计算方差
(
标准差
)
分析稳定情况
.
备选例题
【
例题
】
(
2018
·
江西新余二模
)
“
一带一路
”
是
“
丝绸之路经济带
”
和
“
21
世纪海上丝绸之路
”
的简称
,
某市为了了解人们对
“
一带一路
”
的认知程度
,
对不同年龄和不同职业的人举办了一次
“
一带一路
”
知识竞赛
,
满分
100
分
(90
分及以上为认知程度高
),
现从参赛者中抽取了
x
人
,
按年龄分成
5
组
(
第一组
:[20,25),
第二组
:[25,30),
第三组
:[30,35),
第四组
:[35,40),
第五组
:[40,45]),
得到如图所示的频率分布直方图
,
已知第一组有
6
人
.
(1)
求
x;
(2)
求抽取的
x
人的年龄的中位数
(
结果保留整数
);