- 1.39 MB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
10
.
3
用样本估计总体
-
2
-
-
3
-
知识梳理
考点自测
1
.
用样本的频率分布估计总体分布
(1)
频率分布表
:
把反映总体频率分布的表格称为频率分布表
.
(2)
频率分布直方图
①
含义
:
频率分布直方图由一些小矩形来表示
,
每个小矩形的宽度为
,
高为
,
小矩形的面积恰为相应的
,
图中所有小矩形的面积之和为
.
②
绘制频率分布直方图的步骤为
:a
.
;b
.
决定组距与组数
;c
.
;d
.
列频率分布表
;e
.
画频率分布直方图
.
组距
(
分组的宽度
)
频率
1
求极差
将数据分组
-
4
-
知识梳理
考点自测
(3)
总体密度曲线
①
频率分布折线图
:
连接频率分布直方图中各小长方形上端的
,
就得到频率分布折线图
.
②
总体密度曲线
:
随着样本容量的增加
,
作图时所分的组数增加
,
组距减小
,
相应的频率折线图会越来越接近于一条光滑曲线
,
统计中称这条光滑曲线为总体密度曲线
.
总体密度曲线反映了总体在各个范围内取值的百分比
,
它能提供更加精细的信息
.
(4)
茎叶图
:
茎叶图中茎是指
的一列数
,
叶是从茎的
生长出来的数
.
当样本数据较少时
,
用茎叶图表示数据的效果较好
,
它不但可以保留所有信息
,
而且可以随时记录
,
给数据的记录和表示都带来方便
.
中点
中间
旁边
-
5
-
知识梳理
考点自测
2
.
样本的数字特征
3
.
标准差、方差的实际意义
:
标准差和方差都反映了样本数据的离散程度
.
方差
(
标准差
)
越小
,
样本数据越稳定
,
波动越小
.
最多
中间
平均数
相等
-
6
-
知识梳理
考点自测
1
.
频率分布直方图与众数、中位数与平均数的关系
(1)
最高的小长方形底边中点的横坐标即是众数
.
(2)
中位数左边和右边的小长方形的面积和是相等的
.
(3)
平均数是频率分布直方图的
“
重心
”,
等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和
.
2
.
若数据
x
1
,
x
2
,
…
,
x
n
的平均数为
,
方差为
s
2
,
则数据
mx
1
+a
,
mx
2
+a
,
mx
3
+a
,
…
,
mx
n
+a
的平均数是
,
方差为
m
2
s
2
.
-
7
-
知识梳理
考点自测
1
.
判断下列结论是否正确
,
正确的画
“
√
”,
错误的画
“
×
”
.
(1)
平均数、众数与中位数都可以描述数据的集中趋势
.
(
)
(2)
一组数据的方差越大
,
说明这组数据的波动越大
.
(
)
(3)
频率分布直方图中
,
小矩形的面积越大
,
表示样本数据落在该区间内的频率越大
.
(
)
(4)
茎叶图中的数据要按从小到大的顺序写
,
相同的数据可以只记一次
.
(
)
(5)
频率分布表和频率分布直方图是一组数据频率分布的两种形式
,
前者准确
,
后者直观
.
(
)
(6)
在频率分布直方图中
,
最高的小长方形底边中点的横坐标是众数
.
(
)
√
√
√
×
√
√
-
8
-
知识梳理
考点自测
2
.
(2017
全国
Ⅰ
,
文
2)
为评估一种农作物的种植效果
,
选了
n
块地作试验田
.
这
n
块地的亩产量
(
单位
:kg)
分别为
x
1
,
x
2
,
…
,
x
n
,
下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
(
)
A
.x
1
,
x
2
,
…
,
x
n
的平均数
B
.x
1
,
x
2
,
…
,
x
n
的标准差
C
.x
1
,
x
2
,
…
,
x
n
的最大值
D
.x
1
,
x
2
,
…
,
x
n
的中位数
B
解析
:
标准差和方差可刻画样本数据的稳定程度
,
故选
B
.
-
9
-
知识梳理
考点自测
3
.
(2017
全国
Ⅲ
,
文
3)
某城市为了解游客人数的变化规律
,
提高旅游服务质量
,
收集并整理了
2014
年
1
月至
2016
年
12
月期间月接待游客量
(
单位
:
万人
)
的数据
,
绘制了下面的折线图
.
根据该折线图
,
下列结论错误的是
(
)
A.
月接待游客量逐月增加
B.
年接待游客量逐年增加
C.
各年的月接待游客量高峰期大致在
7,8
月
D.
各年
1
月至
6
月的月接待游客量相对于
7
月至
12
月
,
波动性更小
,
变化比较平稳
A
-
10
-
知识梳理
考点自测
解析
:
由题图可知
2014
年
8
月到
9
月的月接待游客量在减少
,
故
A
错误
.
-
11
-
知识梳理
考点自测
4
.
某高校调查了
200
名学生每周的自习时间
(
单位
:
小时
),
制成了如图所示的频率分布直方图
,
其中自习时间的范围是
[17
.
5,30],
样本数据分组为
[17
.
5,20),[20,22
.
5),[22
.
5,25),[25,27
.
5),[27
.
5,30]
.
根据直方图
,
这
200
名学生中每周的自习时间不少于
22
.
5
小时的人数是
(
)
A.56 B.60 C.120 D.140
D
解析
:
由频率分布直方图可知
,
这
200
名学生每周自习时间不少于
22
.
5
小时的频率为
(0
.
16
+
0
.
08
+
0
.
04)
×
2
.
5
=
0
.
7,
故该区间内的人数为
200
×
0
.
7
=
140
.
故选
D
.
-
12
-
知识梳理
考点自测
5
.
某次体检
,6
名同学的身高
(
单位
:
米
)
分别为
1
.
72,1
.
78,1
.
75,1
.
80, 1
.
69,1
.
77,
则这组数据的中位数是
(
米
)
.
1.76
解析
:
将这
6
名同学的身高按照从矮到高排列为
:1
.
69,1
.
72,1
.
75, 1
.
77,1
.
78,1
.
80,
这六个数的中位数是
1
.
75
与
1
.
77
的平均数
,
即为
1
.
76
.
-
13
-
考点一
考点二
考点三
频率分布直方图及其应用
例
1
某城市
100
户居民的月平均用电量
(
单位
:
千瓦时
),
以
[160,180), [180,200),[200,220),[220,240),[240,260),[260,280),[280,300]
分组的频率分布直方图如图
.
(1)
求直方图中
x
的值
;
(2)
求月平均用电量的众数和中位数
;
(3)
在月平均用电量为
[220,240),[240,260),[260,280),[280,300]
的四组用户中
,
用分层抽样的方法抽取
11
户居民
,
则月平均用电量在
[220,240)
的用户中应抽取多少户
?
-
14
-
考点一
考点二
考点三
解
(1)
由
(0
.
002
+
0
.
009
5
+
0
.
011
+
0
.
012
5
+x+
0
.
005
+
0
.
002
5)
×
20
=
1,
得
x=
0
.
007
5,
所以直方图中
x
的值是
0
.
007
5
.
因为
(0
.
002
+
0
.
009
5
+
0
.
011)
×
20
=
0
.
45
<
0
.
5,(0
.
002
+
0
.
009
5
+
0
.
011
+
0
.
012
5)
×
20
=
0
.
7
>
0
.
5,
所以月平均用电量的中位数在
[220,240)
内
,
设中位数为
a
,
由
(0
.
002
+
0
.
009
5
+
0
.
011)
×
20
+
0
.
012
5
×
(
a-
220)
=
0
.
5,
得
a=
224,
所以月平均用电量的中位数是
224
.
-
15
-
考点一
考点二
考点三
(3)
月平均用电量在
[220,240)
的用户有
0
.
012
5
×
20
×
100
=
25(
户
),
月平均用电量在
[240,260)
的用户有
0
.
007
5
×
20
×
100
=
15(
户
),
月平均用电量在
[260,280)
的用户有
0
.
005
×
20
×
100
=
10(
户
),
月平均用电量在
[280,300]
的用户有
0
.
002
5
×
20
×
100
=
5(
户
),
-
16
-
考点一
考点二
考点三
思考
频率分布直方图有哪些性质
?
如何利用频率分布直方图求众数、中位数与平均数
?
-
17
-
考点一
考点二
考点三
对点训练
1
(1)(2017
山东枣庄一模
,
文
7)
为了解本市居民的生活成本
,
甲、乙、丙三名同学利用假期分别对三个社区进行了
“
家庭每月日常消费额
”
的调查
.
他们将调查所得到的数据分别绘制成频率分布直方图
(
如图所示
),
甲、乙、丙所调查数据的标准差分别为
s
1
,
s
2
,
s
3
,
则它们的大小关系为
(
)
甲
乙
-
18
-
考点一
考点二
考点三
A.
s
1
>s
2
>s
3
B.
s
1
>s
3
>s
2
C.
s
3
>s
2
>s
1
D.
s
3
>s
1
>s
2
答案
:
B
-
19
-
考点一
考点二
考点三
(2)
某学校为了解学生数学课程的学习情况
,
在
1 000
名学生中随机抽取
200
名
,
并统计这
200
名学生的某次数学考试成绩
,
得到了样本的频率分布直方图
(
如图
)
.
根据频率分布直方图可估计这
1 000
名学生在该次数学考试中成绩不低于
60
分的学生人数是
.
800
-
20
-
考点一
考点二
考点三
解析
:
(1)
根据三个频率分布直方图知
,
第一组数据的两端数字较多
,
绝大部分数字都处在两端数据偏离平均数远
,
最分散
,
其方差、标准差最大
;
第三组数据不如第一组偏离平均数大
,
方差比第一组中数据的方差、标准差小
;
第二组数据绝大部分数字都在平均数附近
,
数据最集中
,
故其方差、标准差最小
,
综上可知
s
1
>s
3
>s
2
,
故选
B
.
(2)
低于
60
分的学生所占频率为
(0
.
002
+
0
.
006
+
0
.
012)
×
10
=
0
.
2,
低于
60
分的学生人数为
1
000
×
0
.
2
=
200,
所以不低于
60
分的学生人数为
1
000
-
200
=
800
.
-
21
-
考点一
考点二
考点三
茎叶图的应用
例
2
(1) (2017
山东
,
文
8)
如图所示的茎叶图记录了甲、乙两组各
5
名工人某日的产量数据
(
单位
:
件
)
.
若这两组数据的中位数相等
,
且平均值也相等
,
则
x
和
y
的值分别为
(
)
A.3,5 B.5,5
C.3,7 D.5,7
(2)(2017
山东临沂一模
,
文
3)
传承传统文化再掀热潮
,
在刚刚过去的新春假期中
,
央视科教频道以诗词知识竞赛为主的《中国诗词大会》火爆荧屏
,
如图的茎叶图是两位选手在个人追逐赛中的比赛得分
,
则下列说法正确的是
(
)
A.
甲的平均数大于乙的平均数
B.
甲的中位数大于乙的中位数
C.
甲的方差大于乙的方差
D.
甲的平均数等于乙的中位数
A
C
-
22
-
考点一
考点二
考点三
解析
:
(1)
甲组数据为
56,62,65,70
+x
,74;
乙
组数据为
59,61,67,60
+y
,78
.
若两组数据的中位数相等
,
则
65
=
60
+y
,
所以
y=
5
.
又两组数据的平均值相等
,
所以
56
+
62
+
65
+
70
+x+
74
=
59
+
61
+
67
+
65
+
78,
解得
x=
3
.
-
23
-
考点一
考点二
考点三
思考
如何制作茎叶图
?
使用茎叶图统计数据有什么优缺点
?
如何用茎叶图估计样本数据特征
?
解题心得
1
.
一般制作茎叶图的方法是
:
将所有两位数的十位数字作为
“
茎
”,
个位数字作为
“
叶
”,
茎相同者共用一个茎
,
茎按从小到大的顺序由上到下列出
.
2
.
茎叶图的优缺点如下
:
(1)
优点
:
一是所有的信息都可以从这个茎叶图中得到
;
二是茎叶图便于记录和表示
,
能够展示数据的分布情况
.
(2)
缺点
:
样本数据较多或数据位数较多时
,
不方便表示数据
.
3
.
对于给定两组数据的茎叶图
,
可根据
“
重心
”
下移者平均数较大
,
数据集中者方差较小来估计数字特征
.
-
24
-
考点一
考点二
考点三
对点训练
2
某商店对一个月内每天的顾客人数进行了统计
,
得到样本的茎叶图
(
如图所示
),
则该样本的中位数、众数、极差分别是
(
)
A.46,45,56
B.46,45,53
C.47,45,56
D.45,47,53
A
解析
:
由茎叶图可知中位数为
46,
众数为
45,
极差为
68
-
12
=
56
.
故选
A
.
-
25
-
考点一
考点二
考点三
样本的数字特征及其应用
例
3
甲、乙两人参加某体育项目训练
,
近期的五次测试成绩得分统计情况如图
.
(1)
分别求出两人得分的平均数与方差
;
(2)
根据统计图和
(1)
中得出的结果
,
请对两人的训练成绩作出评价
.
-
26
-
考点一
考点二
考点三
-
27
-
考点一
考点二
考点三
思考
众数、中位数、平均数及方差的意义有什么不同
?
解题心得
1
.
众数、中位数、平均数及方差的意义
:
(1)
平均数与方差都是重要的数字特征
,
是对总体的一种简明的描述
;
(2)
平均数、中位数、众数描述其集中趋势
,
方差和标准差描述波动大小
.
2
.
平均数、方差的公式推广
:
-
28
-
考点一
考点二
考点三
对点训练
3
(1)
甲、乙两人在一次射击比赛中各射靶
5
次
,
两人成绩的条形统计图如图所示
,
则
(
)
A.
甲的成绩的平均数小于乙的成绩的平均数
B.
甲的成绩的中位数等于乙的成绩的中位数
C.
甲的成绩的方差小于乙的成绩的方差
D.
甲的成绩的极差小于乙的成绩的极差
C
-
29
-
考点一
考点二
考点三
(2)(2017
广东佛山一模
,
文
5)
本学期王老师任教两个平行班高三
A
班、高三
B
班
,
两个班都是
50
名学生
,
如图反映的是两个班在本学期
5
次数学测试中的班级平均分对比
,
根据图表
,
下列不正确的结论是
(
)
A.A
班的数学成绩平均水平好于
B
班
B.B
班的数学成绩没有
A
班稳定
C.
下次考试
B
班的数学平均分要高于
A
班
D.
在第
1
次考试中
,A,B
两个班的总平均分为
98
C
-
30
-
考点一
考点二
考点三
-
31
-
考点一
考点二
考点三
1
.
因为平均数与每一个样本数据有关
,
所以任何一个样本数据的改变都可能会引起平均数的改变
,
这是中位数、众数都不具有的性质
.
2
.
众数考查各数据出现的频率
,
其大小只与这组数据中的部分数据有关
.
当一组数据中有不少数据多次重复出现时
,
其众数往往更能反映问题
.
3
.
某些数据的变动对中位数可能没有影响
.
中位数可能出现在所给数据中
,
也可能不在所给数据中
.
当一组数据中的个别数据变动较大时
,
可用中位数描述其集中趋势
.
-
32
-
考点一
考点二
考点三
4
.
频率、频率比
-
33
-
考点一
考点二
考点三
不要搞混直方图与条形图
:
(1)
条形图是用条形的长度表示各类别频数的多少
,
其宽度
(
表示类别
)
是固定的
;
直方图是用面积表示各组频率的多少
,
矩形的高度表示每一组的频率除以组距
,
宽度则表示各组的组距
,
因此其高度与宽度均有意义
.
(2)
由于分组数据具有连续性
,
因此直方图的各矩形通常是连续排列
,
而条形图则是分开排列
.