- 2.27 MB
- 2021-06-11 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
10
.
3
统计图表、数据的数字特征、
用样本估计总体
-
2
-
知识梳理
考点自诊
1
.
常用统计图表
四种常用的统计图表
:
、折线统计图、扇形统计图、
.
2
.
数据的数字特征
(1)
平均数
: ,
它反映了一组数据的平均水平
.
(2)
中位数
:
将数据从小到大排列
,
若有奇数个数则最中间的数是中位数
;
若有偶数个数则中间两数的平均数是中位数
.
(3)
众数
:
一组数据中出现次数最多的数
.
(4)
极差
:
一组数值中最大值与
的差
,
它反映了一组数据的波动情况
.
(5)
方差
:
s
2
=
,
它反映了样本数据的离散程度
.
条形统计图
茎叶图
最小值
-
3
-
知识梳理
考点自诊
-
4
-
知识梳理
考点自诊
3
.
用样本估计总体
(1)
频率分布直方图
①
含义
:
频率分布直方图由一些小矩形来表示
,
每个小矩形的宽度为
,
高为
,
小矩形的面积恰为相应的
,
图中所有小矩形的面积之和为
.
②
绘制频率分布直方图的步骤为
:
;
决定组距与组数
;
;
列频率分布表
;
画频率分布直方图
.
(2)
频率分布折线图
:
在频率分布直方图中
,
按照分组原则
,
再在左边和右边各加一个区间
.
从所加的左边区间的中点开始
,
用线段依次连接各个矩形的顶端中点直至右边所加区间的中点
,
就可以得到一条折线
,
我们称之为频率折线图
.
随着样本容量的增加
,
作图时所分的组数增加
,
组距减小
,
相应的频率分布折线图就会越来越接近于一条光滑的曲线
.
Δ
x
i
(
分组的宽度
)
频率
f
i
1
求极差
将数据分组
-
5
-
知识梳理
考点自诊
1
.
频率分布直方图与众数、中位数与平均数的关系
(1)
最高的小长方形底边中点的横坐标即是众数
.
(2)
中位数左边和右边的小长方形的面积和是相等的
.
(3)
平均数是频率分布直方图的
“
重心
”,
等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和
.
2
.
若数据
x
1
,
x
2
,
…
,
x
n
的平均数为
,
方差为
s
2
,
则数据
mx
1
+a
,
mx
2
+a
,
mx
3
+a
,
…
,
mx
n
+a
的平均数是
,
方差为
m
2
s
2
.
-
6
-
知识梳理
考点自诊
1
.
判断下列结论是否正确
,
正确的画
“
√
”,
错误的画
“
×
”
.
(1)
平均数、众数与中位数都可以描述数据的集中趋势
.
(
)
(2)
一组数据的方差越大
,
说明这组数据的波动越大
.
(
)
(3)
频率分布直方图中
,
小矩形的面积越大
,
表示样本数据落在该区间内的频率越大
.
(
)
(4)
茎叶图中的数据要按从小到大的顺序写
,
相同的数据可以只记一次
.
(
)
(5)
频率分布表和频率分布直方图是一组数据频率分布的两种形式
,
前者准确
,
后者直观
.
(
)
(6)
在频率分布直方图中
,
最高的小长方形底边中点的横坐标是众数
.
(
)
√
√
√
×
√
√
-
7
-
知识梳理
考点自诊
2
.(2018
全国
1,
文
3)
某地区经过一年的新农村建设
,
农村的经济收入增加了一倍
,
实现翻番
.
为更好地了解该地区农村的经济收入变化情况
,
统计了该地区新农村建设前后农村的经济收入构成比例
,
得到如下饼图
:
-
8
-
知识梳理
考点自诊
则下面结论中不正确的是
(
)
A
.
新农村建设后
,
种植收入减少
B
.
新农村建设后
,
其他收入增加了一倍以上
C
.
新农村建设后
,
养殖收入增加了一倍
D
.
新农村建设后
,
养殖收入与第三产业收入的总和超过了经济收入的一半
A
解析
:
设建设前经济收入为
1,
则建设后经济收入为
2,
建设前种植收入为
0
.
6,
建设后种植收入为
2
×
0
.
37
=
0
.
74,
故
A
不正确
;
建设前的其他收入为
0
.
04,
养殖收入为
0
.
3,
建设后其他收入为
0
.
1,
养殖收入为
0
.
6,
故
B
、
C
正确
;
建设后养殖收入与第三产业收入的总和所占比例为
58%,
故
D
正确
,
故选
A
.
-
9
-
知识梳理
考点自诊
3
.(2018
广西柳州中学
5
月模拟
,5)
根据下图给出的
2000
年至
2016
年我国实际利用外资情况
,
以下结论正确的是
(
)
A.
2000
年以来我国实际利用外资规模与年份负相关
B.
2010
年以来我国实际利用外资规模逐年增加
C.
2008
年我国实际利用外资同比增速最大
D.
2010
年以来我国实际利用外资同比增速最大
C
-
10
-
知识梳理
考点自诊
解析
:
对于选项
A,2000
年以来我国实际利用外资规模
,
基本上是逐年上升的
,
利用外资规模与年份正相关
,
所以选项
A
是错误的
;
对于选项
B,2010
年以来我国实际利用外资规模
,2012
年比
2011
年少
,
所以选项
B
是错误的
;
对于选项
C,
从折线图可以看出
,2008
年我国实际利用外资同比增速最大
,
所以选项
C
是正确的
;
对于选项
D,2008
年以来我国实际利用外资同比增速最大
,
所以选项
D
是错误的
.
故选
C
.
-
11
-
知识梳理
考点自诊
4
.(2018
宁夏平罗中学
5
月模拟
,3)
某高校调查了
320
名学生每周的自习时间
(
单位
:
小时
),
制成了下图所示的频率分布直方图
,
其中自习时间的范围是
[17.5,30],
样本数据分组为
[17.5,20],[20,22.5], [22.5,25],[25,27.5],[27.5,30].
根据直方图
,
这
320
名学生中每周的自习时间不足
22.5
小时的人数是
(
)
A.
68
B.
72
C.
76
D.
80
B
解析
:
由频率分布直方图可得
,320
名学生中每周的自习时间不足
22
.
5
小时的人数是
320
×
(0
.
02
+
0
.
07)
×
2
.
5
=
72
人
,
故选
B
.
-
12
-
知识梳理
考点自诊
5
.(2018
江苏
,3)
已知
5
位裁判给某运动员打出的分数的茎叶图如图所示
,
那么这
5
位裁判打出的分数的平均数为
.
90
解析
:
由题中茎叶图可知
,
5
位裁判打出的分数分别为
89,89,90,91,91,
故平均数为
-
13
-
考点
1
考点
2
考点
3
频率分布直方图及其应用
例
1
(2018
江西南昌模拟
,19)
我国是世界严重缺水的国家
,
城市缺水问题较为突出
,
某市政府为了鼓励居民节约用水
,
计划在本市试行居民生活用水定额管理
,
即确定一个合理的居民月用水量标准
x(
吨
),
用水量不超过
x
的部分按平价收费
,
超过
x
的部分按议价收费
,
为了了解全市民月用水量的分布情况
,
通过抽样
,
获得了
100
位居民某年的月用水量
(
单位
:
吨
),
将数据按照
[0,0.5),[0.5,1),…,[4,4.5),
分成
9
组
,
制成了如图所示的频率分布直方图
.
-
14
-
考点
1
考点
2
考点
3
(1)
求直方图中
a
的值
;
(2)
已知平价收费标准为
4
元
/
吨
,
议价收费标准为
8
元
/
吨
,
当
x=3
时
,
估计该市居民的月平均水费
.(
同一组中的数据用该组区间的中点值代替
)
-
15
-
考点
1
考点
2
考点
3
解
(1)
由频率分布直方图
,
可得
(0
.
08
+
0
.
16
+a+
0
.
40
+
0
.
52
+a+
0
.
12
+
0
.
08
+
0
.
04)
×
0
.
5
=
1,
解得
a=
0
.
30
.
(2)
设居民月用水量为
t
吨
,
相应的水费为
y
元
,
由题设条件及月均用水量的频率分布直方图
,
得居民每月的水费数据分组与频率分布表如下
:
-
16
-
考点
1
考点
2
考点
3
根据题意
,
该市居民的月平均水费估计为
1
×
0
.
04
+
3
×
0
.
08
+
5
×
0
.
15
+
7
×
0
.
20
+
9
×
0
.
26
+
11
×
0
.
15
+
14
×
0
.
06
+
18
×
0
.
04
+
22
×
0
.
02
=
8
.
42
元
.
-
17
-
考点
1
考点
2
考点
3
对点训练
1
(1)(2018
黑龙江大庆二模
,11)
下面是追踪调查
200
个某种电子元件寿命
(
单位
:
h
)
的频率分布直方图如图
.
其中
300~400
、
400~500
两组数据丢失
,
下面四个说法中有且只有一个与原数据相符
,
这个说法是
(
)
①
寿命在
300~400
的频数是
90;
②
寿命在
400~500
的矩形的面积是
0.2;
③
用频率分布直方图估计电子元件的平均寿命为
:
150×0.1+250×0.15+350×0.45+450×0.15+550×0.15;
④
寿命超过
400
h
的频率为
0.3.
A.
①
B.
②
C.
③
D.
④
B
-
18
-
考点
1
考点
2
考点
3
(2)(2018
四川成都石室中学二诊
,12)
从某小学随机抽取
100
名同学
,
将他们的身高
(
单位
:
厘米
)
数据绘制成频率分布直方图
(
如图
).
若要从身高在
[120,130),[130,140),[140,150]
三组内的学生中
,
用分层抽样的方法选取
18
人参加一项活动
,
则从身高在
[140,150]
内的学生中选取的人数应为
.
3
-
19
-
考点
1
考点
2
考点
3
解析
:
(1)
若
①
正确
,
则
300
~
400
对应的频率为
0
.
45,
则
400
~
500
对应的频率为
0
.
15,
则
②
错误
;
电子元件的平均寿命为
150
×
0
.
1
+
250
×
0
.
15
+
350
×
0
.
45
+
450
×
0
.
15
+
550
×
0
.
15,
则
③
正确
;
寿命超过
400
h
的频率为
0
.
15
+
0
.
15
=
0
.
3,
则
④
正确
,
故不符合题意
;
若
②
正确
,
则
300
~
400
对应的频率为
0
.
4,
则
①
错误
;
电子元件的平均寿命为
150
×
0
.
1
+
250
×
0
.
15
+
350
×
0
.
4
+
450
×
0
.
2
+
550
×
0
.
15,
则
③
错误
;
寿命超过
400
h
的频率为
0
.
2
+
0
.
15
=
0
.
35,
则
④
错误
,
故符合题意
.
故选
B
.
(2)0
.
035
+a+
0
.
02
+
0
.
01
+
0
.
005
=
0
.
1,
解得
a=
0
.
03
.
三组的比值为
0
.
03
∶
0
.
02
∶
0
.
01
=
3
∶
2
∶
1,
故
[140,150]
内取
18
× =
3(
人
)
.
-
20
-
考点
1
考点
2
考点
3
茎叶图的应用
例
2
(1)(2018
黑龙江模拟一
,4)
如图是某样本数据的茎叶图
,
则该样本的中位数、众数、极差分别是
(
)
A.
32
34
32
B.
33
45
35
C.
34
45
32
D.
33
36
35
B
-
21
-
考点
1
考点
2
考点
3
(2)(2018
河北石家庄二模
,9)
某学校
A
、
B
两个班的数学兴趣小组在一次数学对抗赛中的成绩绘制茎叶图如下
,
通过茎叶图比较两个班数学兴趣小组成绩的平均值及方差
.
①
A
班数学兴趣小组的平均成绩高于
B
班的平均成绩
;
②
B
班数学兴趣小组的平均成绩高于
A
班的平均成绩
;
③
A
班数学兴趣小组成绩的标准差大于
B
班成绩的标准差
;
④
B
班数学兴趣小组成绩的标准差大于
A
班成绩的标准差
.
其中正确结论的编号为
(
)
A.
①④
B.
②③
C.
②④
D.
①③
A
-
22
-
考点
1
考点
2
考点
3
解析
:
(1)
从茎叶图中知共有
16
个数据
,
按照从小到大排序后中间的两个数据为
32,34,
所以这组数据的中位数为
33;45
出现的次数最多
,
所以这组数据的众数为
45;
最大值是
47,
最小值是
12,
故极差为
35,
故选
B
.
(2)
A
班平均值
78,
标准差
11
.
03
.B
班平均值
66,
标准差
13
.
24,
故
A
班平均值高
,
标准差小
,
故选
A
.
-
23
-
考点
1
考点
2
考点
3
思考
如何制作茎叶图
?
使用茎叶图统计数据有什么优缺点
?
如何用茎叶图估计样本数据特征
?
解题心得
1
.
一般制作茎叶图的方法是
:
将所有两位数的十位数字作为
“
茎
”,
个位数字作为
“
叶
”,
茎相同者共用一个茎
,
茎按从小到大的顺序由上到下列出
.
2
.
茎叶图的优缺点如下
:
(1)
优点
:
一是所有的信息都可以从这个茎叶图中得到
;
二是茎叶图便于记录和表示
,
能够展示数据的分布情况
.
(2)
缺点
:
样本数据较多或数据位数较多时
,
不方便表示数据
.
3
.
对于给定两组数据的茎叶图
,
可根据
“
重心
”
下移者平均数较大
,
数据集中者方差较小来估计数字特征
.
-
24
-
考点
1
考点
2
考点
3
对点训练
2
(1)(2018
湖北
5
月冲刺
,2)
某学校在校艺术节活动中
,
有
24
名学生参加了学校组织的唱歌比赛
,
他们比赛的成绩的茎叶图如图所示
,
将他们的比赛成绩从低到高编号为
1~24
号
,
再用系统抽样方法抽出
6
名同学周末到某音乐学院参观学习
,
则样本中比赛成绩不超过
85
分的学生人数为
(
)
A.
1
B.
2
C.
3
D.
不确定
(2)(2018
安徽芜湖
5
月模拟
,13)
某校开展
“
爱我家乡
”
演讲比赛
,9
位评委给小明同学打分的分数如茎叶图所示
.
记分员在去掉一个最高分和一个最低分后
,
算得平均分为
91,
复核员在复核时
,
发现有一个数字在茎叶图中无法看清
,
若记分员计算无误
,
则数字
x=
.
B
1
-
25
-
考点
1
考点
2
考点
3
-
26
-
考点
1
考点
2
考点
3
样本的数字特征及其应用
例
3
(1)(2018
云南曲靖一中
4
月模拟
,5)
我校高三
8
个学生参加数学竞赛的得分用茎叶图表示
,
其中茎为十位数
,
叶为个位数
,
则这组数据的平均数和方差分别是
(
)
A.
91
9.5
B.
91
9
C.
92
8.5
D.
92
8
A
-
27
-
考点
1
考点
2
考点
3
C
-
28
-
考点
1
考点
2
考点
3
-
29
-
考点
1
考点
2
考点
3
思考
众数、中位数、平均数及方差的意义有什么不同
?
解题心得
1
.
众数、中位数、平均数及方差的意义
:
(1)
平均数与方差都是重要的数字特征
,
是对总体的一种简明的描述
;
(2)
平均数、中位数、众数描述其集中趋势
,
方差和标准差描述波动大小
.
2
.
平均数、方差的公式推广
:
-
30
-
考点
1
考点
2
考点
3
对点训练
3
(1)(2018
河北衡水模拟
,3
改编
)
若
x
1
,x
2
,…,x
2 021
的平均数为
3,
方差为
4,
且
y
i
=-2(x
i
-2),i=1,2,…,2 021,
则新数据
y
1
,y
2
,…,y
2 021
的平均数和标准差分别为
(
)
A.
-4
-4
B.
-4
16
C.
2
8
D.
-2
4
(2)(2018
四川乐山四校联考
,14)
已知总体的各个体的值从小到大为
:-3,0,3,x,y,6,8,10,
且总体的中位数为
4.
若要使该总体的方差最小
,
则
2x-y=
.
D
4
-
31
-
考点
1
考点
2
考点
3
-
32
-
考点
1
考点
2
考点
3
-
33
-
考点
1
考点
2
考点
3
1
.
两个易误点
(1)
易忽视频率分布直方图中纵轴表示的应为
.
(2)
在绘制茎叶图时
,
易遗漏重复出现的数据
,
重复出现的数据要重复记录
,
同时不要混淆茎叶图中
“
茎
”
与
“
叶
”
的含义
.
2
.
众数、中位数和平均数的异同
-
34
-
考点
1
考点
2
考点
3
3
.
标准差和方差的异同相同点
:
标准差和方差描述了一组数据围绕平均数波动的大小
.
不同点
:
方差与原始数据的单位不同
,
且平方后可能夸大了偏差程度
,
标准差则不然
.
4
.
频率与频率比
-
35
-
考点
1
考点
2
考点
3
不要搞混直方图与条形图
:
(1)
条形图是用条形的长度表示各类别频数的多少
,
其宽度
(
表示类别
)
是固定的
;
直方图是用面积表示各组频率的多少
,
矩形的高度表示每一组的频率除以组距
,
宽度则表示各组的组距
,
因此其高度与宽度均有意义
.
(2)
由于分组数据具有连续性
,
因此直方图的各矩形通常是连续排列
,
而条形图则是分开排列
.
-
36
-
数学核心素养例释
——
数据分析
数据分析是指针对研究对象获得相关数据
,
运用统计方法对数据中的有用信息进行分析和推断
,
并形成知识的过程
.
主要包括
:
收集数据
,
整理数据
,
提取信息
,
构建模型
,
对信息进行分析、推断
,
获得结论
.
在数据分析核心素养的形成过程中
,
学生能够提升数据处理的能力
,
增强基于数据表达现实问题的意识
,
养成通过数据思考问题的习惯
,
积累依托数据探索事物本质、关联和规律的活动经验
.
-
37
-
典例
(2018
全国
1,
文
19)
某家庭记录了未使用节水龙头
50
天的日用水量数据
(
单位
:
m
3
)
和使用了节水龙头
50
天的日用水量数据
,
得到频数分布表如下
:
-
38
-
(1)
作出使用了节水龙头
50
天的日用水量数据的频率分布直方图
:
(2)
估计该家庭使用节水龙头后
,
日用水量小于
0.35
m
3
的概率
;
(3)
估计该家庭使用节水龙头后
,
一年能节省多少水
?(
一年按
365
天计算
,
同一组中的数据以这组数据所在区间中点的值作代表
.)
-
39
-
解
(1)
-
40
-
-
41
-
解题指导
该题考查的是有关统计的问题
,
涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数
,
在解题的过程中
,
需要认真审题
,
细心运算
,
仔细求解
,
就可以得出正确结果
.
反思提升
1
.
用样本估计总体是统计的基本思想
,
而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法
.
频率分布表在数量表示上比较准确
,
频率分布直方图比较直观
.
2
.
频率分布表中的频数之和等于样本容量
,
各组中的频率之和等于
1;
在频率分布直方图中
,
各小长方形的面积表示相应各组的频率
,
所以所有小长方形的面积的和等于
1.