- 1.21 MB
- 2021-06-30 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第
2
节 用样本估计总体
最新考纲
1.
了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点;
2.
理解样本数据标准差的意义和作用,会计算数据标准差;
3.
能从样本数据中提取基本的数字特征
(
如平均数、标准差
)
,并作出合理的解释;
4.
会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;
5.
会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题
.
1
.
频率分布直方图
(1)
频率分布表的画法:
第一步:
求
,
决定组数和组距,组距
=
;
第二步
:
,
通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表
.
知
识
梳
理
极差
分组
(2)
频率分布直方图:反映样本频率分布的直方图
(
如图
)
横轴
表示样本数据,纵轴
表示
,
每个小矩形的面积表示样本落在该组内
的
.
2
.
茎叶图
统计
中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数
.
频率
3
.
样本的数字特征
出现次数最多
最中间
[
常用结论与微点提醒
]
1
.
频率分布直方图中各小矩形的面积之和为
1.
2
.
平均数、方差的公式推广
(
1)
若数据
x
1
,
x
2
,
…
,
x
n
的平均数
为
,
那么
mx
1
+
a
,
mx
2
+
a
,
mx
3
+
a
,
…
,
mx
n
+
a
的平均数是
m
+
a
.
(
2)
数据
x
1
,
x
2
,
…
,
x
n
的方差为
s
2
.
①
数据
x
1
+
a
,
x
2
+
a
,
…
,
x
n
+
a
的方差也为
s
2
;
②
数据
ax
1
,
ax
2
,
…
,
ax
n
的方差为
a
2
s
2
.
1
.
思考辨析
(
在括号内打
“√”
或
“×”)
(1)
平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
.
(
)
(2)
一组数据的方差越大,说明这组数据越集中
.
(
)
(3)
频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大
.
(
)
(4)
茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次
.
(
)
诊
断
自
测
解析
(1)
正确
.
平均数、众数与中位数都在一定程度上反映了数据的集中趋势
.
(2)
错误
.
方差越大,这组数据越离散
.
(4)
错误
.
茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故
(4)
错误
.
答案
(1)√
(2)×
(3)√
(4)×
2
.
(
必修
3P70
改编
)
若某校高一年级
8
个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是
(
)
A.91.5
和
91.5
B
.
91.5
和
92
C
.
91
和
91.5
D
.
92
和
92
解析
这组数据由小到大排列为
87
,
89
,
90
,
91
,
92
,
93
,
94
,
96
,
答案
A
3
.
(2017·
全国
Ⅰ
卷
)
为评估一种农作物的种植效果,选了
n
块地作试验田
.
这
n
块地的亩产量
(
单位:
kg)
分别为
x
1
,
x
2
,
…
,
x
n
,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
(
)
A
.
x
1
,
x
2
,
…
,
x
n
的平均数
B
.
x
1
,
x
2
,
…
,
x
n
的标准差
C
.
x
1
,
x
2
,
…
,
x
n
的最大值
D
.
x
1
,
x
2
,
…
,
x
n
的中位数
解析
刻画评估这种农作物亩产量稳定程度的指标是标准差
.
答案
B
4
.
(2018·
长沙一中质检
)
某雷达测速区规定:凡车速大于或等于
70 km/h
的汽车视为
“
超速
”
,并将受到处罚
.
如图是某路段的一个检测点对
200
辆汽车的车速进行检测后所作的频率分布直方图,则从图中可以看出被处罚的汽车大约有
(
)
A
.
30
辆
B
.
40
辆
C
.
60
辆
D
.
80
辆
解析
从频率分布直方图知,车速大于或等于
70 km/h
的频率为
0.02
×
10
=
0.2.
由于样本容量为
200
,故
“
超速
”
被罚的汽车约有
200
×
0.2
=
40(
辆
)
.
答案
B
5
.
(2016·
江苏卷
)
已知一组数据
4.7
,
4.8
,
5.1
,
5.4
,
5.5
,则该组数据的方差是
________
.
答案
0.1
考点一 茎叶图及其应用
A
.
3
,
5
B
.
5
,
5
C
.
3
,
7
D
.
5
,
7
【例
1
】
(1)
(2017·
山东卷
)
如图所示的茎叶图记录了甲、乙两组各
5
名工人某日的产量数据
(
单位:件
)
.
若这两组数据的中位数相等,且平均值也相等,则
x
和
y
的值分别为
(
)
(
2
)
(2018·
济南模拟
)
中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里
40
名学生得分数据的茎叶图如图所示
.
若规定得分不小于
85
分的学生得到
“
诗词达人
”
的称号,小于
85
分且不小于
70
分的学生得到
“
诗词能手
”
的称号,其他学生得到
“
诗词爱好者
”
的称号,根据该次比赛的成就按照称号的不同进行分层抽样抽选
10
名学生,则抽选的学生中获得
“
诗词达人
”
称号的人数为
(
)
A
.
2 B
.
4
C
.
5
D
.
6
解析
(1)
由茎叶图,可得甲组数据的中位数为
65
,从而乙组数据的中位数也是
65
,所以
y
=
5.
由乙组数据
59
,
61
,
67
,
65
,
78
,可得乙组数据的平均值为
66
,故甲组数据的平均值也为
66
,
答案
(1)A
(2)A
规律方法
1.
茎叶图的三个关注点
(1)
“
叶
”
的位置只有一个数字,而
“
茎
”
的位置的数字位数一般不需要统一
.
(2)
重复出现的数据要重复记录,不能遗漏
.
(3)
给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般
“
重心
”
下移者平均数较大,数据集中者方差较小
.
2
.
利用茎叶图解题的关键是抓住
“
叶
”
的分布特征,准确从中提炼信息
.
【训练
1
】
(1)
(2018·
广东广雅中学联考
)
某市重点中学奥数培训班共有
14
人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是
88
,乙组学生成绩的中位数是
89
,则
m
+
n
的值是
(
)
A
.
10 B
.
11
C
.
12
D
.
13
(2)
(2018·
长沙模拟
)
空气质量指数
(Air Quality Index
,简称
AQI)
是定量描述空气质量状况的指数,空气质量按照
AQI
大小分为六级,
0
~
50
为优;
51
~
100
为良;
101
~
150
为轻度污染;
151
~
200
为中度污染;
201
~
300
为重度污染;大于
300
为严重污染
.
从某地一环保人士某年的
AQI
记录数据中,随机抽取
10
个,用茎叶图记录如下
.
根据该统计数据,估计此地该年
AQI
大于
100
的天数约为
________(
该年为
365
天
)
.
解析
(1)
∵
甲组学生成绩的平均数是
88
,
∴
由茎叶图可知
78
+
86
+
84
+
88
+
95
+
90
+
m
+
92
=
88
×
7
,
∴
m
=
3
,
∵
乙组学生成绩的中位数是
89
,
∴
n
=
9
,
∴
m
+
n
=
12.
答案
(1)C
(2)146
考点二 频率分布直方图
(
易错警示
)
【例
2
】
(2017·
北京卷
)
某大学艺术专业
400
名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了
100
名学生,记录他们的分数,将数据分成
7
组:
[20
,
30)
,
[30
,
40)
,
…
,
[80
,
90]
,并整理得到如下频率分布直方图:
(1)
从总体的
400
名学生中随机抽取一人,估计其分数小于
70
的概率;
(2)
已知样本中分数小于
40
的学生有
5
人,试估计总体中分数在区间
[40
,
50)
内的人数;
(3)
已知样本中有一半男生的分数不小于
70
,且样本中分数不小于
70
的男女生人数相等
.
试估计总体中男生和女生人数的比例
.
解
(1)
根据频率分布直方图可知,样本中分数不小于
70
的频率为
(0.02
+
0.04)×10
=
0.6
,
所以样本中分数小于
70
的频率为
1
-
0.6
=
0.4.
所以从总体的
400
名学生中随机抽取一人,其分数小于
70
的概率估计为
0.4.
(2)
根据题意,样本中分数不小于
50
的频率
为
(
0.01
+
0.02
+
0.04
+
0.02)×10
=
0.9
,
分数在区间
[40
,
50)
内的人数为
100
-
100×0.9
-
5
=
5.
(3)
由题意可知,样本中分数不小于
70
的学生人数
为
(
0.02
+
0.04)×10×100
=
60
,
所以样本中的男生人数为
30×2
=
60
,女生人数为
100
-
60
=
40
,男生和女生人数的比例为
60
∶
40
=
3
∶
2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为
3
∶
2.
【训练
2
】
某校
2018
届高三文
(1)
班在一次数学测验中,全班
N
名学生的数学成绩的频率分布直方图如下,已知分数在
110
~
120
的学生有
14
人
.
(1)
求总人数
N
和分数在
120
~
125
的人数
n
;
(2)
利用频率分布直方图,估算该班学生数学成绩的众数和中位数各是多少?
解
(1)
分数在
110
~
120
内的学生的频率
为
P
1
=
(0.04
+
0.03)×5
=
0.35
,
分数在
120
~
125
内的学生的频率
为
P
2
=
1
-
(0.01
+
0.04
+
0.05
+
0.04
+
0.03
+
0.01)×5
=
0.10
,
分数
在
120
~
125
内的人数
n
=
40×0.10
=
4.
(2)
由频率分布直方图可知,众数是最高的小矩形底边中点的横坐标,
设中位数为
a
,
∵
0.01×5
+
0.04×5
+
0.05×5
=
0.50
,
∴
a
=
110.
∴
众数和中位数分别是
107.5
,
110.
考点三 样本的数字特征
【例
3
】
(1)
(2018·
济南一中质检
)
2017
年
2
月
20
日,摩拜单车在济南推出
“
做文明骑士,周一摩拜单车免费骑
”
活动
.
为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为
(
)
A
.
9 B
.
4
C
.
3
D
.
2
(2)
(2016·
四川卷
)
我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查
.
通过抽样,获得了某年
100
位居民每人的月均用水量
(
单位:吨
)
,将数据按照
[0
,
0.5)
,
[0.5
,
1)
,
……
,
[4
,
4.5]
分成
9
组,制成了如图所示的频率分布直方图
.
①
求直方图中
a
的值;
②
设该市有
30
万居民,估计全市居民中月均用水量不低于
3
吨的人数,说明理由;
③
估计居民月均用水量的中位数
.
答案
B
(2)
解
①
由频率分布直方图可知:月均用水量在
[0
,
0.5)
内的频率为
0.08×0.5
=
0.04.
同理,在
[0.5
,
1)
,
[1.5
,
2)
,
[2
,
2.5)
,
[3
,
3.5)
,
[3.5
,
4)
,
[4
,
4.5]
等组的频率分别为
0.08
,
0.21
,
0.25
,
0.06
,
0.04
,
0.02.
由
1
-
(0.04
+
0.08
+
0.21
+
0.25
+
0.06
+
0.04
+
0.02)
=
0.5×
a
+
0.5×
a
,
解得
a
=
0.30.
②
由
①
知,该市
100
位居民中月均用水量不低于
3
吨的频率为
0.06
+
0.04
+
0.02
=
0.12.
由以上样本的频率分布
,
可以
估计
30
万居民中月均用水量不低于
3
吨的人数为
300 000×0.12
=
36 000.
③
设中位数为
x
吨
.
因为前
5
组的频率之和为
0.04
+
0.08
+
0.15
+
0.21
+
0.25
=
0.73>0.5.
又前
4
组的频率之和为
0.04
+
0.08
+
0.15
+
0.21
=
0.48<0.5.
所以
2
≤
x
<2.5.
由
0.50×(
x
-
2)
=
0.5
-
0.48
,解得
x
=
2.04.
故可估计居民月均用水量的中位数为
2.04
吨
.
规律方法
1.
平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定
.
2
.
用样本估计总体就是利用样本的数字特征来描述总体的数字特征
.
【训练
3
】
(2018·
北京东城质检
)
某班男女生各
10
名同学最近一周平均每天的锻炼时间
(
单位:分钟
)
用茎叶图记录如下:
假设每名同学最近一周平均每天的锻炼时间是互相独立的
.
①
男生每天锻炼的时间差别小,女生每天锻炼的时间差别大;
②
从平均值分析,男生每天锻炼的时间比女生多;
③
男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;
④
从
10
个男生中任选一人,平均每天的锻炼时间超过
65
分钟的概率比同样条件下女生锻炼时间超过
65
分钟的概率大
.
其中符合茎叶图所给数据的结论是
(
)
A
.
①②③
B
.
②③④
C
.
①②④
D
.
①③④
解析
由茎叶图知,男生每天锻炼时间差别小,女生差别大,
①
正确
.
又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,
∴
s
甲
<
s
乙
,
③
错误,
因此符合茎叶图所给数据的结论是
①②④
.
答案
C
相关文档
- 高考数学二轮复习课件:高难拉分攻坚2021-06-3017页
- 高考数学二轮复习课件:高难拉分攻坚2021-06-3018页
- 高考数学二轮复习课件:第二编 专题2021-06-2474页
- 高考数学二轮复习课件:第二编 专题2021-06-2479页
- 高考数学二轮复习课件:第二编 专题2021-06-24120页
- 高考数学二轮复习课件:第二编 专题2021-06-2496页
- 高考数学二轮复习课件:第二编 专题2021-06-2379页
- 高考数学二轮复习课件:第二编 专题2021-06-2393页
- 高考数学二轮复习课件:第二编 专题2021-06-23131页
- 高考数学二轮复习课件:第二编 专题2021-06-2374页