- 1.73 MB
- 2021-06-15 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
§4
用样本估计总体的数字特征
4.1
样本的数字特征
必备知识
·
自主学习
知识点 样本的数字特征
(1)
概念及特征
概念或计算公式
特征或作用
平均数
样本数据的
_______
反映出样本数据中更多的信息
,
对样本中的极端值敏感
中位数
将样本数据按
_________
的顺序
排列后
,“
中间”的那个数据
.
使样本数据被分成的两部分的
___________,
不受少数几个极
端数据的影响
众数
样本数据中出现次数最
___
的数
据
体现了样本数据的最大集中点
平均值
从小到大
数据量相等
多
概念或计算公式
特征或作用
极差
样本数据中最大值和最小值的差
能粗略地刻画样本数据的离
散程度
方差
较好地刻画样本数据偏离平
均数的离散程度
,
标准差、方
差越
___,
数据的离散程度越
小
.
标准
差
s=
小
(2)
本质
:
样本的数字特征是样本固有的属性
,
它从不同方面体现出样本的特征
,
有代表性的样本的数字特征可以估计总体的数字特征
,
进而能对实际问题作出合理决策
.
(3)
应用
:
估计总体数字特征
.
【
思考
】
(1)
一组数据的众数可以有几个
?
中位数和平均数是否也具有相同的结论
?
提示
:
一组数据的众数可能有一个
,
也可能有多个
,
但是平均数与中位数只有唯一一个
,
把样本数据按从小到大的顺序排列后
,
当数据有奇数个时
,
中位数就是最中间的数据
,
当数据有偶数个时
,
中位数是中间两个数据的平均值
.
(2)
方差和标准差有何异同
?
提示
:
相同点
:
都是刻画样本数据偏离平均数的离散程度的量
.
不同点
:①
计算公式不同
;②
单位不同
.
【
基础小测
】
1.
辨析记忆
(
对的打“√”
,
错的打“
×”)
(1)
中位数一定是样本数据中的某个数
. (
)
(2)
在一组样本数据中
,
众数一定是唯一的
. (
)
(3)
方差越大
,
数据的稳定性越强
. (
)
(4)
在两组数据中
,
平均值较大的一组方差较大
. (
)
提示
:
(1)×.
当样本数据有偶数个时
,
中位数是按大小排列后中间两数的平均值
.
(2)×.
在一组样本数据中
,
众数可能不止一个
.
(3)×.
方差越小
,
数据的稳定性越强
.
(4)×.
一组数据的平均值与方差没有必然联系
.
2.
一组样本数据为
:19,23,12,14,14,17,10,12,18,14,27,
则这组数据的众数和中位数分别为
(
)
A.14,14
B.12,14
C.14,15.5
D.12,15.5
【
解析
】
选
A.
把这组数据按从小到大排列为
:10,12,12,14,14,14,17,18,
19,23,27,
则可知其众数为
14,
中位数为
14.
3.(
教材二次开发
:
例题改编
)
王老师从星期一到星期五收到信件数分别是
10,6,8,5,6,
则该组数据的方差
s
2
=
.
【
解析
】
王老师收到信件的平均数为
7,
根据方差的计算公式可得
s
2
= [(10-
7)
2
+(6-7)
2
+(8-7)
2
+(5-7)
2
+(6-7)
2
]=3.2.
答案
:
3.2
关键能力
·
合作学习
类型一 样本数据数字特征的计算
(
数学运算
)
【
题组训练
】
1.
在某次测量中得到的
A
样本数据如下
:42,43,46,52,42,50,
若
B
样本数据恰好是
A
样本数据每个都减
5
后所得数据
,
则
A,B
两样本的下列数字特征对应相同的是
(
)
A.
平均数
B.
标准差
C.
众数
D.
中位数
【
解析
】
选
B.
由
B
样本数据恰好是
A
样本数据每个都减
5
后所得数据
,
可得平均数、众数、中位数分别是原来结果减去
5,
即与
A
样本不相同
,
标准差不变
.
2.
若第一组数据
7,4,3,m
的平均数是
5;
第二组数据
18,9,7,m,n
的平均数为
10,
则第二组数据的中位数是
.
【
解析
】
由题意
,
得 所以第二组数据为
6,7,9,10,18,
其中位数为
9.
答案
:
9
3.
某校从参加高一年级期末测试的学生中抽出
80
名学生
,
其数学成绩
(
均为整数
)
的频率分布直方图如图所示
.
则这次测试数学成绩的众数、中位数、平均数分别为
.
【
解析
】
由题图知众数为
=75.
设中位数为
x,
由于前三个矩形面积之和
为
0.4,
第四个矩形面积为
0.3,0.3+0.4>0.5,
因此中位数位于第四个矩形内
,
得
0.1=0.03(x-70),
所以
x≈73.3.
这次数学成绩的平均数为
: ×0.005×10+ ×0.015×10+
×0.02×10+ ×0.03×10+ ×0.025×10+ ×0.005×10=72.
答案
:
75,73.3,72
【
解题策略
】
1.
计算样本数据数字特征时要注意的问题
(1)
计算中位数时一定要按从小到大的顺序排列数据
;
(2)
极差、方差、标准差的概念不要混淆
,
计算公式要掌握牢固
,
标准差的大小不会超过极差
.
2.
利用频率分布直方图求数字特征的方法
(1)
众数是最高矩形的底边中点的横坐标
;
(2)
中位数左右两边直方图的面积应相等
;
(3)
平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和
.
类型二 众数、中位数、平均数的应用
(
数据分析、数学建模
)
【
典例
】
个体户李某经营一家快餐店
,
下面是快餐店所有工作人员
2020
年
6
月份的工资表
:
老板李某
30 000
元
大厨老张
4 500
元
二厨小马
3 500
元
采购员小王
4 000
元
杂工李阿姨
3 200
元
服务生小明
3 200
元
会计小何
4 100
元
(1)
计算所有员工
6
月份的平均工资
;
(2)
由
(1)
计算出的平均工资能否反映打工人员这个月收入的一般水平
?
为什么
?
(3)
去掉李某的工资后
,
再计算平均工资
,
这能代表打工人员当月的收入水平吗
?
(4)
根据以上计算
,
以统计的观点
,
你对
(3)
的结果有什么看法
?
【
思路导引
】
老板李某的工资特别高
,
给多数人员的平均程度造成偏差
.
【
解析
】
(1)
所有员工
6
月份的平均工资是
×(30 000+4 500+3 500+
4 000+3 200+3 200+4 100)=7 500(
元
).
(2)
计算出的平均工资不能反映打工人员当月收入的一般水平
,
可以看出
,
打工
人员的工资都低于平均工资
,
因为这
7
个值中有一个极端值
——
李某的工资特别
高
,
所以他的工资对平均工资的影响较大
,
同时他也不是打工人员
.
(3)
去掉李某工资后的平均工资
×(4 500+3 500+4 000+3 200+3 200+
4 100)=3 750(
元
),
该平均工资能代表打工人员当月收入的一般水平
.
(4)
从本题的计算可以看出
,
个别特殊值对平均数有很大的影响
,
因此在选择样本时
,
样本中尽量不用特殊数据
.
【
解题策略
】
众数、中位数、平均数的意义
(1)
样本的众数、中位数和平均数常用来表示样本数据的“中心值”
,
其中众数和中位数容易计算、不受少数几个极端值的影响
,
但只能表达样本数据中的少量信息
,
平均数代表了数据更多的信息
,
但受样本中每个数据的影响
,
越极端的数据对平均数的影响也越大
.
(2)
当一组数据中有不少数据重复出现时
,
其众数往往更能反映问题
,
当一组数据中个别数据较大时
,
可用中位数描述其集中趋势
.
【
跟踪训练
】
某市有甲、乙、丙三家日光灯厂
,
三家广告中都称其产品的使用寿命为
8
年
,
但是他们的产品质量有区别
,
本着调查事实
,
现从甲、乙、丙三个厂家生产的同一种产品中
,
各抽取
8
件产品
,
对其使用寿命进行跟踪调查
,
其结果如下
(
单位
:
年
)
甲
:3,4,5,6,8,8,8,10
乙
:4,6,6,6,8,9,12,13
丙
:3,3,4,7,9,10,11,12
根据调查结果
,
你能得到什么启示
?
【
解析
】
三个厂家是从不同角度进行了说明
,
以宣传自己的产品
.
其中甲
:
众数为
8
年
,
乙
:
平均数为
8
年
,
丙
:
中位数为
8
年
.
类型三 平均数、方差的应用
(
数据分析、数学建模
)
【
典例
】
在射击比赛中
,
甲、乙两名运动员分在同一小组
,
统计出他们命中的环
数如表
:
赛后甲、乙两名运动员都说自己是胜者
,
如果你是裁判
,
你将给出怎样的评判
?
【
思路导引
】
不同的评判标准会产生不同的评判结果
.
甲
9
6
7
6
2
7
7
9
8
9
乙
2
4
6
8
7
8
9
7
9
10
【
解析
】
为了分析的方便
,
先计算两人的统计指标如表所示
.
平均数
方差
中位数
命中
10
环次数
甲
7
4
7
0
乙
7
5.4
7.5
1
(1)
平均环数和方差相结合
,
平均环数高者胜
.
若平均环数相等
,
则再看方差
,
方差小者胜
,
则甲胜
.
(2)
平均环数与中位数相结合
,
平均环数高者胜
,
若平均环数相等
,
则再看中位数
,
中位数大者胜
,
则乙胜
.
(3)
平均环数与命中
10
环次数相结合
,
平均环数高者胜
.
若平均环数相等
,
则再看命中
10
环次数
,
命中
10
环次数多者胜
,
则乙胜
.
【
解题策略
】
1.
在实际应用中
,
常常把平均数与标准差结合起来进行决策
.
在平均值相等的情况下
,
比较方差或标准差以确定稳定性
,
在平均数相同的情况下
,
方差越大
,
离散程度越大
,
数据波动性越大
,
稳定性越差
;
方差越小
,
数据越集中、越稳定
.
2.
对实际问题的分析评价
,
不仅要依据单个样本数字特征
,
还要综合考虑样本分布的影响
,
养成从多角度看问题的习惯
.
【
跟踪训练
】
某校甲班、乙班各有
49
名学生
,
两班在一次数学测验中的成绩
(
满分
100
分
)
统计
如表
:
请你根据表中数据
,
对这两个班的测验情况进行简要分析
,
并提出教学建议
.
班级
平均分
众数
中位数
标准差
甲班
79
70
87
19.8
乙班
79
70
79
5.2
【
解析
】
甲班学生成绩的中位数为
87
分
,
说明高于或等于
87
分的学生占一半以上
,
而平均分为
79
分
,
标准差很大
,
说明低分也多
,
两极分化严重
,
建议对学习有困难的同学多给一些帮助
;
乙班学生成绩的中位数是
79,
平均数为
79,
说明平均水平与甲班相同
,
而标准差较小说明乙班分数大多数都集中在
79
分左右
,
高分人数和低分人数都较少
,
建议培养高分学生
,
提高平均水平
.
【
补偿训练
】
从甲、乙两种玉米苗中各抽
10
株
,
分别测得它们的株高如下
(
单位
:cm):
甲
:25
41
40
37
22
14
19
39
21
42
乙
:27
16
44
27
44
16
40
40
16
40
问
:(1)
哪种玉米苗长得高
?(2)
哪种玉米苗长得齐
?
【
解析
】
(1)
因为
(25+41+40+37+22+14+19+39+21+42)= ×300=30(cm),
(27+16+44+27+44+16+40+40+16+40)= ×310=31(cm),
所以
< ,
即乙种玉米苗长得高
.
(2) [(25-30)
2
+(41-30)
2
+(40-30)
2
+(37-30)
2
+(22-30)
2
+(14-30)
2
+(19-
30)
2
+(39-30)
2
+(21-30)
2
+(42-30)
2
]
= (25+121+100+49+64+256+121+81+81+144)= ×1 042=104.2,
[(27-31)
2
+(16-31)
2
+(44-31)
2
+(27-31)
2
+(44-31)
2
+(16-31)
2
+(40-31)
2
+(40-31)
2
+(16-31)
2
+(40-31)
2
]= ×1 288=128.8,
所以
< ,
即甲种玉米
苗长得齐
.
课堂检测
·
素养达标
1.
某校举行歌咏比赛
,
规定各个评委评分的平均数作为该班节目的实际得分
.
对
于某班的演出
,
评委的评分分别为
:9.70,9.68,9.75,9.72,9.65,
则这个班节目
的实际得分是
(
)
A.9.66
B.9.70
C.9.65
D.9.67
【
解析
】
选
B. (9.65+9.70+9.68+9.75+9.72)=9.70.
2.
某厂
10
名工人在一小时内生产零件的个数分别是
15,17,14,10,15,17,17,
16,14,12,
设该组数据的平均数为
a,
中位数为
b,
众数为
c,
则有
(
)
A.a>b>c B.b>c>a C.c>a>b D.c>b>a
【
解析
】
选
D.
把数据由小到大排列可得
:10,12,14,14,15,15,16,17,17,17,
故
a=14.7,b=15,c=17,
所以
c>b>a.
3.
某校甲、乙两个班级各有
5
名编号为
1,2,3,4,5
的学生进行投篮练习
,
每人投
10
次
,
投中的次数如表
:
若以上两组数据的方差中较小的一个为
s
2
,
则
s
2
等于
(
)
A.
B.
C.
D.2
学生
1
号
2
号
3
号
4
号
5
号
甲班
6
7
7
8
7
乙班
6
7
6
7
9
【
解析
】
选
A. [(6-7)
2
+(7-7)
2
+(7-7)
2
+(8-7)
2
+(7-7)
2
]=
[(6-7)
2
+(7-7)
2
+(6-7)
2
+(7-7)
2
+(9-7)
2
]= ,
两组数据的方差中较小的一个为
,
即
s
2
=
4.
某工厂对一批新产品的长度
(
单位
:mm)
进行检测
,
如图是检测结果的频率分布直方图
,
据此估计这批产品的中位数为
.
【
解析
】
设中位数为
x,
则
0.1+0.2+0.08×(x-20)=0.5,
得
x=22.5.
答案
:
22.5
5.(
教材二次开发
:
练习改编
)
为竞争奥运会参赛资格
,
甲、乙、丙、丁四人参
加奥运会射击项目选拔赛
,
四人的平均成绩和方差如表
:
则参加奥运会的最佳人选应为
.
【
解析
】
由平均数及方差的意义知
,
丙的平均成绩较高且较稳定
.
答案
:
丙
甲
乙
丙
丁
平均数
8.5
8.8
8.8
8
方差
s
2
3.5
3.5
2.1
8.7