- 355.50 KB
- 2021-06-24 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
一 众数、中位数、平均数的概念
中数
:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
众数
:在一组数据中,出现次数最多的数据叫做这组数据的众数.
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛
.
平均数
:
一组数据的算术平均数
,
即
x=
练习
:
在一次中学生田径运动会上,参加男子跳高的
17
名运动员的成绩如下表所示:
成绩
(
单位:米
)
1
.
50
1
.
60
1
.
65
1
.
70
1
.
75
1
.
80
1
.
85
1
.
90
人数
2
3
2
3
4
1
1
1
分别求这些运动员成绩的众数,中位数与平均数
平均数
:
一组数据的算术平均数
,
即
x=
解:在
17
个数据中,
1.75
出现了
4
次,出现的次数最多,即这组数据的众数是
1.75
.
上面表里的
17
个数据可看成是按从小到大的顺序排列的,其中第
9
个数据
1.70
是最中间的一个数据,即这组数据的中位数是
1.70
;
这组数据的平均数是
答:
17
名运动员成绩的众数、中位数、平均数依次是
1.75
(米)、
1.70
(米)、
1.69
(米)
.
二 、 众数、中位数、平均数与频率分布直方图的关系
1
、
众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
例如,在上一节调查的
100
位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是
2.25t.
如图所示:
频率
组距
0.1
0.2
0.3
0.4
0.5
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月平均用水量
(t)
2
、
在样本中,有
50
%的个体小于或等于中位数,也有
50
%的个体大于或等于中位数
,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为
2.03t.
频率
组距
0.1
0.2
0.3
0.4
0.5
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月平均用水量
(t)
说明
:
2.03
这个中位数的估计值
,
与样本的中位数值
2.0
不一样
,
这是因为样本数据的频率分布直方图
,
只是直观地表明分布的形状
,
但是从直方图本身得不出原始的数据内容
,
所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致
.
3
、
平均数是频率分布直方图的“重心”
.
是直方图的平衡点
. n
个样本数据的平均数由公式
:
X=
给出
.
下图显示了居民月均用水量的平均数
: x=1.973
频率
组距
0.1
0.2
0.3
0.4
0.5
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月平均用水量
(t)
三 三种数字特征的优缺点
1
、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征
.
如上例中众数是
2.25t,
它告诉我们
,
月均用水量为
2.25t
的居民数比月均用水量为其它数值的居民数多
,
但它并没有告诉我们多多少
.
2
、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为
10t
,那么它所占频率为
0.01,
几乎不影响中位数
,
但显然这一极端值是不能忽视的。
3
、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。
四 众数、中位数、平均数的简单应用
例 某工厂人员及工资构成如下:
人员
经理
管理人员
高级技工
工人
学徒
合计
周工资
2200
250
220
200
100
人数
1
6
5
10
1
23
合计
2200
1500
1100
2000
100
6900
(
1
)指出这个问题中周工资的众数、中位数、平均数
(
2
)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?