- 1.09 MB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
探究
:
我国是世界上严重缺水的 国家之一,城市缺水问题较为突出。某市政府为了节约用水,计划在 本市试行居民生活用水定额管理,即确定一个居民月用水量标准
a,
用水量不超过
a
的按平价收费,超过
a
的按议价收费。如果希望大部分居民的 日常生活不受影响,那么标准
a
定为多少比较合理?你认为,为了较为合理地确定出这个标准,需要做什么工作?
根据这些数据你能得出用水量其他信息吗
?
从上面这些数字,我们很容易发现的居民的月均用水量的最小值 是
0.2 t,
最大值是
4.3 t.
其他在
0.2
至
4.3
之间。很难再发现其他信息。我们很难从随意记录的数据中直接看出规律。为此,我们需要对统计数据进行整理与分析。
表
2
-
1 100
位居民的月均用水量 (单位 :
t )
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6
3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4
3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8
3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1
3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3
3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0
2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3
2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4
2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4
2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
1
、求极差
(
即一组数据中最大值与最小值的差
)
知道这组数据的变动范围
4.3-0.2=4.1
2
、决定组距与组数(将数据分组)
3
、 将数据分组
(8.2
取整
,
分为
9
组
)
画频率分布直方图的步骤
4
、列出
频率分布表
.
5
、画出
频率分布直方图
。
组距
:
指每个小组的两个端点的距离,组距
组数
:
将数据分组,当数据在
100
个以内时,
按数据多少常分
5-12
组。
表
2
-
2 100
位居民月均用水量的 频率分布表
分组 频数累计 频数 频率
[0 , 0.5) 4 0.04
[0.5 , 1) 8 0.08
[1 , 1.5) 15 0.15
[1.5 , 2) 22 0.22
[2 , 2.5) 25 0.25
[2.5 , 3) 14 0.14
[3 , 3.5) 6 0.06
[3.5 , 4) 4 0.04
[4 , 4.5) 2 0.02
合计
100 1.00
频率分布直方图如下
:
月均用水量
/t
频率
组距
0.10
0.20
0.30
0.40
0.50
0.5
1
1.5
2
2.5
3
3.5
4
4.5
小长方形的面积
=?
月均用水量
/t
频率
组距
0.10
0.20
0.30
0.40
0.50
0.5
1
1.5
2
2.5
3
3.5
4
4.5
频率分布直方图如下
:
小长方形的面积总和
=?
注:小长方形的面积=组距
×
频率
/
组距=频率
各长方形的面积总和等于
1
。
频率分布直方图如下
:
月均用水量
/t
频率
组距
0.10
0.20
0.30
0.40
0.50
0.5
1
1.5
2
2.5
3
3.5
4
4.5
月均用水量最多的在那个区间
?
频率分布直方图如下
:
月均用水量
/t
频率
组距
0.10
0.20
0.30
0.40
0.50
0.5
1
1.5
2
2.5
3
3.5
4
4.5
请大家阅读第
70
页
,
直方图有那些优点和缺点
?
探究:
同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以
1
和
0.1
为组距重新作图,然后谈谈你对图的印象。
练 习
1.
有一个容量为
50
的样本数据的分组的频数如下:
[
12.5, 15.5
)
3
[
15.5, 18.5
)
8
[
18.5, 21.5
)
9
[
21.5, 24.5
)
11
[
24.5, 27.5
)
10
[
27.5, 30.5
)
5
[
30.5, 33.5
)
4
(1)
列出样本的频率分布表
;
(2)
画出频率分布直方图
;
(3)
根据频率分布直方图估计
,
数据落在
[15.5, 24.5
)的百分比是多少
?
解
:
组距为
3
分组 频数 频率
频率
/
组距
[
12.5, 15.5
)
3
[
15.5, 18.5
)
8
[
18.5, 21.5
)
9
[
21.5, 24.5
)
11
[
24.5, 27.5
)
10
[
27.5, 30.5
)
5
[
30.5, 33.5
)
4
0.06
0.16
0.18
0.22
0.20
0.10
0.08
0.020
0.053
0.060
0.073
0.067
0.033
0.027
频率分布直方图如下
:
频率
组距
0.010
0.020
0.030
0.040
0.050
12.5
15.5
0.060
0.070
频率分布直方图如下
:
月均用水量
/t
频率
组距
0.10
0.20
0.30
0.40
0.50
0.5
1
1.5
2
2.5
3
3.5
4
4.5
100
位居民的月均用水量的频率分布折线图
思考
:
如果当地政府希望使
85%
以上的居民每月的用水量不超出标准,根据频率
分
布表和频率分布直方图,你能对制定月用水量标准提出建议吗?
频率分布直方图如下
:
月均用水量
/t
频率
组距
0.10
0.20
0.30
0.40
0.50
0.5
1
1.5
2
2.5
3
3.5
4
4.5
连接频率分布直方图中各小长方形上端的中点
,
得到
频率分布折线图
100
位居民的月均用水量的频率分布折线图
利用样本频率分布对总体分布进行相应估计
(
3
)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线
——
总体密度曲线
。
(
2
)样本容量越大,这种估计越精确。
(
1
)上例的样本容量为
100
,如果增至
1000
,其频率分布直方图的情况会有什么变化?假如增至
10000
呢?
用样本分布直方图去估计相应的总体分布时,一般样本容量越大,
频率分布直方图
就会无限接近
总体密度曲线
,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。
总体密度曲线反映了总体在各个范围内取值的百分比
,
精确地反映了总体的分布规律。是研究总体分布的工具
.
总体密度曲线
总体密度曲线
频率
组距
月均用水量
/t
a
b
(图中阴影部分的面积,表示总体在某个区间
(a, b)
内取值的百分比)。
※
总体密度曲线能够很好的反映总体在各个范围内的百分比,能够提供更准确的信息。尽管有些总体密度曲线是客观存在的,但是很难象函数图象那样准确的地画出来。
?思考一下图中阴影部分的面积表示什么?
总体在区间 内取值的概率
频率分布表
分组
个数累计
频数
频率
频率
/
组距
频率分布直方图
样本频率分布中,当样本容量无限增大,组距无限缩小
样本频率分布直方图
接近于一条光滑曲线
——
总体密度曲线
,反映了总体分布。
例 某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:
(1)
甲运动员得分:
13,51,23,8,26,38,16,33,14,28,39
(2)
乙运动员得分
:
49,24,12,31,50,31,44,36,15,37,25,36,39
甲
乙
0
1
2
3
4
5
2 5
5 4
1 6 1 6 7 9
4 9
0
8
4 6 3
3 6 8
3 8 9
1
甲
乙
0
1
2
3
4
5
2 5
5 4
1 6 1 6 7 9
4 9
0
8
4 6 3
3 6 8
3 8 9
1
从这个茎叶图可以看出,乙运动员的得分大致对称,叶的分布是“单峰”的,大多数的叶集中在茎
2
,
3
,
4
上,中位数是
36
;甲运动员的得分除一个特殊得分外,也大致对称,叶的分布也是“单峰”的,大多数的叶集中在茎
1
,
2
,
3
上,中位数是
26
。由此可以看出,乙运动员的发挥更稳定,成绩更好。