- 378.00 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
2.2.1 用样本的频率分布估计总体的分布
课时目标 1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频
率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.在解决统
计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体的
分布,初步体会样本频率分布的随机性.
1.极差的概念
极差是一组数据的__________________的差,它反映了一组数据__________,极差又叫
_
_______.
2.频数、频率的概念
将一批数据按要求分为若干组,对落在各个小组内数据的________进行累计,这个累计
数叫做各个小组的________,各个小组的________除以__________,即得该小组的
________.
3.频率分布直方图
在 频 率 分 布 直 方 图 中 , 纵 轴 表 示 ________________ , 各 小 长 方 形 的 面 积 等 于
________________,所有长方形面积之和等于____.
4.频率分布折线图
把频率分布直方图中各个长方形____________用线段连接起来,就得到频率分布折线
图.
5.总体密度曲线
如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体
在各个小组内所取值的__________________的大小;当样本容量不断增大,分组的组距
不断缩小时,频率分布直方图实际上越来越接近于______________,它可以用一条
______________来描绘,这条光滑曲线就叫做_______________________________.
6.茎叶图
用茎叶图表示数据的两个优点在于:一是从茎叶图上没有__________的损失,所有的数
据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时__________,方便记录与表示.
一、选择题
1.下列说法不正确的是( )
A.频率分布直方图中每个小矩形的高就是该组的频率
B.频率分布直方图中各个小矩形的面积之和等于 1
C.频率分布直方图中各个小矩形的宽一样大
D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的
2.一个容量为 100 的样本,其数据的分组与各组的频数如下:
组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]
频数 12 13 24 15 16 13 7
则样本数据落在(10,40]上的频率为( )
A.0.13 B.0.39 C.0.52 D.0.64
3.如图是总体密度曲线,下列说法正确的是( )
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百分比
4.一个容量为 35 的样本数据,分组后,组距与频数如下:[5,10),5 个;[10,15),12
个;[15,20),7 个;[20,25),5 个;[25,30),4 个;[30,35),2 个.则样本在区间[20,+
∞)上的频率为( )
A.20% B.69% C.31% D.27%
5.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)
数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),
[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于 100 克的个数是
36,则样本中净重大于或等于 98 克并且小于 104 克的产品的个数是( )
A.90 B.75
C.60 D.45
题 号 1 2 3 4 5
答 案
二、填空题
6.将容量为 n 的样本中的数据分成 6 组,绘制频率分布直方图.若第一组至第六组数
据的频率之比为 2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于 27,则 n=________.
7.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.
8.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的
个体在各组上的频率为 m,该组上直方图的高为 h,则|a-b|=________.
三、解答题
9.美国历届总统中,就任时年纪最小的是罗斯福,他于 1901 年就任,当时年仅 42 岁;
就任时年纪最大的是里根,他于 1981 年就任,当时 69 岁.下面按时间顺序(从 1789 年
的华盛顿到 2009 年的奥巴马,共 44 任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,
54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
10.抽查 100 袋洗衣粉,测得它们的重量如下(单位:g):
494 498 493 505 496 492 485 483 508
511 495 494 483 485 511 493 505 488
501 491 493 509 509 512 484 509 510
495 497 498 504 498 483 510 503 497
502 511 497 500 493 509 510 493 491
497 515 503 515 518 510 514 509 499
493 499 509 492 505 489 494 501 509
498 502 500 508 491 509 509 499 495
493 509 496 509 505 499 486 491 492
496 499 508 485 498 496 495 496 505
499 505 496 501 510 496 487 511 501
496
(1)列出样本的频率分布表:
(2)画出频率分布直方图,频率分布折线图;
(3)估计重量在[494.5,506.5]g 的频率以及重量不足 500 g 的频率.
能力提升
11.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大
值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量
不超过 100 时,按照数据的多少,常分成 5~12 组;组距的选择力求“取整”,组数=
极差
组距.③将数据分组:将数据分成互不相交的组,通常对组内数值所在区间取左闭右开
区间,最后一组取闭区间.④列频率分布表:一般分“分组”、“频数累计”、“频数”、
“频率”四列,最后一行是合计.注意频数的合计是样本容量,频率的合计是 1.⑤绘制
频率分布直方图:根据频率分布表绘制频率分布直方图,其中纵轴表示频率与组距的比
值,其相应组距上的频率等于该组距上的矩形的面积,即每个矩形的面积=组距×频率
组距
=频率.这样频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,
各小矩形的面积的总和等于 1.
第二章 统 计
§2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体的分布
知识梳理
1.最大值与最小值 变化的幅度 全距 2.个数 频数 频数 样本容量 频率 3.
频率与组距的比值 相应各组的频率 1 4.上边的中点 5.个数与总数比值 总体的
分布 光滑曲线 y=f(x) 总体密度曲线 6.原始信息 随时记录
作业设计
1.A
2.C [样本数据落在(10,40]上的频数为 13+24+15=52,故其频率为 52
100
=0.52.]
3.C
4.C [由题意,样本中落在[20,+∞)上的频数为 5+4+2=11,∴在区间[20,+∞)
上的频率为11
35
≈0.31.]
5.A [∵样本中产品净重小于 100 克的频率为(0.050+0.100)×2=0.3,频数为 36,
∴样本总数为36
0.3
=120.
∵样本中净重大于或等于 98 克并且小于 104 克的产品的频率为(0.100+0.150+
0.125)×2=0.75,
∴样本中净重大于或等于 98 克并且小于 104 克的产品的个数为 120×0.75=90.]
6.60
解析 ∵n· 2+3+4
2+3+4+6+4+1
=27,∴n=60.
7.45,46
解析 由茎叶图及中位数的概念可知 x 甲中=45,x 乙中=46.
8.m
h
解析 频率
组距
=h,故|a-b|=组距=频率
h
=m
h.
9.解 (1)以 4 为组距,列表如下:
(2)从频率分布表中可以看出,将近 60%的美国总统就任时的年龄在 50 岁至 60 岁之间,
45 岁以下以及 65 岁以上就任的总统所占的比例相对较小.
10.解 (1)在样本数据中,最大值是 518,最小值是 483,它们相差 35,若取组距为 4,
由于35
4
=83
4
,要分 9 组,组数合适,于是决定取组距为 4 g,分 9 组,使分点比数据多
一位小数,且把第一组起点稍微减小一点,得分组如下:
[482.5,486.5),[486.5,490.5),…,[514.5,518.5).
列出频率分布表:
分组 个数累计 频数 频率 累积
频率
[482.5,486.5) 正 8 0.08 0.08
[486.5,490.5) 3 0.03 0.11
[490.5,494.5) 正正正 17 0.17 0.28
[494.5,498.5) 正正正正- 21 0.21 0.49
[498.5,502.5) 正正 14 0.14 0.63
[502.5,506.5) 正 9 0.09 0.72
[506.5,510.5) 正正正 19 0.19 0.91
[510.5,514.5) 正- 6 0.06 0.97
[514.5,518.5] 3 0.03 1.00
合计 100 1.00
(2)频率分布直方图与频率分布折线图如图.
(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44.
设重量不足 500 g 的频率为 b,根据频率分布表,
b-0.49
500-498.5
≈ 0.63-0.48
502.5-498.5
,故 b≈0.55.因此重量不足 500 g 的频率约为 0.55.
11.解 (1)
(2)电脑杂志上每个句子的字数集中在 10~30 之间;而报纸上每个句子的字数集中在
20~40 之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字
数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.