- 134.32 KB
- 2021-06-25 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
2.2.1 《用样本的频率分布估计总体分布》
【学习目标】
1. 通过实例体会分布的意义和作用;
2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;
3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
【重点难点】
教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图
教学难点:能通过样本的频率分布估计总体的分布
【知识链接】
说一说简单随机抽样、系统抽样、分层抽样各自的特点、操作步骤和适用的范围。
类 别
共同点
各自特点
联 系
适用范围
简单随机
抽样
(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
系统抽样
将总体均分成几部 分,按预先制定的规则在各部分抽取
在起始部分样时采用简随机抽样
总体个数较多
分层抽样
将总体分成几层,分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
【引入】
在统计中,为了考察一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况。这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。下面我们先通过案例来介绍总体分布的估计。
【学习过程】
我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?
为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。(见课本表2-1)
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式
下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。
一、频率分布直方图
频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:
(1)计算一组数据中最大值与最小值的差,即求极差
(2)决定组距与组数,
(3)将数据分组
(4)列频率分布表
(5)画频率分布直方图
以课本制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。
频率分布直方图的特征:
(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
思考探究:
(1)在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?
(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?
(3)如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-1和频率分布直方图2.2-1,(见课本)你能对制定月用水量标准提出建议吗?
二、频率分布折线图、总体密度曲线
1.频率分布折线图的定义:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
2.总体密度曲线的定义:
在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本)
思考探究:
(1)对于任何一个总体,它的密度曲线是不是一定存在?为什么?
(2)对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?
答:实际上,尽管有些总体密度曲线是客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。
三.茎叶图
1.茎叶图的概念:
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例子)
2.茎叶图的特征:
(1)用茎叶图表示数据的优点:一是既可以看出样本的分布情况又能看到原始数据;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
【例题精析】
例1、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)画出频率分布折线图;
(4)估计身高小于134cm的人数占总人数的百分比.。
分析:根据样本频率分布表、频率分布直方图的一般步骤解题。
解:(1)样本频率分布表如下:
(2、3)其频率分布直方图如下:
(4)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.
变式训练:
为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
(1) 第二小组的频率是多少?样本容量是多少?
(2) 若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3) 在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。
分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,
各组频数之和等于样本容量,频率之和等于1。
解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为:
由频率=,90
100
110
120
130
140
150
次数
o
0.004
0.008
0.012
0.016
0.020
0.024
0.028
频率/组距
0.032
0.036
得
(2)由图可估计该学校高一学生的达标率
约为
(3)由已知可得各小组的频数依次为6,12,
51,45,27,9,所以前三组的频数之
和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。
例2、从两个班中各随机的抽取10名学生,他们的数学成绩如下:
甲班:76,74,82,96,66,76,78,72,52,68
乙班:86,84,62,76,78,92,82,74,88,85
画出茎叶图并分析两个班学生的数学学习情况。
解析:
由茎叶图可知,乙班的成绩较好,而且较稳定。
【学习反思】
1、制作频率分布直方图分几个步骤?各步骤需要注意哪些问题?
2、频率分布直方图和茎叶图相比有什么特点?
答:1、步骤:
(1)计算一组数据中最大值与最小值的差,即求极差
(2)决定组距与组数,(组距是人为决定的)
(3)将数据分组
(4)列频率分布表(必须包括分组、频数、频率三部分)
(5)画频率分布直方图(注意纵坐标表示什么,各小长方形是连在一起的)
3、频率分布直方图无法看到原始数据,而茎叶图能看出原始数据;但频率分布直方图所体现的内容比茎叶图多。
【书面作业】导学案【拓展提升】
2.2.1 《用样本的频率分布估计总体分布》导学案
【学习目标】
1. 通过实例体会分布的意义和作用;
2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;
3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
【重点难点】
重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图
难点:能通过样本的频率分布估计总体的分布
【学法指导】
一、预习目标:在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;
二、预习内容:阅读课本~
三.完成下列问题:
1. 一般用频率分布直方图反映样本的频率分布。其一般步骤有哪些? 频率分布直方图的特征是什么?
2.茎叶图的特征是什么?
【知识链接】
说一说简单随机抽样、系统抽样、分层抽样各自的特点、操作步骤和适用的范围。
类 别
共同点
各自特点
联 系
适用范围
简单随机
抽样
(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
系统抽样
将总体均分成几部 分,按预先制定的规则在各部分抽取
在起始部分样时采用简随机抽样
总体个数较多
分层抽样
将总体分成几层,分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
【新知探究】
我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?
【学习过程】
一、频率分布直方图
1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:
2.以课本制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。
3.频率分布直方图的特征:
思考探究:
(1)在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?
(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?
(3)如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-1和频率分布直方图2.2-1,(见课本)你能对制定月用水量标准提出建议吗?
二、频率分布折线图、总体密度曲线
1.频率分布折线图的定义:
2.总体密度曲线的定义:
在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本)
思考探究:
(1)对于任何一个总体,它的密度曲线是不是一定存在?为什么?
(2)对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?
三.茎叶图
1.茎叶图的概念:
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例子)
2.茎叶图的特征:
典型例题
例1、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)画出频率分布折线图;
(4)估计身高小于134cm的人数占总人数的百分比.。
变式训练:
为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
(1) 第二小组的频率是多少?样本容量是多少?
(2) 若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3) 在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。
例2、从两个班中各随机的抽取10名学生,他们的数学成绩如下:
甲班:76,74,82,96,66,76,78,72,52,68
乙班:86,84,62,76,78,92,82,74,88,85
画出茎叶图并分析两个班学生的数学学习情况。
【基础达标】
1.为了解一批数据在各个范围内所占的比例大小,将这批数据分组,落在各个小组里的
数据个数叫做 ( )
A、频数 B、样本容量 C、频率 D、频数累计
2.在频率分布直方图中,各个小长方形的面积表示 ( )
A、落在相应各组的数据的频数 B、相应各组的频率
C、该样本所分成的组数 D、该样本的容量
3.列样本频率分布表时,决定组数的正确方法是 ( )
A、任意确定 B、一般分为5—12组
C、由组距和组数决定 D、根据经验法则,灵活掌握
4.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0、125,则n的值为( )
A、640 B、320 C、240 D、160
5.为考察某种皮鞋的各种尺码的销售情况,以某天销售40双皮鞋为一个样本,把它按尺码分成5组,第3组的频率为0、25,第1,2,4组的频率分别为6,7,9,若第5组表示的是40—42码的皮鞋,则售出的200双皮鞋中含40—42码的皮鞋为( )
A、50 B、40 C、20 D、30
6.一个容量为20 的样本数据,分组后组距与频数如下:
(10,20],2;(20,30],3;(30,40],4;(40,50],4;(60,70],2。则样本在区间(-,50]上的频率是( )
A、5% B、25% C、50% D、70%
7.将一批数据分成5组列出频率分布表,其中第1组的频率是0、1,第4组与 第5组的频率之和是0、3,那么第2组与第3组的频率之和是 。
【学习反思】
【拓展提升】
1.从一群学生中收取一个一定容量的样本对他们的学习成绩进行分析,前三组是不超过80分的人,其频数之和为20人,其频率之和(又称累积频率)为0、4,则所抽取的样本的容量是 ( )
A、100 B、80 C、40 D、50
2.下列叙述中正确的是 ( )
A、从频率分布表可以看出样本数据对于平均数的波动大小
B、频数是指落在各个小组内的数据
C、每小组的频数与样本容量之比是这个小组的频率
D、组数是样本平均数除以组距
3.有一个数据为50的样本数据分组,以及各组的频数如下,根据累积频率分布,估计小于30的数据大约占多少( )
[12、5,15、5),3;[15、5,18、5),8;[18、5,21、5),9;[21、5,24、5),11;[24、5,27、5),10;[30、5,33、5),4
A、10% B、92% C、5% D、30%
4.在抽查某产品尺寸的过程中,将其尺寸分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率为m,该组上的直方图的高是h,则,[a-b]等于( )
A、hm B、 C、 D、 与m,h无关
5.已知一个样本75,71,73,75,77,79,75,78,80,79,76,74,75,77,76,72,74,75,76,78。在列频率分布表时,如果组距取为2,那么应分成 组,第一组的分点应是 — ,74、5—76、5这组的频数应为 ,频率应为 。
6.在求频率分布时,把数据分为5组,若已知其中的前四组频率分别为0、1,0、3,0、3,0、1,则第五组的频率是 ,这五组的频数之比为 。
7.为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组及频率如下表:
分组
频数
频率
[10、75,10、85)
3
[10、85,10、95)
9
[10、95,11、05)
13
[11、05,11、15)
16
[11、15,11、25)
26
[11、25,11、35)
20
[11、35,11、45)
7
[11、45,11、55)
4
[11、55,11、65)
2
合计
100
完成上面的频率分布表;
根据上表画出频率分布直方图;
根据上表和图,估计数据落在[10、95,11、35)范围内的概率约是多少?
数据小于11、20的概率约是多少?
相关文档
- 高中数学100题编写及训练计划等2021-06-255页
- 【数学】2021届一轮复习人教A版(文)2021-06-255页
- 2020学年高一数学上学期第二次月考2021-06-257页
- 高中数学必修3同步练习:第三章概率(2021-06-258页
- 人教版高三数学总复习教学课件:7-32021-06-2566页
- 高中数学人教A版必修一教学训练(教2021-06-253页
- 数学人教A版必修3第三章《概率》教2021-06-2517页
- 浙江省金华一中10-11学年高一数学2021-06-259页
- 高中数学必修4公开课教案2_2_2 向2021-06-256页
- 2020-2021学年高二数学上学期期中2021-06-2518页