- 325.53 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第2讲 用样本估计总体
[最新考纲]
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会他们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
知 识 梳 理
知 识 梳 理
1.频率分布直方图
(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.
(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
2.用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
①众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
③平均数:样本数据的算术平均数,即=(x1+x2+…+xn).在频率分布直方图中,中位数左边和右边的直方图的面积相等.
(2)样本方差、标准差
标准差s= .
其中xn是样本数据的第n项,n是样本容量,是平均数.
标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
辨 析 感 悟
1.对频率分布直方图的认识
(1)在频率分布直方图中,小矩形的高表示频率.(×)
(2)频率分布直方图中各个长方形的面积之和为1.(√)
2.对样本数字特征的认识
(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(√)
(4)一组数据的方差越大,说明这组数据的波动越大.(√)
(5)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.(×)
(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)
(7)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.(×)
(8)如图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为85,1.6.(√)
(9)(2018·广州调研改编)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是15.(√)
[感悟·提升]
1.作频率分布直方图的步骤
(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.
2.两个防范 一是在频率分布直方图中,小矩形的高表示频率/
组距,而不是频率,如(1);
二是利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
考点一 频率分布直方图的应用
【例1】 某中学高一女生共有450人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下:
组别
频数
频率
145.5~149.5
8
0.16
149.5~153.5
6
0.12
153.5~157.5
14
0.28
157.5~161.5
10
0.20
161.5~165.5
8
0.16
165.5~169.5
m
n
合计
M
N
(1)求出表中字母m,n,M,N所对应的数值;
(2)在给出的直角坐标系中画出频率分布直方图;
(3)估计该校高一女生身高在149.5~165.5 cm范围内有多少人?
审题路线 由频率分布表可以计算出m,n,M,N的值⇒作频率分布直方图⇒利用频率分布直方图求值.
解 (1)由题意M==50,落在区间165.5~169.5内数据频数m=50-(8+6+14+10+8)=4,
频率为n=0.08,总频率N=1.00.
(2)频率分布直方图如下图:
(3)该所学校高一女生身高在149.5~165.5 cm之间的比例为0.12+0.28+0.20+0.16=0.76,则该校高一女生在此范围内的人数为450×0.76=342(人).
规律方法 解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这些数据中,比较明显的有组距、,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积=组距×=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题.
【训练1】 (2018·辽宁卷)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100]人.若低于60分的人数是15人,则该班的学生人数是( ).
A.45 B.50 C.55 D.60
解析 第一、第二小组的频率分别是0.1,0.2,所以低于60分的频率是0.3,设班级人数为m,则=0.3,m=50.
答案 B
考点二 茎叶图的应用
【例2】 为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5
2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4
1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据完成右面茎叶图,从茎叶图看,哪种药的疗效更好?
解 (1)设A药观测数据的平均数为A,B药观测数据的平均数为B,
则A=(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3.
B=(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.则A>B,因此A药的疗效更好.
(2)由观测结果绘制如下茎叶图:
从茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上;B药疗效的试验结果有的叶集中在茎0,1上.
由上述可看出A药的疗效更好.
规律方法 茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据.
【训练2】 (2018·重庆卷)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)
甲组
乙组
9
0
9
x
2
1
5
y
8
7
4
2
4
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( ).
A.2,5 B.5,5 C.5,8 D.8,8
解析 由茎叶图及已知得x=5,又乙组数据的平均数为16.8,即=16.8,解得y=8.
答案 C
考点三 样本的数字特征
【例3】 甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
解 (1)由图象可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
甲==13,
乙==13,
s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
规律方法 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
【训练3】 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.
现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为 ( ).
A. B. C.36 D.
解析 由题意知=91,解得x=4.所以s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=(16+9+1+0+1+9+0)=.
答案 B
1.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
2.众数、中位数、平均数的异同
(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质.
(3)众数体现各数据出现的频率,当一组数据中有若干数据多次出现时,众数往往更能反映问题.
(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.
易错辨析8——统计图表识图不准致误
【典例】 从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:
若某高校A专业对视力的要求在0.9以上,则该班学生中能报A专业的人数为________.
[解析] 该班学生视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4,故能报A专业的人数为0.4×50=20.
[答案] 20
[易错警示] 解题中易出现审题不仔细,又对所给图形没有真正理解清楚,将矩形的高误认为频率或者对“0.9以上”的含义理解有误.
[防范措施] 求解频率分布直方图中的数据问题,最容易出现的问题就是把纵轴误以为是频率导致错误.在频率分布直方图中,纵轴表示,我们用各个小矩形的面积表示该段数据的频率,所以各组数据的频率等于小矩形的高对应的数据与小矩形的宽(样本数据的组距)的乘积.
【自主体验】
(2018·福建卷)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( ).
A.588 B.480 C.450 D.120
解析 从频率分布直方图可以看出:分数大于或等于60分的频率为(0.030+0.025+0.015+0.010)×10=0.8,故频数为600×0.8=480.
答案 B
能力提升题组
(建议用时:25分钟)
一、选择题
1.(2018·长春调研)如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40)、[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为( ).
A.0.04 B.0.06 C.0.2 D.0.3
解析 由频率分布直方图可知,年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07×5=0.35,又年龄在[30,35),[35,40),[40,45]的频率成等差数列分布,所以年龄在[35,40)的网民出现的频率为0.2.
答案 C
2.(2018·陕西卷)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则( ).
A.甲<乙,m甲>m乙 B.甲<乙,m甲乙,m甲>m乙 D.甲>乙,m甲