- 327.00 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第三节 用样本估计总体
[考纲传真] (教师用书独具)1.了解分布的意义与作用,能根据概率分布表画频
率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准
差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如
平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会
用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,
会用样本估计总体的思想解决一些简单的实际问题.
(对应学生用书第 136 页)
[基础知识填充]
1.频率分布直方图
(1)频率分布表的画法:
第一步:求极差,决定组数和组距,组距=极差
组数;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区
间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图 931).
图 931
横轴表示样本数据,纵轴表示频率
组距,每个小矩形的面积表示样本落在该组内
的频率.
2.频率分布折线图和茎叶图
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到
频率分布折线图
(2)茎叶图:茎叶图不但可以保留所有的数据信息,而且可以随时记录,这对
数据的记录和表示都能带来方便.茎叶图中的“茎”是指中间的一列数,“叶”
是从“茎”的旁边生长出来的数,是单个数字.
3.样本的数字特征
数字特征 定义
众数 在一组数据中,出现次数最多的数据叫做这组数据的众数
中位数
将一组数据按大小依次排列,把处在最中间位置的一个数据
(或最中间两个数据的平均数)叫做这组数据的中位数.
在频率分布直方图中,中位数左边和右边的直方图的面积相
等
平均数 样本数据的算术平均数,即x=x1+x2+…+xn
n
方差 s2=1
n[(x1-x)2+(x2-x)2+…+(xn-x)2],其中 s 为标准差
[知识拓展]
1.频率分布直方图的特点
(1)频率分布直方图中各小长方形的面积之和为 1,因为在频率分布直方图中
组距是一个固定值,所以各小长方形高的比也就是频率比.
(2)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,
后者直观.
2.计算方差的两种方法
(1)s2=1
n[(x1-x)2+(x2-x)2+…+(xn-x)2]
(2)s2=1
n(x21+x22+…+x2n)-x2
3.平均数、方差的公式推广
(1)若数据 x1,x2,…,xn 的平均数为x,那么 mx1+a,mx2+a,mx3+a,…,
mxn+a 的平均数是 mx+A.
(2)数据 x1,x2,…,xn 的方差为 s2.
①数据 x1+a,x2+a,…,xn+a 的方差也为 s2;
②数据 ax1,ax2,…,axn 的方差为 a2s2.
[基本能力自测]
1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的方差越大,说明这组数据越集中. ( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率
越高.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,
相同的数据可以只记一次.( )
[解析] (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中
趋势.
(2)错误.方差越大,这组数据越离散.
(3)正确.小矩形的面积=组距×频率
组距=频率.
(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重
复记录,故(4)错误.
[答案] (1)√ (2)× (3)√ (4)×
2.(教材改编)若某校高一年级 8 个班参加合唱比赛的得分如茎叶图 932 所示,
则这组数据的中位数和平均数分别是( )
图 932
A.91.5 和 91.5 B.91.5 和 92
C.91 和 91.5 D.92 和 92
A [这组数据由小到大排列为 87,89,90,91,92,93,94,96.
∴中位数是91+92
2
=91.5,
平均数x=87+89+90+91+92+93+94+96
8
=91.5.]
3.(2017·南昌二模)如图 933 所示是一样本的频率分布直方图.若样本容量为
100,则样本数据在[15,20)内的频数是( )
图 933
A.50 B.40
C.30 D.14
C [因为[15,20]对应的小矩形的面积为 1-0.04×5-0.1×5=0.3,所以样本
落在[15,20]的频数为 0.3×100=30,故选 C.]
4.(2016·江苏高考)已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是
________. 【导学号:79170327】
0.1 [5 个数的平均数x=4.7+4.8+5.1+5.4+5.5
5
=5.1,
所以它们的方差 s2=1
5[(4.7-5.1)2+(4.8-5.1) 2+(5.1-5.1) 2+(5.4-5.1) 2+
(5.5-5.1)2]=0.1.]
5.(2017·山东高考)如图 934 所示的茎叶图记录了甲、乙两组各 5 名工人某日
的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则 x
和 y 的值分别为( )
图 934
A.3,5 B.5,5
C.3,7 D.5,7
A [甲组数据的中位数为 65,由甲、乙两组数据的中位数相等得 y=5.又甲、
乙两组数据的平均值相等,∴1
5
×(56+65+62+74+70+x)=1
5
×(59+61+67
+65+78),
∴x=3.故选 A.]
(对应学生用书第 137 页)
茎叶图及其应用
(2018·沈阳模拟)某市为了考核甲、乙两部门的工作情况,随机访问了 50
位市民.根据这 50 位市民对这两部门的评分(评分越高表明市民的评价越高),
绘制茎叶图如图 935:
甲部门 乙部门
3 59
4 4 0448
97 5 122456677789
97665332110 6 011234688
98877766555554443332100 7 00113449
6655200 8 123345
632220 9 011456
10 000
图 935
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
[解] (1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第
25,26 位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中
位数的估计值是 75. 3 分
50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本
中位数为66+68
2
=67,所以该市的市民对乙部门评分的中位数的估计值是 67.
5 分
(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率分别为5
50
=
0.1, 8
50
=0.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分
别为 0.1,0.16. 8 分
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中
位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的
评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门
的评价较低、评价差异较大. 12 分
[规律方法] 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映
数据在各段上的分布情况.
2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”
时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.
(2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能
力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.
[变式训练 1] (2017·雅礼中学质检)已知甲、乙两组数据如茎叶图 936 所示,若
两组数据的中位数相同,平均数也相同,那么 m+n=________.
图 936
11 [∵两组数据的中位数相同,
∴m=2+4
2
=3.
又∵两组数据的平均数也相同,
∴27+33+39
3
=20+n+32+34+38
4
,∴n=8,
因此 m+n=11.]
频率分布直方图
角度 1 利用分布直方图求频率、频数
(2016·山东高考)某高校调查了 200 名学生每周的自习时
间(单位:小时),制成了如图 937 所示的频率分布直方图,其中自习
时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),
[22.5,25),[25,27.5),[27.5,30].根据直方图,这 200 名学生中每周的自习时间不
少于 22.5 小时的人数是( )
图 937
A.56 B.60
C.120 D.140
D [由直方图可知每周自习时间不少于 22.5 小时的频率为(0.16+0.08+
0.04)×2.5=0.7,则每周自习时间不少于 22.5 小时的人数为 0.7×200=140.故
选 D.]
角度 2 用频率分布直方图估计总体
(2016·四川高考)我国是世界上严重缺水的国家,某市为了制定合理的
节水方案,对居民用水情况进行了调查.通过抽样,获得了某年 100 位居民每
人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成 9
组,制成了如图 938 所示的频率分布直方图. 【导学号:79170328】
图 938
(1)求直方图中 a 的值;
(2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明
理由;
(3)估计居民月均用水量的中位数.
[解] (1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为 0.08×0.5=
0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分
别为 0.08,0.21,0.25,0.06,
0.04,0.02.
由 1-(0.04+0.08+0.21+0.25+0.06+
0.04+0.02)=0.5×a+0.5×a,
解得 a=0.30. 5 分
(2)由(1)知,该市 100 位居民中月均用水量不低于 3 吨的频率为 0.06+0.04+
0.02=0.12.
由以上样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨的人数
为 300 000×0.12=36 000. 8 分
(3)设中位数为 x 吨.
因为前 5 组的频率之和为 0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前 4 组的频率之和为 0.04+0.08+0.15+0.21=0.48<0.5,
所以 2≤x<2.5. 10 分
由 0.50×(x-2)=0.5-0.48,解得 x=2.04.
故可估计居民月均用水量的中位数为 2.04 吨. 12 分
[规律方法] 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵
轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频
率.
2.(1)例 3-2 中抓住频率分布直方图中各小长方形的面积之和为 1,这是解题
的关键.(2)利用样本的频率分布估计总体分布.
[变式训练 2] (2017·北京高考)某大学艺术专业 400 名学生参加某次测评,根据
男女学生人数比例,使用分层抽样的方法从中随机抽取了 100 名学生,记录他
们的分数,将数据分成 7 组:[20,30),[30,40),…,[80,90],并整理得到如下
频率分布直方图.
图 939
(1)从总体的 400 名学生中随机抽取一人,估计其分数小于 70 的概率;
(2)已知样本中分数小于 40 的学生有 5 人,试估计总体中分数在区间[40,50)内
的人数;
(3)已知样本中有一半男生的分数不小于 70,且样本中分数不小于 70 的男女生
人数相等.试估计总体中男生和女生人数的比例.
[解] (1)根据频率分布直方图可知,样本中分数不小于 70 的频率为(0.02+
0.04)×10=0.6, 2 分
所以样本中分数小于 70 的频率为 1-0.6=0.4, 3 分
所以从总体的 400 名学生中随机抽取一人,其分数小于 70 的概率估计为 0.4.
4 分
(2)根据题意,样本中分数不小于 50 的频率为(0.01+0.02+0.04+0.02)×10=
0.9, 6 分
分数在区间[40,50)内的人数为 100-100×0.9-5=5, 7 分
所以总体中分数在区间[40,50)内的人数估计为 400× 5
100
=20. 8 分
(3)由题意可知,样本中分数不小于 70 的学生人数为(0.02+0.04)×10×100=
60, 9 分
所以样本中分数不小于 70 的男生人数为 60×1
2
=30,
所以样本中的男生人数为 30×2=60, 10 分
女生人数为 100-60=40,
所以样本中男生和女生人数的比例为 60∶40=3∶2,
所以根据分层抽样原理,估计总体中男生和女生人数的比例为 3∶2. 12 分
样本的数字特征
(1)(2015·广东高考)已知样本数据 x1,x2,…,xn 的均值x=5,则样本数据
2x1+1,2x2+1,…,2xn+1 的均值为________.
(2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这
两个小组往年研发新产品的结果如下:(a,b),(a,b),(a,b),(a,b),(a,
b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),
(a,b).其中 a,a分别表示甲组研发成功和失败;b,b分别表示乙组研发成功
和失败.
①若某组成功研发一种新产品,则给该组记 1 分,否则记 0 分.试计算甲、乙
两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平;
②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的
概率.
(1)11 [ 由 条 件 知 x= x1+x2+…+xn
n
= 5 , 则 所 求 均 值 x0 =
2x1+1+2x2+1+…+2xn+1
n
=
2(x1+x2+…+xn)+n
n
=2x+1=2×5+1=11.]
(2)①甲组研发新产品的成绩为
1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,
其平均数为x甲=10
15
=2
3. 3 分
方差 s 2甲= 1
15[(1-2
3)2 × 10+(0-2
3)2 × 5]=2
9.
乙组研发新产品的成绩为
1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,
其平均数为x乙= 9
15
=3
5.
方差 s 2乙= 1
15[(1-3
5)2 × 9+(0-3
5)2 × 6]= 6
25.
因为x甲>x乙,s 2甲<s 2乙,
所以甲组的研发水平优于乙组. 6 分
②记 E={恰有一组研发成功}.
在所抽得的 15 个结果中,恰有一组研发成功的结果是(a,b),(a,b),(a,b),
(a,b),(a,b),(a,b),(a,b),共 7 个.
因此事件 E 发生的概率为 7
15.
用频率估计概率,即得所求概率为 P(E)= 7
15. 12 分
[规律方法] 1.平均数反映了数据的中心,是平均水平,而方差和标准差反
映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运
用公式.
2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品
种做出评价或选择.
[变式训练 3] (2018·洛阳模拟)为比较甲、乙两地某月 14 时的气温状况,随机选
取该月中的 5 天,将这 5 天中 14 时的气温数据(单位:℃)制成如图 9310 所
示的茎叶图.考虑以下结论: 【导学号:79170329】
图 9310
①甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温;
②甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温;
③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差;
④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差.
其中根据茎叶图能得到的统计结论的序号为 ( )
A.①③ B.①④
C.②③ D.②④
B [甲地 5 天的气温为:26,28,29,31,31,
其平均数为x甲=26+28+29+31+31
5
=29;
方差为 s 2甲=1
5[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;
标准差为 s 甲= 3.6.
乙地 5 天的气温为:28,29,30,31,32,
其平均数为x乙=28+29+30+31+32
5
=30;
方差为 s 2乙=1
5[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;
标准差为 s 乙= 2.∴x甲<x乙,s 甲>s 乙.]