- 944.50 KB
- 2021-07-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第 2 讲 用样本估计总体
[考纲解读] 1.了解频率分布直方图的意义和作用,能根据频率分布表画频率分布
直方图、频率折线图、茎叶图,并体会它们各自的特点.(重点)
2.理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取
基本的数字特征,并作出合理的解释.
3.会用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数
字特征.(难点)
4.会用随机抽样的基本方法和样本估计总体的思想解决实际问题.
[考向预测] 从近三年高考情况来看,本讲是高考中的一个热点.预测 2020 年将
会考查用样本估计总体,主要体现在利用频率分布直方图或茎叶图估计总体,利
用样本数字特征估计总体.题型以客观题呈现,试题难度不大,属中、低档题型.频
率分布直方图与茎叶图也可能出现于解答题中,与概率等知识综合命题.
1.用样本的频率分布估计总体分布
(1)频率分布:样本中所有数据(或者数据组)的频数和样本容量的比,就是该
数据的□01频率,所有数据(或者数据组)的频率的分布变化规律叫做□02频率分布.
(2)作频率分布直方图的步骤:①求极差,即一组数据中的□03最大值与□04最
小值的差;②决定□05组距与组数;③将□06数据分组;④列□07频率分布表;⑤画频
率分布直方图.
在频率分布直方图中,纵轴表示□08频率/组距,数据落在各小组内的频率用□09
各小长方形的面积表示,各小长方形的面积总和等于 □101.
(3)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到
频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,
相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密
度曲线.
(4)茎叶图:统计中还有一种被用来表示数据的图叫茎叶图,茎是指中间一
列数,叶是从茎的旁边生长出来的数.
2.样本的数字特征
(1)众数、中位数、平均数
(2)方差和标准差
方差:s2=1
n[(x1- x-)2+(x2- x-)2+…+(xn- x-)2],
标准差:
s= 1
n[x1- x-2+x2- x-2+…+xn- x-2].
(3)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕
平均数波动的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、
方差越小,数据的离散程度越小,越稳定.
3.各种统计表的优点与不足
1.概念辨析
(1)一组数据的方差越大,说明这组数据的波动越大.( )
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原
有的具体数据信息就被抹掉了.( )
(3)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内
的频率越高.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序
写,相同的数据可以只记一次.( )
答案 (1)√ (2)√ (3)√ (4)×
2.小题热身
(1)(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了 n 块地作试验田.这
n 块地的亩产量(单位:kg)分别为 x1,x2,…,xn,下面给出的指标中可以用来评
估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn 的平均数 B.x1,x2,…,xn 的标准差
C.x1,x2,…,xn 的最大值 D.x1,x2,…,xn 的中位数
答案 B
解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估
亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选 B.
(2)若某校高一年级 8 个班参加合唱比赛的得分如茎叶图所示,则这组数据
的中位数和平均数分别是( )
A.91.5 和 91.5 B.91.5 和 92
C.91 和 91.5 D.92 和 92
答案 A
解析 由茎叶图可知,这组数据的中位数是1
2
×(91+92)=91.5,平均数是
1
8
×(87+89+90+91+92+93+94+96)=91.5.
(3)如图所示是一样本的频率分布直方图.若样本容量为 100,则样本数据在
[15,20]内的频数是( )
A.50
B.40
C.30
D.14
答案 C
解析 因为[15,20]对应的小矩形的面积为 1-0.04×5-0.1×5=0.3,所以样
本落在[15,20]的频数为 0.3×100=30.故选 C.
(4)已知一组数据 87,89,90,91,93,则该组数据的方差是________.
答案 4
解析 该组数据的平均值为1
5
×(87+89+90+91+93)=90,所以该组数据
的方差为1
5
×[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4.
题型 一 样本数字特征的计算及应用
1.某同学使用计算器求 30 个数据的平均数时,错将其中一个数据 105 输入
为 165,那么由此求出的平均数与实际平均数的差是( )
A.2.5 B.-2 C.2 D.-2.5
答案 C
解析 将 105 输入为 165,多输入了 60,60÷30=2,所以求出的平均数与实
际平均数的差是 2.
2.(2018·九江二模)已知一组数据 x1,x2,…,xn 的方差为 2,若数据 ax1+
b,ax2+b,…,axn+b(a>0)的方差为 8,则 a 的值为( )
A.1 B. 2
C.2 D.4
答案 C
解析 根据方差的性质可知,a2×2=8,解得 a=2.
3.一组数据 1,10,5,2,x,2,且 2 y-,因此可看出 A 药的疗效更好.
(2)由观测结果可绘制如下茎叶图:
从以上茎叶图可以看出,A 药疗效的试验结果有 7
10
的叶集中在茎 2,3 上,而
B 药疗效的试验结果有 7
10
的叶集中在茎 0,1 上,由此可看出 A 药的疗效更好.
题型 三 频率分布直方图
角度 1 求频率或频数
1.党的十八大以来,脱贫攻坚取得显著成绩.2013 年至 2016 年 4 年间,累
计脱贫 5564 万人,2017 年各地根据实际进行创新,精准、高效地完成了脱贫任
务.某地区对当地 3000 户家庭的 2017 年所得年收入情况调查统计,年收入的频
率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),
[80,100],则年收入不超过 6 万的家庭大约为( )
A.900 户 B.600 户 C.300 户 D.150 户
答案 A
解析 由频率分布直方图得:年收入不超过 6 万的家庭所占频率为:(0.005
+0.010)×20=0.3,∴年收入不超过 6 万的家庭大约为 0.3×3000=900.
角度 2 求数字特征
2.某城市 100 户居民的月平均用电量(单位:度),以[160,180),[180,200),
[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如
图.
(1)求直方图中 x 的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户
中,用分层抽样的方法抽取 11 户居民,则月平均用电量在[220,240)的用户中应
抽取多少户?
解 (1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,得 x
=0.0075,所以直方图中 x 的值是 0.0075.
(2)月平均用电量的众数是220+240
2
=230.
因为(0.002+0.0095+0.011)×20=0.45<0.5,所以月平均用电量的中位数在
[220,240)内,设中位数为 a,由(0.002+0.0095+0.011)×20+0.0125×(a-220)
=0.5,得 a=224,所以月平均用电量的中位数是 224.
(3)月平均用电量为[220,240)的用户有 0.0125×20×100=25(户),月平均用
电量为[240,260)的用户有 0.0075×20×100=15(户),月平均用电量为[260,280)
的 用 户 有 0.005×20×100 = 10( 户 ) , 月 平 均 用 电 量 为 [280,300] 的 用 户 有
0.0025×20×100=5(户),
抽取比例为 11
25+15+10+5
=1
5
,所以月平均用电量在[220,240)的用户中应抽
取 25×1
5
=5(户).
1.频率分布直方图的性质
(1)小长方形的面积=组距×频率
组距
=频率;
(2)各小长方形的面积之和等于 1;
(3)小长方形的高=频率
组距,所有小长方形的高的和为 1
组距.
2.频率分布直方图中的众数、中位数与平均数
(1)最高的小长方形底边中点的横坐标即是众数;
(2)平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标是
中位数;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长
方形的面积乘以小长方形底边中点的横坐标之和.
1.某高校调查了 320 名学生每周的自习时间(单位:小时),制成了如图所
示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为
[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这 320 名学
生中每周的自习时间不足 22.5 小时的人数是( )
A.68 B.72 C.76 D.80
答案 B
解析 由频率分布直方图得每周的自习时间不足 22.5 小时的频率为(0.02+
0.07)×2.5=0.225,∴这 320 名学生中每周的自习时间不足 22.5 小时的人数是
0.225×320=72.故选 B.
2.从某企业生产的某种产品中抽取 100 件,测量这些产品的一项质量指标
值,由测量结果得如下频数分布表:
(1)作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的
中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指
标值不低于 95 的产品至少要占全部产品 80%”的规定?
解 (1)频率分布直方图如图.
(2)质量指标值的样本平均数为
x =80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为 100,方差的估计值为 104.
(3)质量指标值不低于 95 的产品所占比例的估计值为 0.38+0.22+0.08=
0.68.
由于该估计值小于 0.8,故不能认为该企业生产的这种产品符合“质量指标
值不低于 95 的产品至少要占全部产品的 80%”的规定.