- 1.03 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差).
(2)决定组距与组数.
(3)将数据分组.
(4)列频率分布表.
(5)画频率分布直方图.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
4.标准差和方差
(1)标准差是样本数据到平均数的一种平均距离.
(2)标准差:
s= .
(3)方差:s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数).
【知识拓展】
1.频率分布直方图的特点
(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×.
(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
【思考辨析】
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ )
(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )
(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ )
(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )
1.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
答案 A
解析 这组数据由小到大排列为87,89,90,91,92,93,94,96,
∴中位数是=91.5,
平均数==91.5.
2.(2015·陕西)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.93 B.123 C.137 D.167
答案 C
解析 由题干扇形统计图可得该校女教师人数为110×70%+150×(1-60%)=137.故选C.
3.(2016·四川宜宾模拟)若数据x1,x2,x3,…,xn的平均数为=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为( )
A.5,2 B.16,2
C.16,18 D.16,9
答案 C
解析 ∵x1,x2,x3,…,xn的平均数为5,
∴=5,
∴+1=3×5+1=16,
∵x1,x2,x3,…,xn的方差为2,
∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
4.(2016·江苏)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
答案 0.1
解析 ==5.1,
则方差s2=[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.
5.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
答案 24
解析 底部周长在[80,90)的频率为0.015×10=0.15,
底部周长在[90,100)的频率为0.025×10=0.25,
样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24.
题型一 频率分布直方图的绘制与应用
例1 (2016·北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
解 (1)如图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.
∴用水量小于等于3立方米的频率为0.85,又w为整数,
∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.
(2)当w=3时,该市居民该月的人均水费估计为
(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).
即该市居民该月的人均水费估计为10.5元.
思维升华 (1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.
(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.
(2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频数分布表
满意度评
分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均数及分散程度(不要求计算出具体值,给出结论即可).
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户的满意度分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
解 (1)如图所示.
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均数高于A地区用户满意度评分的平均数;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”.
由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.
所以A地区用户的满意度等级为不满意的概率大.
题型二 茎叶图的应用
例2 (1)(2015·山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为( )
A.①③ B.①④ C.②③ D.②④
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.2,5 B.5,5 C.5,8 D.8,8
答案 (1)B (2)C
解析 (1)甲地5天的气温为26,28,29,31,31,
其平均数为甲==29;
方差为s=[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;
标准差为s甲=.
乙地5天的气温为28,29,30,31,32,
其平均数为乙==30;
方差为s=[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;
标准差为s乙=.
∴甲<乙,s甲>s乙.
(2)由茎叶图及已知得x=5,又乙组数据的平均数为16.8,即=16.8,解得y=8.
引申探究
1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好.
解 由原题可知x=5,
则甲组平均数为=17.4.
而乙组平均数为16.8,所以甲组成绩较好.
2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差.
解 ①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24.
故中位数为18,众数为18.
②s2=[(9-16.8)2+(15-16.8)2+(18-16.8)2×2+(24-16.8)2]=23.76.
思维升华 茎叶图的优缺点
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.
(1)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )
(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为( )
A. B. C.36 D.
答案 (1)A (2)B
解析 (1)由于频率分布直方图的组距为5,排除C、D,又[0,5),[5,10)两组各一人,排除B,应选A.
(2)由题意知=91,解得x=4.所以s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]
=(16+9+1+0+1+9+0)=.
题型三 用样本的数字特征估计总体的数字特征
例3 (1)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员
第1次
第2次
第3次
第4次
第5次
甲
87
91
90
89
93
乙
89
90
91
88
92
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
答案 2
解析 甲=(87+91+90+89+93)=90,
乙=(89+90+91+88+92)=90,
s=[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,
s=[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
①分别求出两人得分的平均数与方差;
②根据图和上面算得的结果,对两人的训练成绩作出评价.
解 ①由图象可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
甲==13;
乙==13,
s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;
s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
②由s>s,可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(2016·全国乙卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得以下柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
解 (1)当x≤19时,y=3 800;
当x>19时,y=3 800+500(x-19)=500x-5 700.
所以y与x的函数解析式为
y=(x∈N).
(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.
(3)若每台机器在购机的同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800元,20台的费用为4 300元,10台的费用为4 800元,因此这100台机器在购买易损零件上所需费用的平均数为
(3 800×70+4 300×20+4 800×10)=4 000(元),
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000元,10台的费用为4 500元,因此这100台机器在购买易损零件上所需费用的平均数为
(4 000×90+4 500×10)=4 050(元).
比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
9.高考中频率分布直方图的应用
考点分析 频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
典例 (12分)(2016·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),
将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
规范解答
解 (1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.[3分]
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,
解得a=0.30.[5分]
(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.[8分]
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.
而前4组的频率之和为
0.04+0.08+0.15+0.21=0.48<0.5.
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.[12分]
1.(2017·铁岭月考)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.平均数 B.标准差
C.众数 D.中位数
答案 B
解析 由B样本数据恰好是A样本数据每个都减5
后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变,故选B.
2.(2016·山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60 C.120 D.140
答案 D
解析 设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.
3.(2017·北京西城区质检)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )
A.0.2 B.0.4 C.0.5 D.0.6
答案 B
解析 10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为=0.4.故选B.
4.(2016·西安模拟)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为( )
A.,s2+1002 B.+100,s2+1002
C.,s2 D.+100,s2
答案 D
解析 =,yi=xi+100,所以y1,y2,…,y10的平均数为+100,方差不变,故选D.
5.(2016·山西大学附中诊断测试)已知样本(x1,x2,…,xn)的平均数为,样本(y1,y2,…,ym)
的平均数为(≠),若样本(x1,x2,…,xn,y1,y2,…,ym)的平均数=a+(1-a),其中0m
C.n=m D.不能确定
答案 A
解析 由题意可得=,
=,
=
=·+·
=·+·=a+(1-a),
所以=a,=1-a,
又0