- 1.09 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第2讲 用样本估计总体
一、知识梳理
1.统计图表
(1)频率分布直方图的画法步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
(2)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;
②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
(3)茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
2.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是
s= ,
s2=[(x1-)2+(x2-)2+…+(xn-)2].
常用结论
1.会用三个关系
频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.巧用四个有关的结论
(1)若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a;
(2)数据x1,x2,…,xn与数据x′1=x1+a,x′2=x2+a,…,x′n=xn+a 的方差相等,即数据经过平移后方差不变;
(3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2;
(4)s2= (xi-)2=x-2,即各数平方的平均数减去平均数的平方.
二、习题改编
1.(必修3P77例2改编)已知一组数据6,7,8,8,9,10,则该组数据的方差是 .
答案:
2.(必修3P65探究改编)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在第 组.
解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第4组.
答案:4
一、思考辨析
判断正误(正确的打“√”,错误的打“×”)
(1)一组数据的方差越大,说明这组数据的波动越大.( )
(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.( )
(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( )
(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.( )
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.( )
答案:(1)√ (2)√ (3)× (4)√ (5)√
二、易错纠偏
(1)频率分布直方图与茎叶图的识图不清;
(2)对方差、平均数的统计意义的认识有误.
1.甲、乙两人8次测评成绩的茎叶图如图,由茎叶图知甲的成绩的平均数与乙的成绩的中位数分别是 、 .
解析:由茎叶图可得甲的成绩的平均数为=21.将乙的成绩按从小到大的顺序排列,中间的两个成绩分别是22,23,所以乙的成绩的中位数为=22.5.
答案:21 22.5
2.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是 .
解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.
答案:50
3.(2019·高考全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .
解析:经停该站高铁列车所有车次的平均正点率的估计值为=0.98.
答案:0.98
样本的数字特征(典例迁移)
(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为( )
A.92,2.8 B.92,2
C.93,2 D.93,2.8
(2)(2020·盐城模拟)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为 .
【解析】 (1)由题意得所剩数据:90,90,93,94,93.
所以平均数==92.
方差s2=[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8.
(2)由s2=(xi-)2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为2.
【答案】 (1)A (2)2
【迁移探究】 (变条件)本例(2)增加条件“x1,x2,x3,x4,x5的平均数为2”,求数据2x1+3,2x2+3,2x3+3,2x4+3,2x5+3的平均数和方差.
解:数据2x1+3,2x2+3,2x3+3,2x4+3,2x5+3的平均数为2×2+3=7,方差为22×2=8.
众数、中位数、平均数、方差的意义及常用结论
(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(2)方差的简化计算公式:s2=[(x+x+…+x)-n2],或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方.
1.(2020·昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地.这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是( )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
解析:选B.平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度.故选B.
2.(2020·甘肃、青海、宁夏联考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下:
身高
(100,110]
(110,120]
(120,130]
(130,140]
(140,150]
频数
5
35
30
20
10
由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)( )
A.119.3 B.119.7
C.123.3 D.126.7
解析:选C.由题意知身高在(100,110],(110,120],(120,130]内的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x,则(x-120)×=0.1,解得x≈123.3.故选C.
3.一组数据1,10,5,2,x,2,且2<x<5,若该数据的众数是中位数的倍,则该数据的方差为 .
解析:根据题意知,该组数据的众数是2,则中位数是2÷=3,把这组数据从小到大排列为1,2,2,x,5,10,
则=3,解得x=4,所以这组数据的平均数为
=×(1+2+2+4+5+10)=4,
方差为s2=×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.
答案:9
茎叶图(师生共研)
(2020·成都市第二次诊断性检测)为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最近五场比赛的得分,制成如图所示的茎叶图.有下列结论:
①甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数;
②甲最近五场比赛得分的平均数低于乙最近五场比赛得分的平均数;
③从最近五场比赛的得分看,乙比甲更稳定;
④从最近五场比赛的得分看,甲比乙更稳定.
其中所有正确结论的编号为( )
A.①③ B.①④
C.②③ D.②④
【解析】 对于①,甲得分的中位数为29,乙得分的中位数为30,错误;
对于②,甲得分的平均数为×(25+28+29+31+32)=29,乙得分的平均数为×(28+29+30+31+32)=30,正确;
对于③,甲得分的方差为×[(25-29)2+(28-29)2+(29-29)2+(31-29)2+(32-29)2]=(16+1+0+4+9)=6.
乙得分的方差为×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=×(4+1+0+1+4)=2,所以乙比甲更稳定,③正确,④错误.
所以正确结论的编号为②③.
【答案】 C
茎叶图中的三个关注点
(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.
(2)重复出现的数据要重复记录,不能遗漏.
(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.
1.(2020·新疆第一次毕业诊断及模拟测试)某中学高三文科班从甲、乙两个班各选出7名学生参加文史知识竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的平均分是85,乙班学生成绩的中位数是83,则x+y的值为( )
A.8 B.7
C.9 D.168
解析:选A.因为甲班学生成绩的平均分是85,
所以79+78+80+80+x+85+92+96=85×7,即x=5.
因为乙班学生成绩的中位数是83,
所以若y≤1,则中位数为81,不成立.
若y>1,则中位数为80+y=83,解得y=3.
所以x+y=5+3=8,故选A.
2.某省为了抽选运动员参加“国际马拉松比赛”,将35名运动员的一次马拉松比赛成绩(单位:分钟)制成茎叶图,如图所示.
若将运动员按成绩由好到差编号,再用系统抽样的方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为( )
A.6 B.5
C.4 D.3
解析:选C.对35名运动员进行编号:00,01,02,…,34,分成七组:00~04,05~09,10~14,15~19,20~24,25~29,30~34,用系统抽样的方法抽7人,则第三组到第六组中占4人,即抽取的成绩在区间[139,151]上的运动员的人数为4,故选C.
频率分布直方图(多维探究)
角度一 求样本的频率、频数
(2020·福建五校第二次联考)某服装店对过去100天其实体店和网店的销售量(单位:件)进行了统计,制成频率分布直方图如下:
(1)若将上述频率视为概率,已知该服装店过去100天的销售中,实体店和网店销售量都不低于50的概率为0.24,求过去100天的销售中,实体店和网店至少有一边销售量不低于50的天数;
(2)若将上述频率视为概率,已知该服装店实体店每天的人工成本为500元,门市成本为1 200元,每售出一件利润为50元,求该实体店一天获利不低于800元的概率.
【解】 (1)由题意知,网店销售量不低于50共有(0.068+0.046+0.010+0.008)×5×100=66(天),实体店销售量不低于50共有(0.032+0.020+0.012×2)×5×100=38(天),实体店和网店销售量都不低于50的天数为100×0.24=24,
故实体店和网店至少有一边销售量不低于50的天数为66+38-24=80.
(2)由题意,设该实体店一天售出x件,则获利为(50x-1 700)元,50x-1 700≥800⇒x≥50.
记该实体店一天获利不低于800元为事件A,则
P(A)=P(x≥50)=(0.032+0.020+0.012+0.012)×5=0.38.
故该实体店一天获利不低于800元的概率为0.38.
角度二 求样本的数字特征
(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【解】 (1)由已知得0.70=a+0.20+0.15,故
a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
(1)频率、频数、样本容量的计算方法
①×组距=频率;
②=频率,=样本容量,
样本容量×频率=频数.
(2)频率分布直方图中数字特征的计算
①最高的小长方形底边中点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
1.在样本频率分布直方图中,共有9个小长方形,
若中间一个小长方形的面积等于其他8个长方形的面积和的,且样本容量为140,则中间一组的频数为( )
A.28 B.40
C.56 D.60
解析:选B.设中间一组的频数为x,因为中间一个小长方形的面积等于其他8个长方形的面积和的,所以其他8组的频数和为x,由x+x=140,解得x=40.
2.(2020·武昌区调研考试)对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.
(1)根据直方图完成以下表格;
成绩
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
(2)求参赛选手初赛成绩的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩?
解:(1)填表如下:
成绩
[50,60)
[60,70)
[70,80)
[80,90)
[90,100)
频数
50
150
350
350
100
(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78,
方差s2=(-23)2×0.05+(-13)2×0.15+(-3)2×0.35+72×0.35+172×0.1=101.
(3)进入复赛选手的成绩为80+×10=82(分),所以初赛成绩为82分及其以上的选手均可进入复赛.
(说明:回答82分以上,或82分及其以上均可)
核心素养系列21 数据分析——读取统计图中的数据
数据分析、数学运算是数学的核心素养,也是数学应用于实际生活问题的核心,提取—计算—应用数据是数学能力的重要体现.
(2019·高考全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
[-0.20,0)
[0,0.20)
[0.20,0.40)
[0.40,0.60)
[0.60,0.80)
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
【解】 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=i(yi-)2
=[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,
s==0.02×≈0.17.
所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
(1)数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程.主要包括:收集数据,整理数据,提取信息,构建模型对信息进行分析、推断,获得结论.
(2)本例由频率分布表可以读出各组频数,可计算出频率从而问题得以解决.
(2020·四省八校双教研联考)如图1为某省2018年1~4月份快递业务量统计图,图2为该省2018年1~4月份快递业务收入统计图,对统计图理解错误的是( )
A.2018年1~4月份快递业务量3月份最高,2月份最低,差值接近2 000万件
B.2018年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节蛰伏后网购迎来喷涨有关
C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致
D.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长
解析:选D.对于A,2018年1~4月份快递业务量3月份最高,有4 397万件,2月份最低,有2 411万件,其差值接近2 000万件,所以A正确;对于B,2018年1~4月份快递业务量的同比增长率分别为55%,53%,62%,58%,均超过50%,在3月份最高,和春节蛰伏后网购迎来喷涨有关,所以B正确;对于C,由两图易知增量与增长速度并不完全一致,其业务量从高到低变化是3月→4月→1月→2月,业务收入从高到低变化是3月→4月→1月→2月,保持高度一致,所以C正确;对于D,由图知业务收入2月相对1月减少,4月相对3月减少,整体不具备高速增长之说,所以D不正确.综上,选D.
[基础题组练]
1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3
;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( )
A.0.05 B.0.25
C.0.5 D.0.7
解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为=0.7.
2.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
解析:选A.记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.
3.(2020·陕西咸阳模拟检测(二))PM2.5是衡量空气质量的重要指标,我国采用世界卫生组织的最宽值限定值,即PM2.5日均值在35 μg/m3以下空气质量为一级,在35~75μg/m3空气质量为二级,超过75 μg/m3为超标.如图是某地12月1日至10日的PM2.5(单位:μg/m3)的日均值,则下列说法不正确的是( )
A.这10天中有3天空气质量为一级
B.从6日到9日PM2.5日均值逐渐降低
C.这10天中PM2.5日均值的中位数是55
D.这10天中PM2.5日均值最高的是12月6日
解析:选C.这10天中第一天,第三天和第四天,共3天空气质量为一级,所以A正确;
从题图可知从6日到9日PM2.5日均值逐渐降低,所以B正确;
从题图可知,这10天中PM2.5日均值最高的是12月6日,所以D正确;
由题图可知,这10天中PM2.5日均值的中位数是=43,
所以C不正确.故选C.
4.甲、乙两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数中相同的是( )
A.极差 B.方差
C.平均数 D.中位数
解析:选C.由题中茎叶图中数据的分布,可知方差不同,极差不同,
甲的中位数为=18.5,乙的中位数为=16,
甲==,
乙==,
所以甲、乙的平均数相同.故选C.
5.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:
甲
乙
丙
丁
平均环数
8.3
8.8
8.8
8.7
方差s2
3.5
3.6
2.2
5.4
从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是 .
解析:由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.
答案:丙
6.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为 ;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为 .
解析:设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.
答案:(1)0.04 (2)440
7.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:
成绩分组
频数
频率
平均分
[0,20)
3
0.015
16
[20,40)
a
b
32.1
[40,60)
25
0.125
55
[60,80)
c
0.5
74
[80,100]
62
0.31
88
(1)求a、b、c的值;
(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P(注:60分及60分以上为及格);
(3)试估计这次数学测验的年级平均分.
解:(1)由题意可得,b=1-(0.015+0.125+0.5+0.31)=0.05,a=200×0.05=10,c=200×0.5=100.
(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P==0.81.
(3)这次数学测验样本的平均分为
==73,
所以这次数学测验的年级平均分大约为73分.
8.为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制图如下:
每名快递员完成一件货物投递可获得的劳务费情况如下:
甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超出35件的部分每件7元.
(1)根据图中数据写出甲公司员工A在这10天投递的快递件数的平均数和众数;
(2)根据图中数据估算两公司的每位员工在该月所得的劳务费.
解:(1)甲公司员工A在这10天投递的快递件数的平均数为36,众数为33.
(2)根据题图中数据,可估算甲公司的每位员工该月所得劳务费为4.5×36×30=4 860(元),易知乙公司员工B每天所得劳务费X的可能取值为136,147,154,189,203,
所以乙公司的每位员工该月所得劳务费约为×(136×1+147×3+154×2+189×3+203×1)×30=165.5×30=4 965(元).
[综合题组练]
1.(2020·安徽五校联盟第二次质检)数据a1,a2,a3,…,an的方差为σ2,则数据2a1,2a2,2a3,…,2an的方差为( )
A. B.σ2
C.2σ2 D.4σ2
解析:选D.设a1,a2,a3,…,an的平均数为a,则2a1,2a2,2a3,…,2an的平均数为2a,σ2=.
则2a1,2a2,2a3,…,2an的方差为=4×=4σ2.故选D.
2.(2020·郑州市第二次质量预测)将甲、乙两个篮球队各5场比赛的得分数据整理成如图所示的茎叶图,由图可知以下结论正确的是( )
A.甲队平均得分高于乙队的平均得分
B.甲队得分的中位数大于乙队得分的中位数
C.甲队得分的方差大于乙队得分的方差
D.甲、乙两队得分的极差相等
解析:选C.由题中茎叶图得,甲队的平均得分甲==29,乙队的平均得分乙==30,甲<乙,选项A不正确;甲队得分的中位数为29,乙队得分的中位数为30,甲队得分的中位数小于乙队得分的中位数,选项B不正确;甲队得分的方差s=×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=,乙队得分的方差s=×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2,s>s,选项C正确;甲队得分的极差为31-26=5,乙队得分的极差为32-28=4,两者不相等,选项D不正确.故选C.
3.(2020·沈阳市质量监测(一))某篮球运动员的投篮命中率为50%,他想提高自己的投篮水平,制定了一个夏季训练计划,为了了解训练效果,执行训练前,他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为46.3.执行训练后也统计了10场比赛的得分,茎叶图如图所示:
(1)请计算该篮球运动员执行训练后统计的10场比赛得分的中位数、平均得分与方差;
(2)如果仅从执行训练前后统计的各10场比赛得分数据分析,你认为训练计划对该运动员的投篮水平的提高是否有帮助?为什么?
解:(1)训练后得分的中位数为=14.5;
平均得分为=15;
方差为[(8-15)2+(9-15)2+(12-15)2+(14-15)2+(14-15)2+(15-15)2+(16-15)2+(18-15)2+(21-15)2+(23-15)2]=20.6.
(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练后方差20.6小于训练前方差46.3,说明训练后得分稳定性提高了(阐述观点合理即可),这是投篮水平提高的表现.故此训练计划对该篮球运动员的投篮水平的提高有帮助.
4.(2020·广州市调研测试)某蔬果经销商销售某种蔬果,售价为每千克25元,成本为每千克15元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价以每千克10元处理完.根据以往的销售情况,按[0,100),[100,200),[200,300),[300,400),[400,500]进行分组,得到如图所示的频率分布直方图.
(1)根据频率分布直方图计算该种蔬果日需求量的平均数(同一组中的数据用该组区间中点值代表);
(2)该经销商某天购进了250千克该种蔬果,假设当天的需求量为x千克(0≤x≤500),利润为y元.求y关于x的函数关系式,并结合频率分布直方图估计利润y不小于1 750元的概率.
解:(1)=50×0.001 0×100+150×0.002 0×100+250×0.003 0×100+350×0.002 5×100+450×0.001 5×100=265.
故该种蔬果日需求量的平均数为265千克.
(2)当日需求量不低于250千克时,利润y=(25-15)×250=2 500(元),
当日需求量低于250千克时,利润y=(25-15)x-(250-x)×5=15x-1 250(元),
所以y=,
由y≥1 750,得200≤x≤500,
所以P(y≥1 750)=P(200≤x≤500)=0.003 0×100+0.002 5×100+0.001 5×100=0.7.
故估计利润y不小于1 750元的概率为0.7.