- 1.45 MB
- 2021-06-30 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第三节用样本估计总体
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图的优点
茎叶图的优点是不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.
[注意] 茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数.
4.样本的数字特征
(1)众数、中位数、平均数
数字特征
概念
优点与缺点
众数
一组数据中重复出现次数最多的数
众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使它无法客观地反映总体特征
中位数
把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)
中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有n个数据x1,x2,…,xn,那么这n个数的平均数=
平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
(2)标准差、方差
①标准差:样本数据到平均数的一种平均距离,一般用s表示,s= .
②方差:标准差的平方s2
s2=[(x1-)2+(x2-)2+…+(xn-)2],其中xi(i=1,2,3,…,n)是样本数据,n是样本容量,是样本平均数.
1.判断下列结论是否正确(请在括号中打“√”或“×”)
(1)在频率分布直方图中,小矩形的高表示频率.( )
(2)频率分布直方图中各个长方形的面积之和为1.( )
(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( )
(4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(5)一组数据的方差越大,说明这组数据的波动越大.( )
答案:(1)× (2)√ (3)× (4)√ (5)√
2.如图是某班8位学生诗词比赛得分的茎叶图,那么这8位学生得分的众数和中位数分别为________.
解析:依题意,结合茎叶图,将题中的数由小到大依次排列得到:86,86,90,91,93,93,93,96,因此这8位学生得分的众数是93,中位数是=92.
答案:93 92
3.(教材习题改编)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.
解析:由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人).
答案:48
4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
解析:5个数的平均数==5.1,所以它们的方差s2=[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.
答案:0.1
1.茎叶图的绘制需注意
(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;
(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.
2.茎叶图的用途
茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.
[典题领悟]
某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26
位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.
(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=0.1,=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.
[解题师说]
熟记规律
给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.(如典题领悟中甲部门的数据集中,方差则小)
失误防范
在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义
[冲关演练]
某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下.
品种A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.
品种B:
363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.
(1)作出数据的茎叶图;
(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
解:(1)画出茎叶图如图所示:
(2)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A
的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.
频率分布直方图是每年高考的重点,既有单独命题,也有与数字特征、概率等知识的综合问题,题型既有选择题或填空题,也有解答题,难度适中,属于中档题.
[典题领悟]
(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
[学审题]
(1)分数小于70的频率即为其概率的估计值;
(2)由于分数小于40的学生人数已知,因此要求[40,50)内的人数,只要求出小于50的人数或频率即可;
(3)“样本中分数不小于70的男女生人数相等”,这是解题的关键,可先计算出分数不小于70的总人数,问题便迎刃而解.
解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4.
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×10=0.9,
故样本中分数小于50的频率为0.1,
故分数在区间[40,50)内的人数为100×0.1-5=5.
所以总体中分数在区间[40,50)内的人数估计为
400×=20.
(3)由题意可知,样本中分数不小于70的学生人数为
(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为60×=30.
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
男生和女生人数的比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
[解题师说]
熟记结论
(1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1;
(2)×组距=频率;
(3)=频率,此关系式的变形为=样本容量,样本容量×频率=频数
易错防范
频率分布直方图的纵坐标是,而不是频率
[冲关演练]
某网络营销部门随机抽查了某市200名网友在2017年11月11日的网购金额,所得数据如下表:
网购金额(单位:千元)
人数
频率
(0,1]
16
0.08
(1,2]
24
0.12
(2,3]
x
p
(3,4]
y
q
(4,5]
16
0.08
(5,6]
14
0.07
总计
200
1.00
已知网购金额不超过3千元与超过3千元的人数比恰为3∶2.
(1)试确定x,y,p,q的值,并补全频率分布直方图(如图);
(2)该营销部门为了了解该市网友的购物体验,从这200名网友中,用分层抽样的方法从网购金额在(1,2]和(4,5]的两个群体中确定5人进行问卷调查,若需从这5人中随机选取2人继续访谈,则此2人来自不同群体的概率是多少?
解:(1)根据题意有
解得∴p=0.4,q=0.25.
补全频率分布直方图如图所示.
(2)根据题意,抽取网购金额在(1,2]内的人数为
×5=3(人),记为:a,b,c.
抽取网购金额在(4,5]内的人数为×5=2(人),记为:A,B.
则从这5人中随机选取2人的选法为:(a,b),(a,c),(a,A),(a,B),(b,c),(b,A),(b,B),(c,A),(c,B),(A,B)共10种.
记2人来自不同群体的事件为M,则M中含有(a,A),(a,B),(b,A),(b,B),(c,A),(c,B)共6种.
∴P(M)==,
故此2人来自不同群体的概率为.
[题点全练]
角度(一) 样本的数字特征与频率分布直方图交汇
1.(2018·武昌调研)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x(吨),月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
解:(1)由频率分布直方图,可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5=1,
解得a=0.30.
(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.
由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800 000×0.12=96 000.
(3)∵前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,
∴2.5≤x<3.
由0.3×(x-2.5)=0.85-0.73,解得x=2.9.
因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
[题型技法]
频率分布直方图与众数、中位数、平均数的关系
(1)最高的小长方形底边中点的横坐标为众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
角度(二) 样本的数字特征与茎叶图交汇
2.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5 B.5,5
C.3,7 D.5,7
解析:选A 由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,
所以×[56+62+65+74+(70+x)]=×(59+61+67+65+78),解得x=3.
3.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为________.
解析:由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4.故s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.
答案:
[题型技法]
(1)在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.
(2)茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.
角度(三) 样本的数字特征与优化决策问题交汇
4.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:
甲
乙
丙
丁
平均环数
8.3
8.8
8.8
8.7
方差s2
3.5
3.6
2.2
5.4
从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( )
A.甲 B.乙
C.丙 D.丁
解析:选C 由表格中数据可知,乙、丙平均环数最高,但丙方差最小,说明成绩好,且技术稳定,选C.
[题型技法]
利用样本的数字特征解决优化决策问题的依据
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
[冲关演练]
1.(2018·长沙模拟)空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级:0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士从当地某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数为________.(该年为365天)
解析:该样本中AQI大于100的频数为4,频率为,以此估计此地全年AQI大于100的频率为,故此地该年AQI大于100的天数约为365×=146.
答案:146
2.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
解:(1)由频率分布直方图知(0.04+0.03+0.02+2a)×10=1,解得a=0.005.
(2)估计这次语文成绩的平均分=55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.
所以这100名学生语文成绩的平均分为73分.
(3)分别求出语文成绩在分数段[50,60),[60,70),[70,80),[80,90)的人数依次为0.05×100=5,0.4×100=40,0.3×100=30,0.2×100=20.
所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为5,20,40,25.
所以数学成绩在[50,90)之外的人数有100-(5+20+40+25)=10(人).
(一)普通高中适用作业
A级——基础小题练熟练快
1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为( )
A.1 B.2
C.3 D.4
解析:选B 由图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2.
2.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )
A.各月的平均最低气温都在0 ℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20 ℃的月份有5个
解析:选D 由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确,故D错误.
3.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( )
A.5 B.7
C.10 D.50
解析:选D 根据题中的频率分布直方图可知,三等品的频率为(0.012 5+0.025 0+0.012 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50.
4.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则( )
A.甲<乙,m甲>m乙 B.甲<乙,m甲乙,m甲>m乙 D.甲>乙,m甲s乙.故可判断结论①④正确.
2.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为( )
A.9 B.10
C.11 D.12
解析:选B 不妨设样本数据为x1,x2,x3,x4,x5,且x140,故成绩较稳定的是甲.
答案:甲
6.(2018·张掖重点中学联考)张掖市旅游局为了了解大佛寺景点在大众中的熟知度,随机对15~65岁的人群抽样了n人,问题是“大佛寺是几A级旅游景点?”统计结果如下图表.
组号
分组
回答正确的人数
回答正确的人数占本组的频率
第1组
[15,25)
a
0.5
第2组
[25,35)
18
x
第3组
[35,45)
b
0.9
第4组
[45,55)
9
0.36
第5组
[55,65]
3
y
(1)分别求出a,b,x,y的值;
(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人;
(3)在(2)抽取的6人中随机抽取2人,求所抽取的人中恰好没有第3组人的概率.
解:(1)由频率表中第4组数据可知,第4组总人数为=25,
再结合频率分布直方图可知n==100,
所以a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)因为第2,3,4组回答正确的共有54人,
所以利用分层抽样在54人中抽取6人,每组分别抽取的人数为:
第2组:×6=2;第3组:×6=3;第4组:×6=1.
(3)设第2组的2人为A1,A2;第3组的3人为B1,B2,B3;第4组的1人为C1.
则从6人中随机抽取2人的所有可能的结果为:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,C1),(A2,B1),(A2,B2),(A2,B3),(A2,C1),(B1,B2),(B1,B3),(B1,C1),
(B2,B3),(B2,C1),(B3,C1),共15种,其中恰好没有第3组人的结果为:(A1,A2),(A1,C1),(A2,C1),共3种,
所以所抽取的人中恰好没有第3组人的概率P==.
7.为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.
(1)求图中a的值;
(2)估计这种植物果实重量的平均数和方差s2(同一组中的数据用该组区间的中点值作代表);
(3)已知这种植物果实重量不低于32.5克的即为优质果实.若所取样本容量n=40,从该样本分布在[27.5,32.5)和[47.5,52.5]的果实中,随机抽取2个,求抽到的都是优质果实的概率.
解:(1)组距为d=5,由5×(0.020+0.040+0.075+a+0.015)=1,得a=0.050.
(2)各组中值和相应的频率依次为:
组中值
30
35
40
45
50
频率
0.1
0.2
0.375
0.25
0.075
所以=30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40,
s2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75.
(3)由已知,果实重量在[27.5,32.5)和[47.5,52.5]内的分别有4个和3个,分别记为A1,A2,A3,A4和B1,B2,B3,从中任取2个的取法有:
A1A2,A1A3,A1A4,A1B1,A1B2,A1B3,A2A3,
A2A4,A2B1,A2B2,A2B3,A3A4,A3B1,A3B2,
A3B3,A4B1,A4B2,A4B3,B1B2,B1B3,B2B3,
共21种取法,其中都是优质果实的取法有B1B2,B1B3,B2B3,共3种取法,
所以抽到的都是优质果实的概率P==.
C级——重难题目自主选做
1.某冷饮店只出售一种饮品,该饮品每一杯的成本价为3元,售价为8元,每天售出的第20杯及之后的饮品半价出售.该店统计了近10天的饮品销量,如图所示,设x为每天饮品的销量,y为该店每天的利润.
(1)求y关于x的表达式;
(2)从日利润不少于96元的几天里任选2天,求选出的这2天日利润都是97元的概率.
解:(1)由题意,得
y=
即y=
(2)由(1)可知,日销售量不少于20杯时,日利润不少于96元.
日销售量为20杯时,日利润为96元;
日销售量为21杯时,日利润为97元.
从条形统计图可以看出,日销售量为20杯的有3天,日销售量为21杯的有2天.
日销售量为20杯的3天,记为a,b,c,日销售量为21杯的2天,记为A,B,从这5天中任取2天,包括(a,b),(a,c),(a,A),(a,B),(b,c),(b,A),(b,B),(c,A),(c,B),(A,B),共10种情况.
其中选出的2天日销售量都为21杯的情况只有1种,故所求概率为.
2.在国际风帆比赛中,成绩以低分为优胜,比赛共11场,并以最佳的9场成绩计算最终的名次.在一次国际风帆比赛中,前7场比赛结束后,排名前8位的选手积分如下表:
运动员
比赛场次
1
2
3
4
5
6
7
8
9
10
11
总分
A
3
2
2
2
4
2
6
21
B
1
3
5
1
10
4
4
28
C
9
8
6
1
1
1
2
28
D
7
8
4
4
3
1
8
35
E
3
12
5
8
2
7
5
42
F
4
11
6
9
3
6
8
47
G
10
12
12
8
12
10
7
71
H
12
12
6
12
7
12
12
73
(1)根据表中的比赛数据,比较运动员A与B的成绩及稳定情况;
(2)从前7场平均分低于6.5分的运动员中,随机抽取2个运动员进行兴奋剂检查,求至少1个运动员平均分不低于5分的概率;
(3)请依据前7场比赛的数据,预测冠亚军选手,并说明理由.
解:(1)由表中的数据,我们可以分别计算运动员A和B前7场比赛积分的平均数和方差,作为两运动员比赛的成绩及衡量两运动员稳定情况的依据.
运动员A的平均分1=×21=3,
方差s=×[(3-3)2+(2-3)2×4+(4-3)2+(6-3)2]=2;
运动员B的平均分2=×28=4,
方差s=×[(1-4)2×2+(3-4)2+(5-4)2+(10-4)2+(4-4)2×2]=8.
从平均分和积分的方差来看,运动员A的平均分及积分的方差都比运动员B的小,也就是说,前7场比赛,运动员A的成绩优异,而且表现较为稳定.
(2)由表可知,平均分低于6.5分的运动员共有5个,其中平均分低于5分的运动员有3个,分别为A,B,C,平均分不低于5分且低于6.5分的运动员有2个,分别为D,E.
从这5个运动员中任取2个共有10种情况:
AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,
其中至少有1个运动员平均分不低于5分的有7种情况.
设至少有1个运动员平均分不低于5分为事件A,则P(A)=.
(3)尽管此时还有4场比赛没有进行,但这里我们可以假定每位选手在各自的11场比赛中发挥的水平大致相同,因而可以把前7场比赛的成绩看作总体的一个样本,并由此估计每位运动员最后比赛的成绩.从已经结束的7场比赛的积分来看,运动员A
的成绩最为优异,而且表现最为稳定,因此,预测运动员A将获得最后的冠军.而运动员B和C平均分相同,但运动员C得分总体呈下降趋势,所以预测运动员C将获得亚军.(说明:方案不唯一,其他言之有理的方案也给满分)
二)重点高中适用作业
A级——保分题目巧做快做
1.(2018·湖南五市十校联考)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n-m的值是( )
A.5 B.6
C.7 D.8
解析:选B 由甲组学生成绩的平均数是88,可得[70+80×3+90×3+(8+4+6+8+2+m+5)]=88,解得m=3.由乙组学生成绩的中位数是89,可得n=9,所以n-m=6.
2.(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60
C.120 D.140
解析:选D 由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.
3.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为( )
A.0.04 B.0.06
C.0.2 D.0.3
解析:选C 由频率分布直方图的知识得,年龄在[20,25)的频率为0.01×5=0.05,[25,30)
的频率为0.07×5=0.35,设年龄在[30,35),[35,40),[40,45]的频率为x,y,z,又x,y,z成等差数列,所以可得解得y=0.2,所以年龄在[35,40)的网民出现的频率为0.2.
4.(2018·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:
分组为[11,20),[20,30),[30,39]时,所作的频率分布直方图是( )
解析:选B 由直方图的纵坐标是频率/组距,排除C和D;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A,故选B.
5.(2018·邢台模拟)样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其方差为( )
A. B.
C. D.2
解析:选D 依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=(12+02+12+22+22)=2,即所求的样本方差为2.
6.(2018·广州模拟)为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.
解析:设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2
个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n==60.
答案:60
7.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.
(1)频率分布直方图中x的值为________;
(2)在这些用户中,用电量落在区间[100,250)内的户数为________.
解析:(1)由频率分布直方图中各小矩形的总面积为1,得(0.001 2+0.002 4×2+0.003 6+x+0.006 0)×50=1,解得x=0.004 4.
(2)用电量在[100,250)内的频率为(0.003 6+0.004 4+0.006 0)×50=0.7,故用电量落在区间[100,250)内的户数为100×0.7=70.
答案:(1)0.004 4 (2)70
8.已知一组正数x1,x2,x3,x4的方差s2=(x+x+x+x-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为________.
解析:设正数x1,x2,x3,x4的平均数为,则s2=[(x1-)2+(x2-)2+(x3-)2+(x4-)2],得s2=(x+x+x+x)-2,又已知s2=(x+x+x+x-16)=(x+x+x+x)-4,所以2=4,所以=2,故[(x1+2)+(x2+2)+(x3+2)+(x4+2)]=+2=4.
答案:4
9.(2018·张掖重点中学联考)张掖市旅游局为了了解大佛寺景点在大众中的熟知度,随机对15~65岁的人群抽样了n人,问题是“大佛寺是几A级旅游景点?”统计结果如下图表.
组号
分组
回答正确的人数
回答正确的人数占本组的频率
第1组
[15,25)
a
0.5
第2组
[25,35)
18
x
第3组
[35,45)
b
0.9
第4组
[45,55)
9
0.36
第5组
[55,65]
3
y
(1)分别求出a,b,x,y的值;
(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人;
(3)在(2)抽取的6人中随机抽取2人,求所抽取的人中恰好没有第3组人的概率.
解:(1)由频率表中第4组数据可知,第4组总人数为=25,
再结合频率分布直方图可知n==100,
所以a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)因为第2,3,4组回答正确的共有54人,
所以利用分层抽样在54人中抽取6人,每组分别抽取的人数为:
第2组:×6=2;第3组:×6=3;第4组:×6=1.
(3)设第2组的2人为A1,A2;第3组的3人为B1,B2,B3;第4组的1人为C1.
则从6人中随机抽取2人的所有可能的结果为:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,C1),(A2,B1),(A2,B2),(A2,B3),(A2,C1),(B1,B2),(B1,B3),(B1,C1),(B2,B3),(B2,C1),(B3,C1),共15种,其中恰好没有第3组人的结果为:(A1,A2),(A1,C1),(A2,C1),共3种,
所以所抽取的人中恰好没有第3组人的概率P==.
10.为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.
(1)求图中a的值;
(2)估计这种植物果实重量的平均数和方差s2(同一组中的数据用该组区间的中点值作代表);
(3)已知这种植物果实重量不低于32.5克的即为优质果实.若所取样本容量n=40,从该样本分布在[27.5,32.5)和[47.5,52.5]的果实中,随机抽取2个,求抽到的都是优质果实的概率.
解:(1)组距为d=5,由5×(0.020+0.040+0.075+a+0.015)=1,得a=0.050.
(2)各组中值和相应的频率依次为:
组中值
30
35
40
45
50
频率
0.1
0.2
0.375
0.25
0.075
所以=30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40,
s2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75.
(3)由已知,果实重量在[27.5,32.5)和[47.5,52.5]内的分别有4个和3个,分别记为A1,A2,A3,A4和B1,B2,B3,从中任取2个的取法有:
A1A2,A1A3,A1A4,A1B1,A1B2,A1B3,A2A3,
A2A4,A2B1,A2B2,A2B3,A3A4,A3B1,A3B2,
A3B3,A4B1,A4B2,A4B3,B1B2,B1B3,B2B3,
共21种取法,其中都是优质果实的取法有B1B2,B1B3,B2B3,共3种取法,
所以抽到的都是优质果实的概率P==.
B级——拔高题目稳做准做
1.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,5组数据中最大频率为0.32,则a的值为( )
A.64 B.54
C.48 D.27
解析:选B 前两组中的频数为100×(0.05+0.11)=16.
因为后五组频数和为62,所以前三组为38.所以第三组频数为22.又最大频率为0.32的最大频数为0.32×100=32.所以a=22+32=54.
2.如图是某位篮球运动员8场比赛得分的茎叶图,其中一个数据染上污渍用x代替,那么这位运动员这8场比赛的得分平均数不小于得分中位数的概率为( )
A. B.
C. D.
解析:选B 由茎叶图可知0≤x≤9且x∈N,中位数是=,这位运动员这8场比赛的得分平均数为(7+8+7+9+x+3+1+10×4+20×2)=(x+115),由(x+115)≥,得3x≤7,即x=0,1,2,所以这位运动员这8场比赛的得分平均数不小于得分中位数的概率为.
3.在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1■■,那么这组数据的方差s2可能的最大值是________.
解析:由题意可设两个被污损的数据分别为10+a,b(a,b∈Z,0≤a≤9),则10+a+b+9+10+11=50,即a+b=10,b=10-a,所以s2=[(9-10)2+(10-10)2+(11-10)2+(10+a-10)2+(b-10)2]=[2+a2+(b-10)2]=(1+a2)≤×(1+92)=32.8.
4.甲、乙两人要竞争一次大型体育竞技比赛射击项目的参赛资格,如图是在测试中甲、乙各射靶10次的条形图,则参加比赛的最佳人选为________.
解析:甲的平均数1=4×0.2+5×0.1+7×0.3+8×0.1+9×0.2+10×0.1=7.0,
乙的平均数2=5×0.1+6×0.2+7×0.4+8×0.2+9×0.1=7.0,
所以1=2.
甲的方差s=[(7-4)2×2+(7-5)2×1+(7-7)2×3+(7-8)2×1+(7-9)2×2+(7-10)2×1]=4,
乙的方差s=[(7-5)2×1+(7-6)2×2+(7-7)2×4+(7-8)2×2+(7-9)2×1]=1.2,
所以s>s,即参加比赛的最佳人选为乙.
答案:乙
5.某冷饮店只出售一种饮品,该饮品每一杯的成本价为3元,售价为8元,每天售出的第20杯及之后的饮品半价出售.该店统计了近10天的饮品销量,如图所示,设x为每天饮品的销量,y为该店每天的利润.
(1)求y关于x的表达式;
(2)从日利润不少于96元的几天里任选2天,求选出的这2天日利润都是97元的概率.
解:(1)由题意,得
y=
即y=
(2)由(1)可知,日销售量不少于20杯时,日利润不少于96元.
日销售量为20杯时,日利润为96元;
日销售量为21杯时,日利润为97元.
从条形统计图可以看出,日销售量为20杯的有3天,日销售量为21杯的有2天.
日销售量为20杯的3天,记为a,b,c,日销售量为21杯的2天,记为A,B,从这5天中任取2天,包括(a,b),(a,c),(a,A),(a,B),(b,c),(b,A),(b,B),(c,A),(c,B),(A,B),共10种情况.其中选出的2天日销售量都为21杯的情况只有1
种,故所求概率为.
6.在国际风帆比赛中,成绩以低分为优胜,比赛共11场,并以最佳的9场成绩计算最终的名次.在一次国际风帆比赛中,前7场比赛结束后,排名前8位的选手积分如下表:
运动员
比赛场次
1
2
3
4
5
6
7
8
9
10
11
总分
A
3
2
2
2
4
2
6
21
B
1
3
5
1
10
4
4
28
C
9
8
6
1
1
1
2
28
D
7
8
4
4
3
1
8
35
E
3
12
5
8
2
7
5
42
F
4
11
6
9
3
6
8
47
G
10
12
12
8
12
10
7
71
H
12
12
6
12
7
12
12
73
(1)根据表中的比赛数据,比较运动员A与B的成绩及稳定情况;
(2)从前7场平均分低于6.5分的运动员中,随机抽取2个运动员进行兴奋剂检查,求至少1个运动员平均分不低于5分的概率;
(3)请依据前7场比赛的数据,预测冠亚军选手,并说明理由.
解:(1)由表中的数据,我们可以分别计算运动员A和B前7场比赛积分的平均数和方差,作为两运动员比赛的成绩及衡量两运动员稳定情况的依据.
运动员A的平均分1=×21=3,
方差s=×[(3-3)2+(2-3)2×4+(4-3)2+(6-3)2]=2;
运动员B的平均分2=×28=4,
方差s=×[(1-4)2×2+(3-4)2+(5-4)2+(10-4)2+(4-4)2×2]=8.
从平均分和积分的方差来看,运动员A的平均分及积分的方差都比运动员B的小,也就是说,前7场比赛,运动员A的成绩优异,而且表现较为稳定.
(2)由表可知,平均分低于6.5分的运动员共有5个,其中平均分低于5分的运动员有3个,分别为A,B,C,平均分不低于5分且低于6.5分的运动员有2个,分别为D,E.
从这5个运动员中任取2个共有10种情况:
AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,
其中至少有1个运动员平均分不低于5分的有7种情况.
设至少有1个运动员平均分不低于5分为事件A,则P(A)=.
(3)尽管此时还有4场比赛没有进行,但这里我们可以假定每位选手在各自的11场比赛中发挥的水平大致相同,因而可以把前7场比赛的成绩看作总体的一个样本,并由此估计每位运动员最后比赛的成绩.从已经结束的7场比赛的积分来看,运动员A的成绩最为优异,而且表现最为稳定,因此,预测运动员A将获得最后的冠军.而运动员B和C平均分相同,但运动员C得分总体呈下降趋势,所以预测运动员C将获得亚军.(说明:方案不唯一,其他言之有理的方案也给满分)