- 1.60 MB
- 2021-06-24 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第86题 茎叶图与频率分布直方图
I.题源探究·黄金母题
【例1】若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是 ( )
A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92
【答案】A
【例2】如图是某城市100位居民去年的月均用水量(单位:t)的频率分布直方图,月均用水量在区间的居民大约有 ( )
A.37位 B.40位 C.47位 D.52位
【答案】C
【解析】由频率分布直方图月均用水量在区间的频率为,月均用水量在区间
精彩解读
【试题 】例1:人教A版必修3P70改编;例2:人教A版必修3P65例题改编.
【母题评析】这类题主要考查平均数、方差的计算以及茎叶图与频率分布直方图的简单应用.
【思路方法】用样本估计总体是统计的基本方法:
(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
的居民的频率 为.月均用水量在区间的居民的频数大约为,故选C.
II.考场精彩·真题回放
【例1】【2017高考新课标1文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位: g)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
【答案】B
【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B.
【例2】【2017高考山东文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为
A. 3,5 B. 5,5 C. 3,7 D. 5,7
【答案】A
得.故选A.
【例3】【2017高考北京文17】某大 艺术专业400名
【命题意图】这类重点题考查分层抽样和系统抽样的计算.考查考生基本计算能力.
【考试方向】这类试题在考查题型上,主要以选择题或填空题为主,属于中低档题.
【难点中心】
1.将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.
2.分清几个样本特征数:
生参加某次测评,根据男女 生人数比例,使用分层抽样的方法从中随机抽取了100名 生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:
(Ⅰ)从总体的400名 生中随机抽取一人,估计其分数小于70的概率;
(Ⅱ)已知样本中分数小于40的 生有5人,试估计总体中分数在区间[40,50)内的人数;
(Ⅲ)已知样本中有一半男生的分数 不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
【答案】(Ⅰ)0.4;(Ⅱ)20;(Ⅲ).
(Ⅱ)根据题意,样本中分数不小于50的频率为
,分数在区间内的人数为.
所以总体中分数在区间内的人数估计为.
(Ⅲ)由题意可知,样本中分数不小于70的 生人数为
众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
3.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观.
4.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
,
所以样本中分数不小于70的男生人数为.
所以样本中的男生人数为,女生人数为,男生和女生人数的比例为.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为.
III.理论基础·解题原理
⑴一表二图:
①频率分布表——数据详实
②频率分布直方图——分布直观
③频率分布折线图——便于观察总体分布趋势
注:总体分布的密度曲线与横轴围成的面积为1.
⑵茎叶图:
①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等.
②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写.
3.总体特征数的估计:
⑴平均数:;取值为的频率分别为,则其平均数为;注意:频率分布表计算平均数要取组中值.
⑵方差与标准差:一组样本数据方差:;标准差:
注:方差与标准差越小,说明样本数据越稳定.平均数反映数据总体水平;方差与标准差反映数据的稳定水平.
IV.题型攻略·深度挖掘
【考试方向】
这类试题在考查题型上,通常以选择题或填空题的形式出现,难度中等.
【技能方法】
1.解题模板:第一步,根据频率分布直方图计算出相应的频率;第二步,运用样本的频率估计总体的频率;第三步,得出结论.
2.用样本估计总体是统计的基本思想.
用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.
3.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.
(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.
4.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律.
【易错指导】
1.在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.
2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
3.直方图与条形图不要搞混
频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
V.举一反三·触类旁通
考向1 茎叶图及其应用
【例1】【2018黑龙江齐齐哈尔高三第一次模】某校连续12天对同 们的着装进行检查,着装不合格的人数用茎叶图表示,如图,则该组数据的中位数是
A.24 B.26 C.27 D.32
【答案】C
【解析】中位数是,选C.
【例2】【2018江西上饶高三下 期二模】如图1是某 习小组 生在某次数 考试中成绩的茎叶图,1号到20号同 的成绩依次为,图2是统计茎叶图中成绩在一定范围内的 生人数的程序框图,那么该框图的输出结果是( )
A.8 B.9 C.11 D.12
【答案】A
【解析】由算法流程图可知,其统计的是数 成绩不小于的人数,所以由茎叶图知,数 成绩不小于的人数为,因此输出结果为,故选A.
【例3】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
【答案】(1)75,75;(2)0.1,0.16;(3)该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.
【解析】(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.
规律方法 (1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.
(2)①作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.
②根据茎叶图中数据数字特征进行分析判断考查识图能力,判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息. 2
【跟踪练习】
1.【2018河南安阳高三二模】在某校连续次考试成绩中,统计甲,乙两名同 的数 成绩得到如图所示的茎叶图.已知甲同 次成绩的平均数为,乙同 次成绩的中位数为,则的值为( )
A. B. C. D.
【答案】A
【解析】
因为乙同 次成绩的中位数为,所以选A.
2.【2018山西平遥中 高三3月高考适应性调研】某 校、两个班的数 兴趣小组在一次数 对抗赛中的成绩绘制茎叶图如下,通过茎叶图比较两班数 兴趣小组成绩的平均值及方差
①班数 兴趣小组的平均成绩高于班的平均成绩
②班数 兴趣小组的平均成绩高于班的平均成绩
③班数 兴趣小组成绩的标准差大于班成绩的标准差
④班数 兴趣小组成绩的标准差大于班成绩的标准差
其中正确结论的编号为( )
A.①③ B.①④ C.②③ D.②④
【答案】B
【解析】A班:53,63,64,76,74,78,78,76,81,85,86,88,82,92,95;B班:45,48,51,
3.【2018湖北武汉武昌区高三1月调研】将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为91,现场作的7个分数的茎叶图有一个数据模糊,无法辨认,在图中以表示,则5个剩余分数的方差为________.
【答案】
【解析】依题意,解得.则方差为.
【名师点睛】本题主要考查茎叶图的分辨,考查平均数的计算,考查方差的计算.从茎叶图可以看出最低分是,最高分是
,去掉这两个分数后,可利用平均数的公式列方程来求出的值.根据前面求出的值再利用方差的计算公式来计算方差.
考向2 频率分布直方图
【例4】某高校调查了200名 生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名 生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60 C.120 D.140
【答案】D
【例5】某校从高一年级 生中随机抽取100名 生,将他们期中考试的数 成绩(均为整数)分成六段:[40,50),[50,60),…,[90,100]后得到频率分布直方图(如下图所示),则分数在[70,80)内的人数是 .
【答案】30
【解析】由频率分布直方图知小长方形面积为对应区间概率,所有小长方形面积和为1,因此分数在[70,80)内的概率为,人数为
【例6】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),
将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
【答案】(1)0.30;(2)36 000;(3)2.04.
【解析】(1)由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.
(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.
又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.
【名师点睛】(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率和条形图混淆.
(2)“命题角度二”的例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.而利用频率分布直方图可以估计总体分布. ! ·
【跟踪练习】
1.【2018江西高三毕业班新课程教 质量监测】如图是60名 生参加数 竞赛的成绩(均为整数)的频率分布直方图,估计这次数 竞赛的及格率(60分及以上为及格)是( )
A.0.9 B.0.75 C.0.8 D.0.7
【答案】B
【解析】大于或等于60分的共四组,它们是:
故选:B.
【名师点睛】利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.【2018贵州黔东南州联考】近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图,其中年龄在岁的有2500人,年龄在岁的有1200人,则的值为( )
A.0.013 B.0.13 C.0.012 D.0.12
【答案】C
3.【2018河南六市高三第一次联考(一模)】为了解 生在课外活动方面的支出情况,抽取了个同 进行调查,结果显示这些 生的支出金额(单位:元)都在,其中支出金额在的 生有117人,频率分布直方图如图所示,则( )
A.180 B.160 C.150 D.200
【答案】A
【解析】对应的概率为,所以,选A.
4.一个社会调查机构就某地居民的月收入调查了人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、 历、职业等方面的关系,要从这人中再用分层抽样方法抽出人作进一步调查,则在
(元)月收入段应抽出 人.
【答案】40
【解析】由图(2500,3500元/月)收入段的频率是0.0005×500+0.0003×500=0.4,故用分层抽样方法抽出100人作进一步调查,则在(2500,3500元/月)收入段应抽出人数为0.4×100=40.
考向3 样本的数字特征
【例7】【2018内蒙古呼和浩特高三第一次质量调研】如图为某班名 生的投篮成绩(每人投一次)的条形统计图,其中上面部分数据破损导致数据不完全.已知该班 生投篮成绩的中位数是,则根据统计图,无法确定下列哪一选项中的数值( )
A.球以下(含球)的人数 B.球以下(含球)的人数
C.球以下(含球)的人数 D.球以下(含球)的人数
【答案】C
【解析】因为共有35人,而中位数应该是第18个数,所以第18个数是5,从图中看出第四个柱状图故选C.
【例8】【2018湖南衡阳高三第二次联考(二模)】已知样本的平均数为;样本的平均数为,若样本
的平均数;其中,则的大小关系为( )
A. B. C. D.
【答案】C
【解析】由题得
故选C.
【例9】【2018长沙一中高三模拟】某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(,),(a,)(a,b),(a,),(,b),(a,b).其中a,分别表示甲组研发成功和失败;b,b分别表示乙组研发成功和失败.
(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;
(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.
【解析】(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,0,1,1,1,0,1,
因为甲>乙,s