- 1.19 MB
- 2021-05-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
专题64 统计初步
【热点聚焦与扩展】
纵观近几年的高考试题,统计是高考热点之一,往往以实际问题为背景,考查统计相关概念的计算,考查识图用图能力、数据处理能力以及分析问题解决问题的能力.小题、大题均有独立考查,大题也易于和概率一同考查.难度控制在中等以下.
本专题在分析研究近几年高考题及各地模拟题的基础上,举例说明.
(一)随机抽样:
1、抽签法:把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到容量为的样本
2、系统抽样:也称为等间隔抽样,大致分为以下几个步骤:
(1)先将总体的个个体编号
(2)确定分段间隔,设样本容量为,若为整数,则
(3)在第一段中用简单随机抽样确定第一个个体编号,则后面每段所确定的个体编号与前一段确定的个体编号差距为,例如:第2段所确定的个体编号为,第段所确定的个体编号为,直至完成样本
注:(1)若不是整数,则先用简单随机抽样剔除若干个个体,使得剩下的个体数能被整除,再进行系统抽样.例如501名学生所抽取的样本容量为10,则先随机抽去1个,剩下的个个体参加系统抽样
(2)利用系统抽样所抽出的个体编号排成等差数列,其公差为
3、分层抽样:也称为按比例抽样,是指在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本.
分层抽样后样本中各层的比例与总体中各个层次的比例相等,这条结论会经常用到
(二)频率分布直方图:
1、频数与频率
(1)频数:指一组数据中个别数据重复出现的次数或一组数据在某个确定的范围内出现的数据的个数.
(2)频率:是频数与数据组中所含数据的个数的比,即频率=频数/总数
(3)各试验结果的频率之和等于1
2、频率分布直方图:若要统计每个小组数据在样本容量所占比例大小,则可通过频率分布表(表格形式)和频率分布直方图(图像形式)直观的列出
18
(1)极差:一组数据中最大值与最小值的差
(2)组距:将一组数据平均分成若干组(通常5-12组),则组内数据的极差称为组距,所以有组距=极差/组数
(3)统计每组的频数,计算出每组的频率,便可根据频率作出频率分布直方图
(4)在频率分布直方图中:横轴按组距分段,纵轴为“频率/组距”
(5)频率分布直方图的特点:
① 频率=,即分布图中每个小矩形的面积
② 因为各试验结果的频率之和等于1,所以可得在频率分布直方图中,各个矩形的面积和为1
(三)茎叶图:通常可用于统计和比较两组数据,其中茎是指中间的一列数,通常体现数据中除了末位数前面的其他数位,叶通常代表每个数据的末位数.并按末位数之前的数位进行分类排列,相同的数据需在茎叶图中体现多次
(四)统计数据中的数字特征:
1、众数:一组数据中出现次数最多的数值,叫做众数
2、中位数:将一组数据从小到大排列,位于中间位置的数称为中位数,其中若数据的总数为奇数个,则为中间的数;若数据的总数为偶数个,则为中间两个数的平均值.
3、平均数:代表一组数据的平均水平,记为,设一组数据为:,则有:
4、方差:代表数据分布的分散程度,记为,设一组数据为:,其平均数为,则有:,其中越小,说明数据越集中
5、标准差:也代表数据分布的分散程度,为方差的算术平方根
【经典例题】
例1.【2019年理新课标I卷】某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
18
则下面结论中不正确的是
A. 新农村建设后,种植收入减少
B. 新农村建设后,其他收入增加了一倍以上
C. 新农村建设后,养殖收入增加了一倍
D. 新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
【答案】A
详解:设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;故选A.
例2.【2019年江苏卷】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.
【答案】90
【解析】分析:先由茎叶图得数据,再根据平均数公式求平均数.
详解:由茎叶图可知,5位裁判打出的分数分别为,故平均数为.
点睛:的平均数为.
例3.【2019年全国卷Ⅲ文】
18
某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.
【答案】分层抽样
例4.【2017课标1,文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
【答案】B
【解析】
试题分析:刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B
例5.【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为
A. 3,5 B. 5,5 C. 3,7 D. 5,7
【答案】A
【解析】
例6.【2017课标3,文3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
18
根据该折线图,下列结论错误的是( )
A.月接待游客逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
【答案】A
例7.【2017江苏,3】 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.
【答案】18
例8. 某校从参加高三年级期末考试的学生中随机抽取100名学生,将其数学成绩分成五段:,,它的频率分布直方图如图所示,则该批学生中成绩不低于90分的人数是_____.
18
【答案】65
例9.【2017北京,文17】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:
(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
【答案】(Ⅰ)0.4;(Ⅱ)5人;(Ⅲ).
【解析】
试题分析:(Ⅰ)根据频率分布直方图,表示分数大于等于70的概率,就求后两个矩形的面积;(Ⅱ)根据公式频数等于频率求解;(Ⅲ)首先计算分数大于等于70分的总人数,根据
18
样本中分数不小于70的男女生人数相等再计算所有的男生人数,100-男生人数就是女生人数.
试题解析:(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为,所以样本中分数小于70的频率为.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
(Ⅱ)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为.
所以总体中分数在区间内的人数估计为.
例10. 【2019年新课标I卷文】某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用
水量
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用
水量
频数
1
5
13
10
16
5
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:
18
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
【答案】(1)直方图见解析.(2) 0.48.(3).
结果.
详解:(1)
18
该家庭使用了节水龙头后50天日用水量的平均数为
.
估计使用节水龙头后,一年可节省水.
点睛:该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心运算,仔细求解,就可以得出正确结果.
【精选精练】
1.【2019届河南省南阳市第一中学第二十次考】对于一组数据,如果将它们改变为,则下列结论正确的是( )
A. 平均数不变,方差变 B. 平均数与方差均发生变化
C. 平均数与方差均不变 D. 平均数变,方差保持不变
【答案】D
18
【解析】分析:先根据平均数的公式变化前后的平均数,再根据方差公式进行计算变化前后的方差,从而可得结果.
点睛:本题考查了平均数和方差的公式,平均数是所有数据的和除以数据的个数,,方差是一组数据中各数据与它们的平均数的差的平方的平均数.
2.【2019届湖北省黄冈中学5月三模】下图是某企业产值在2008年~2017年的年增量(即当年产值比前一年产值增加的量)统计图(单位:万元),下列说法正确的是( )
A. 2009年产值比2008年产值少
B. 从2011年到2015年,产值年增量逐年减少
C. 产值年增量的增量最大的是2017年
D. 2016年的产值年增长率可能比2012年的产值年增长率低
【答案】D
【解析】分析:读懂题意,理解“年增量”量的含义,逐一分析选项中的说法,即可的结果.
详解:对,2009年产值比2008年产值多万元,故错误;
对,从2011年到2015年,产值年增量逐年增加,故错误;
对,产值年增量的增量最大的不是2017年,故错误;
18
对,因为增长率等于增长量除以上一年产值,由于上一年产值不确定,所以2016年的产值年增长率可能比2012年的产值年增长率低,对,故选D.
3.某校高二(16)班共有50人,如图是该班在四校联考中数学成绩的频率分布直方图,则成绩在内的学生人数为( )
A. 36 B. 25 C. 22 D. 11
【答案】B
点睛:本题主要考查了用样本估计总体,独立性检验的应用,其中对于用样本估计总体主要注意以下两个方面:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观;2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
4.【2019届山东省肥城市适应性训练】某学校高一学生有720人,现从高一、高二、高三这三个年级学生中采用分层抽样方法,抽取180人进行英语水平测试,已知抽取高一学生人数是抽取高二学生人数和高三学生人数的等差中项,且高二年级抽取65人,则该校高三年级学生人数是__________.
【答案】660
【解析】分析:求出高三年级抽取的人数,再根据比例关系求出高三学生人数.
详解:根据题意,设高三年级抽取x人,则高一抽取(180-x-65)人,
2(180-x-65)=x+65,
18
x=55;高一学生有720人,则高三学生有720×
故答案为:660.
5.【2019届江苏省苏州市测试(三)】从某小区抽取 100 户居民进行月用电量调查,发现其用电量都在 50 度到 350 度之间,频率分布直方图如图所示.则在这些用户中,用电量落在区间内的户数为__________.
【答案】22
点睛:明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.
6.某中学采用系统抽样方法,从该校高二年级全体800名学生中抽50名学生做视力检查.现将800名学生从1到800进行编号.已知从这16个数中取的数是35,则在第1小组中随机抽到的数是________.
【答案】
【解析】分析:根据系统抽样的定义进行求解即可.
详解:由题意,样本间隔为,
因为在这16个数字中取到的数字为,
设从第一小组中随机抽取的数字为,则,解得.
7.已知总体的各个体的值从小到大为:
18
,且总体的中位数为4.若要使该总体的方差最小,则___________.
【答案】
所以数据的平均数为,
所以数据的方差为
,
当时,最小,此时,
所以.
点睛:本题主要考查了统计知识的综合应用,其中解答中熟记统计数据中的中位数、平均数、方差的计算公式是解答的关键,着重考查了推理与运算能力.
8.【2019届江苏省南京师大附中高考考前模拟】某公司生产甲、乙、丙三种不同型号的轿车,产量分别为1400辆、5600辆、2000辆.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取45辆进行检验,则应从丙种型号的产品中抽取______件.
【答案】10
【解析】分析:根据题意求出抽样比例,再计算应从丙种型号的产品中抽取的样本数据.
详解:抽样比例是,故应从丙种型号的产品中抽取
故答案为:10.
9.【广东省东莞市2019年全国卷考前冲刺】已知样本方差,则样本的方差为_______.
【答案】8
18
10.【2019届四川省梓潼中学校高考模拟(二)】“日行一万步,健康你一生”的养生观念已经深入人心,由于研究性学习的需要,某大学生收集了手机“微信运动”团队中特定甲、乙两个班级名成员一天行走的步数,然后采用分层抽样的方法按照,,,分层抽取了名成员的步数,并绘制了如下尚不完整的茎叶图(单位:千步);已知甲、乙两班行走步数的平均值都是千步.
(1)求,的值;
(2)若估计该团队中一天行走步数少于千步的人数比处于千步的人数少人,求的值.
【答案】(1); .
(2).
【解析】分析:(1)由甲班的平均值为和乙班的平均值为,利用数据平均数的计算公式,即可求解相应的的值.
(2)由该团队中一天行走步数少于千步的人数比处于千步的人数少人,里程方程即可求解.
详解:(1)因为甲班的平均值为,同理,因为乙班的平均值为,
18
所以,解得.
点睛:本题主要考查了统计知识的综合应用,其中解答中涉及到茎叶图数据的读取,平均数的计算公式等知识点的运用,着重考查了分析问题和解答问题的能力.
11.【2019届宁夏回族自治区银川一中考前训练】某班级体育课举行了一次“投篮比赛”活动,为了了解本次投篮比赛学生总体情况,从中抽取了甲乙两个小组样本分数的茎叶图如图所示.
5
6
5
8
6
0
1
3
6
2
4
6
9
7
1
2
7
1
3
8
0
1
8
1
甲
乙
(1)分别求甲乙两个小组成绩的平均数与方差;
(2)分析比较甲乙两个小组的成绩;
(3)从甲组高于70分的同学中,任意抽取2名同学,求恰好有一名同学的得分在[80,90)的概率.
【答案】(1),; , .
(2)甲乙两个小组成绩相当; 乙组成绩比甲组成绩更稳定.
18
(3).
.
.
记甲乙成绩的的方差分别为,,则
.
.
(2)因为,所以甲乙两个小组成绩相当;因为,所以乙组成绩比甲组成绩更稳定.
(3)由茎叶图知,甲组高于70分的同学共4名,有2名在[70,80),记为,,有2名在[80,90)记为,.
任取两名同学的基本事件有6个:
(,),(,),(,),(,),(,),(,).
恰好有一名同学的得分在[80,90)的基本事件数共4个:
(,),(,),(,),(,).
所以恰好有一名同学的得分在[80,90)的概率为.
12.某校600名文科学生参加了4月25日的三调考试,学校为了了解高三文科学生的数学、外语情况,利用随机数表法从抽取100名学生的成绩进行统计分析,将学生编号为000,001,002,…599
12 56 85 99 26 96 96 68 27 31 05 03 72 93 15 57 12 10 14 21 88 26 49 81 76
55 59 56 35 64 38 54 82 46 22 31 62 43 09 90 06 18 44 32 53 23 83 01 30 30
18
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
(1)若从第6行第7列的数开始右读,请你一次写出最先抽出的5个人的编号(上面是摘自随机数表的第4行到第7行);
(2)抽出的100名学生的数学、外语成绩如下表:
外语
优
良
及格
数学
优
8
m
9
良
9
n
11
及格
8
9
11
若数学成绩优秀率为35%,求m,n的值;
(3)在外语成绩为良的学生中,已知m≥12,n≥10,求数学成绩优比良的人数少的概率.
【答案】(1) 最先抽出的5人的编号依次为:544,354,378,520,384.
(2) .
(3) .
【解析】分析:(1)根据简单的随机抽样的定义,即可得到结论;
(2)根据数学成绩优秀率是,构造关于的方程,解方程可得值,进而根据抽取样本容量为,可
(3)由题意m+n=35,且m≥12,n≥10,∴满足条件的(m,n)有:(12,23),(13,22),(14,21),(15,20),(16,19),(17,18),(18,17),(19,16),(20,15),(21,14),(22,13),(23,12),(24,
18
11),(25,10),共14种,且每种出现都是等可能的,
记“数学成绩优比良的人数少”为事件M,则事件M包含的基本事件有:
(12,23),(13,22),(14,21),(15,20),(16,19),(17,18),共6种,
.
18
相关文档
- 高考地理考点气压带风带整合复习2021-05-1322页
- 2020版高考政治一轮复习(A版)专题十2021-05-135页
- 2020版高考英语一轮复习 写作话题 2021-05-133页
- 2020版高考英语 Unit 18 Beauty夯2021-05-137页
- 高考英语阅读理解细节理解题的解题2021-05-137页
- 2014北京西城区高考文综地理二模试2021-05-136页
- 2018江苏生物高考试题及答案解析2021-05-1317页
- 高考化学时规范练物质的分散系解析2021-05-139页
- 高考生物试卷全国II卷2021-05-133页
- 2010高考生物二轮复习专题精练――2021-05-1313页