- 212.50 KB
- 2021-05-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计
一、选择题(本大题共12小题,仔细审题,认真答题)
1. 某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2019年1月至2019年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是( )
A. 月接待游客量逐月增加
B. 年接待游客量逐年增加
C. 各年的月接待游客量高峰期大致在7,8月
D. 各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
【答案】A
【解析】解:由已有中2019年1月至2019年12月期间月接待游客量(单位:万人)的数据可得:
月接待游客量逐月有增有减,故A错误;
年接待游客量逐年增加,故B正确;
各年的月接待游客量高峰期大致在7,8月,故C正确;
各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,故D正确;
故选:A
根据已知中2019年1月至2019年12月期间月接待游客量(单位:万人)的数据,逐一分析给定四个结论的正误,可得答案.
本题考查的知识点是数据的分析,命题的真假判断与应用,难度不大,属于基础题.
2. 为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别是x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A. x1,x2,…,xn的平均数 B. x1,x2,…,xn的标准差
C. x1,x2,…,xn的最大值 D. x1,x2,…,xn的中位数
【答案】B
【解析】解:在A中,平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标,
故A不可以用来评估这种农作物亩产量稳定程度;
在B 中,标准差能反映一个数据集的离散程度,故B可以用来评估这种农作物亩产量稳定程度;
在C中,最大值是一组数据最大的量,故C
不可以用来评估这种农作物亩产量稳定程度;
在D中,中位数将数据分成前半部分和后半部分,用来代表一组数据的“中等水平”,
故D不可以用来评估这种农作物亩产量稳定程度.
故选:B.
利用平均数、标准差、最大值、中位数的定义和意义直接求解.
本题考查可以用来评估这种农作物亩产量稳定程度的量的判断,是基础题,解题时要认真审题,注意平均数、标准差、最大值、中位数的定义和意义的合理运用.
1. 某家庭连续五年收入x与支出y如表:
年份
2019
2019
2019
2019
2019
收入(万元)
8.2
8.6
10.0
11.3
11.9
支出(万元)
6.2
7.5
8.0
8.5
9.8
画散点图知:y与x线性相关,且求得的回归方程是y=bx+a,其中b=0.76,则据此预计该家庭2019年若收入15万元,支出为( )万元.
A. 11.4 B. 11.8 C. 12.0 D. 12.2
【答案】B
【解析】解:由表中数据,计算=×(8.2+8.6+10.0+11.3+11.9)=10,
=×(6.2+7.5+8.0+8.5+9.8)=8,
代入回归方程可得a=8-0.76×10=0.4,
∴回归方程为=0.76x+0.4,
把x=15代入回归方程计算=0.76×15+0.4=11.8.
故选:B.
由表中数据计算平均数、,
代入回归方程求出a,写出回归方程,
把x=15代入回归方程计算的值.
本题考查了线性回归方程与平均值的计算问题,是基础题.
2. 某学校要从高一年级的752名学生中选取5名学生代表去敬老院慰问老人,若采用系统抽样方法,首先要随机剔除2名学生,再从余下的750名学生中抽取5名学生,则其中学生甲被选中的概率为( )
A. B. C. D.
【答案】D
【解析】解:根据简单随机抽样与系统抽样方法的特点,得;
每个人入选的概率都相等,且等于,
故选:D.
根据简单随机抽样与系统抽样方法的定义,结合概率的意义,即可判断每个人入选的概率是多少.
本题考查了简单随机抽样与系统抽样方法的应用问题,也考查了概率的意义问题,是基础题目
1. 某研究性学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如表
使用智能手机
不使用智能手机
合计
学习成绩优秀
4
8
12
学习成绩不优秀
16
2
18
合计
20
10
30
附表:
p(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
经计算K2=10,则下列选项正确的是:( )
A. 有99.5%的把握认为使用智能手机对学习有影响
B. 有99.5%的把握认为使用智能手机对学习无影响
C. 有99.9%的把握认为使用智能手机对学习有影响
D. 有99.9%的把握认为使用智能手机对学习无影响
【答案】A
【解析】解:因为7.879<K2=10<10.828,
对照数表知,有99.5%的把握认为使用智能手机对学习有影响.
故选:A.
根据观测值K2,对照数表,即可得出正确的结论.
本题考查了独立性检验的应用问题,是基础题目.
2. 某企业节能降耗技术改造后,在生产某产品过程中的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如表所示:
x
3
4
5
6
y
2.5
3
4
4.5
若根据表中数据得出y关于x的线性回归方程为y=0.7x+,若生产7吨产品,预计相应的生产能耗为( )吨.
A. 5.25 B. 5.15 C. 5.5 D. 9.5
【答案】A
【解析】解:由表中数据,计算得
=×(3+4+5+6)=4.5,=×(2.5+3+4+4.5)=3.5,
且线性回归方程=0.7x+a过样本中心点(,),
即3.5=0.7×4.5+a,
解得a=0.35,
∴x、y的线性回归方程是=0.7x+0.35,
当x=7时,估计生产7吨产品的生产能耗为
=0.7×7+0.35=5.25(吨).
故选:A.
由表中数据,计算、,利用线性回归方程过样本中心点(,)求出a的值,写出线性回归方程,计算x=7时的值即可.
本题考查了线性回归方程过样本中心点的应用问题,是基础题目.
3. 某中学的高一、高二、高三共有学生1350人,其中高一500人,高三比高二少50人,为了解该校学生健康状况,现采用分层抽样方法进行调查,在抽取的样本中有高一学生120人,则该样本中的高二学生人数为( )
A. 80 B. 96 C. 108 D. 110
【答案】C
【解析】解:设高二x人,则x+x-50+500=1350,x=450,
所以,高一、高二、高三的人数分别为:500,450,400
因为=,所以,高二学生抽取人数为:=108,
故选C.
求出高一、高二、高三的人数分别为:500,450,400,即可得出该样本中的高二学生人数.
本题主要考查分层抽样的应用,根据比例关系是解决本题的关键.
1. 如图茎叶图记录了在一次数学模拟考试中甲、乙两组各五名学生的成绩(单位:分).已知甲组数据的中位数为106,乙组数据的平均数为105.4,则x,y的值分别为( )
A. 5,7 B. 6,8 C. 6,9 D. 8,8
【答案】B
【解析】解:根据茎叶图中的数据,得;
∵甲组数据的中位数为106,∴x=6;
又∵乙组数据的平均数为105.4,
∴=105.4,
解得y=8;
综上,x、y的值分别为6、8.
故答案为:B.
根据茎叶图中的数据,结合中位数与平均数的概念,即可求出x、y的值.
本题考查了利用茎叶图求数据的中位数与平均数的问题,是基础题.
2. 某班有学生60人,将这60名学生随机编号为1-60号,用系统抽样的方法从中抽出4名学生,已知3号、33号、48号学生在样本中,则样本中另一个学生的编号为( )
A. 28 B. 23 C. 18 D. 13
【答案】C
【解析】解:抽样间隔为15,故另一个学生的编号为3+15=18,
故选C.
根据系统抽样的定义和方法,所抽取的4个个体的编号成等差数列,故可根据其中三个个体的编号求出另一个个体的编号.
本题主要考查系统抽样的定义和方法,属于简单题.
3. 已知变量x,y呈现线性相关关系,回归方程为=1-2x,则变量x,y是( )
A. 线性正相关关系
B. 由回归方程无法判断其正负相关关系
C. 线性负相关关系
D. 不存在线性相关关系
【答案】C
【解析】【分析】
根据变量x,y的线性回归方程的系数<0,判断变量x,y是线性负相关关系.
本题考查了由线性回归方程判断变量是否正负相关问题,是基础题目.
【解答】
解:根据变量x,y的线性回归方程是=1-2x,
回归系数=-2<0,
所以变量x,y是线性负相关关系.
故选C.
1. 如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A. 3,5 B. 5,5 C. 3,7 D. 5,7
【答案】A
【解析】解:由已知中甲组数据的中位数为65,
故乙组数据的中位数也为65,
即y=5,
则乙组数据的平均数为:66,
故x=3,
故选:A.
由已知有中这两组数据的中位数相等,且平均值也相等,可得x,y的值.
本题考查的知识点是茎叶图,平均数和中位数,难度不大,属于基础题.
2. 如图茎叶图记录了甲、乙两组各6名学生在一次数学测试中的成绩(单位:分),已知甲组数据的众数为124,乙组数据的平均数为甲组数据的中位数,则x,y的值分别为( )
A. 4,4 B. 5,4 C. 4,5 D. 5,5
【答案】C
【解析】解:若甲组数据的众数为124,
则x=4,甲的中位数是:124,
故(114+118+122+120+y+127+138)=124,
解得:y=5
,
故选:C.
由茎叶图中甲组的数据,根据它们的众数,求出x的值,得出甲组数据的中位数,再求乙组数据的平均数,即得y的值.
本题考查了茎叶图的应用问题,解题时应根据茎叶图的数据,求出它们的平均数与中位数,从而求出x、y的值.
二、填空题(本大题共4小题,填空智慧,冷静应对)
1. 已知x与y之间的一组数据:
x
0
2
4
6
y
a
3
5
3a
已求得关于y与x的线性回归方程=1.2x+0.55,则a的值为______ .
【答案】2.15
【解析】解:=3,=a+2,
将(3,a+2)代入方程得:
a+2=3.6+0.55,解得:a=2.15,
故答案为:2.15.
首先求出这组数据的横坐标和纵坐标的平均数,写出这组数据的样本中心点,把样本中心点代入线性回归方程求出a的值.
本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是一个运算量比较小的题目,并且题目所用的原理不复杂,是一个好题.
2. 某班级有50名学生,现用系统抽样的方法从这50名学生中抽出10名学生,将这50名学生随机编号为1~50号,并按编号顺序平均分成10组(1~5号,6~10号,…,46~50号),若在第三组抽到的编号是13,则在第七组抽到的编号是______ .
【答案】73
【解析】解:因为是从50名学生中抽出10名学生,
组距是10,
∵第三组抽取的是13号,
∴第七组抽取的为13+7×10=73号,
故答案为:73.
根据已知计算出组距,可得答案
本题考查系统抽样的应用,是基础题,解题时要认真审题,注意熟练掌握系统抽样的概念
3. 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取______件.
【答案】18
【解析】解:产品总数为200+400+300+100=1000件,而抽取60件进行检验,抽样比例为=,
则应从丙种型号的产品中抽取300×=18件,
故答案为:18
由题意先求出抽样比例即为
,再由此比例计算出应从丙种型号的产品中抽取的数目.
本题的考点是分层抽样.分层抽样即要抽样时保证样本的结构和总体的结构保持一致,按照一定的比例,即样本容量和总体容量的比值,在各层中进行抽取.
1. 设某总体是由编号为01,02,…,19,20的20个个体组成的,利用下面的随机数表依次选取6个个体,选取方法是从随机数表第一行的第三列数字开始从左到右依次选取两个数字,则选出来的第6个个体的编号为______ .
1818 0792 4544 1716 5809 7983 8619
6206 7650 0310 5523 6405 0526 6238.
【答案】19
【解析】解:从从随机数表第一行的第三列数字开始从左到右依次选取两个数字小于20的编号依次为18,07,17,16,09,19则第6个个体的编号为19.
故答案为:19
根据随机数表,依次进行选择即可得到结论.
本题主要考查简单随机抽样的应用,正确理解随机数法是解决本题的关键,比较基础.
三、解答题(本大题共6小题,突破自我,迎接2019)
2. 如图是我国2019年至2019年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1-7分别对应年份2019-2019.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.
附注:
参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646.
参考公式:r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:
=,=-.
【答案】解:(1)由折线图看出,y与t之间存在较强的正相关关系,理由如下:
∵r=≈≈≈0.993,
∵0.993>0.75,
故y与t之间存在较强的正相关关系;
(2)==≈≈0.103,
=-≈1.331-0.103×4≈0.92,
∴y关于t的回归方程=0.10t+0.92,
2019年对应的t值为9,
故=0.10×9+0.92=1.82,
预测2019年我国生活垃圾无害化处理量为1.82亿吨.
【解析】(1)由折线图看出,y与t之间存在较强的正相关关系,将已知数据代入相关系数方程,可得答案;
(2)根据已知中的数据,求出回归系数,可得回归方程,2019年对应的t值为9,代入可预测2019年我国生活垃圾无害化处理量.
本题考查的知识点是线性回归方程,回归分析,计算量比较大,计算时要细心.
1. 某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得如图柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(Ⅰ)若n=19,求y与x的函数解析式;
(Ⅱ)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(Ⅲ)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
【答案】解:(Ⅰ)当n=19时,
y==
(Ⅱ)由柱状图知,更换的易损零件数为16个频率为0.06,
更换的易损零件数为17个频率为0.16,
更换的易损零件数为18个频率为0.24,
更换的易损零件数为19个频率为0.24
又∵更换易损零件不大于n的频率为不小于0.5.
则n≥19
∴n的最小值为19件;
(Ⅲ)假设这100台机器在购机的同时每台都购买19个易损零件,
所须费用平均数为:(70×19×200+4300×20+4800×10)=4000(元)
假设这100台机器在购机的同时每台都购买20个易损零件,
所须费用平均数为(90×4000+10×4500)=4050(元)
∵4000<4050
∴购买1台机器的同时应购买19台易损零件.
【解析】(Ⅰ)若n=19,结合题意,可得y与x的分段函数解析式;
(Ⅱ)由柱状图分别求出各组的频率,结合“需更换的易损零件数不大于n”的频率不小于0.5,可得n的最小值;
(Ⅲ)分别求出每台都购买19个易损零件,或每台都购买20个易损零件时的平均费用,比较后,可得答案.
本题考查的知识点是分段函数的应用,频率分布条形图,方案选择,难度中档.
1. 为了解某班学生喜好体育运动是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:
喜好体育运动
不喜好体育运动
合计
男生
______
5
______
女生
10
______
______
合计
______
______
50
已知按喜好体育运动与否,采用分层抽样法抽取容量为10的样本,则抽到喜好体育运动的人数为6.
(1)请将上面的列联表补充完整;
(2)能否在犯错概率不超过0.01的前提下认为喜好体育运动与性别有关?说明你的理由.
(参考公式:K2=(n=a+b+c+d)
独立性检验临界值表:
P(K2≥k0)
0.10
0.05
0.025
0.010
k0
2.706
3.841
5.024
6.635
【答案】(1)20;25;15;25;30;20
(1)K2=≈8.333>6.635
∴可以在犯错概率不超过0.01的前提下认为喜好体育运动与性别有关
【解析】解:(1)设喜好体育运动的人数为x人,由已知得解得 x=30,
列联表补充如下:
喜好体育运动
不喜好体育运动
合计
男生
20
5
25
女生
10
15
25
合计
30
20
50
(2)∵K2=≈8.333>6.635
∴可以在犯错概率不超过0.01的前提下认为喜好体育运动与性别有关
(1)根据分层抽样比计算出全班喜欢体育运动的人数和不喜欢体育运动的人数,可将列联表补充完整;
(2)根据公式计算K2,对照临界值表作结论.
本题考查分层抽样的统计原理,独立性检验的运用,考查学生分析解决问题的能力,是基础题.
1. 国际奥委会将于2019年9月15日在秘鲁利马召开130次会议决定2024年第33届奥运会举办地,目前德国汉堡,美国波士顿等申办城市因市民担心赛事费用超支而相继退出,某机构为调查我国公民对申办奥运会的态度,选了某小区的100位居民调查结果统计如下:
支持
不支持
合计
年龄不大于50岁
______
______
80
年龄大于50岁
10
______
______
合计
______
70
100
(1)根据已知数据,把表格数据填写完整;
(2)能否在犯错误的概率不超过5%的前提下认为不同年龄与支持申办奥运无关?
(3)已知在被调查的年龄大于50岁的支持者中有5名女性,其中2位是女教师,现从这5名女性中随机抽取3人,求至多有1位教师的概率.
附:,n=a+b+c+d,
P(K2>k)
0.100
0.050
0.025
0.010
k
2.706
3.841
5.024
6.635
【答案】20;60;10;20;30
【解析】解:(1)
支持
不支持
合计
年龄不大于50岁
20
60
80
年龄大于50岁
10
10
20
合计
30
70
100
(2),
所以能在犯错误的概率不超过5%的前提下认为不同年龄与支持申办奥运无关;
(3)记5人为abcde,其中ab表示教师,从5人任意抽3人的所有等可能事件是:abc,abd,abe,acd,ace,ade,bcd,bce,bde,cde共10个,其中至多1位教师有7个基本事件:acd,ace,ade,bcd,bce,bde,cde,所以所求概率是.
(1)根据条件中所给的数据,列出列联表,填上对应的数据,得到列联表.
(2
)假设聋哑没有关系,根据上一问做出的列联表,把求得的数据代入求观测值的公式求出观测值,把观测值同临界值进行比较得到结论.
(3)列举法确定基本事件,即可求出概率.
本题考查独立性检验的应用,考查概率的计算,本题解题的关键是根据所给的数据填在列联表中,注意数据的位置不要出错.
1. 上周某校高三年级学生参加了数学测试,年部组织任课教师对这次考试进行成绩分析.现从中随机选取了40名学生的成绩作为样本,已知这40名学生的成绩全部在40分至100分之间,现将成绩按如下方式分成6组:第一组[40,50);第二组[50,60);…;第六组[90,100],并据此绘制了如图所示的频率分布直方图.
(Ⅰ)估计这次月考数学成绩的平均分和众数;
(Ⅱ)从成绩大于等于80分的学生中随机选2名,求至少有1名学生的成绩在区间[90,100]内的概率.
【答案】解:(1)因各组的频率之和为1,所以成绩在区间[80,90)内的频率为1-(0.005×2+0.015+0.020+0.045)×10=0.1,
所以平均分=0.05×45+0.15×55+0.45×65+0.20×75+0.10×85+0.05×95=6,
众数的估计值是6
(2)设A表示事件“在成绩大于等于80分的学生中随机选2名,至少有1名学生的成绩在区间[90,100]内”,由题意可知成绩在区间[80,90)内的学生所选取的有:40×0.1=4,记这4名学生分别为a,b,c,d,
成绩在区间[90,100]内的学生有0.005×10×40=2(人),记这2名学生分别为e,f,
则从这6人中任选2人的基本事件事件空间为:Ω={(a,b),(a,c),(a,d),(a,e),(a,f),(b,c)(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f)}共15种,
事件“至少有1名学生的成绩在区间[90,100]内”的可能结果为:A={(a,e),(a,f),(b,e),(b,f),(c,e),(c,f),(d,e),(d,f),(e,f)},共九种,
所以.
故所求事件的概率为:.
【解析】(Ⅰ)由各组的频率和等于1直接列式计算成绩在[80,90)的学生频率,再估计这次月考数学成绩的平均分和众数;
(Ⅱ)用列举法求出从成绩大于等于80分的学生中随机选2名学生的事件个数,查出至少有1名学生成绩在[90,100]的事件个数,然后直接利用古典概型概率计算公式求解.
本题考查了频率分布直方图,考查了古典概型及其概率计算公式,解答的关键是对事件的列举做到不重不漏,是基础题.
2. 某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
出险次数
0
1
2
3
4
≥5
频数
60
50
30
30
20
10
(I)记A为事件:“一续保人本年度的保费不高于基本保费”.求P(A
)的估计值;
(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;
(Ⅲ)求续保人本年度的平均保费估计值.
【答案】解:(I)记A为事件:“一续保人本年度的保费不高于基本保费”.事件A的人数为:60+50=110,该险种的200名续保,
P(A)的估计值为:=;
(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.事件B的人数为:30+30=60,P(B)的估计值为:=;
(Ⅲ)续保人本年度的平均保费估计值为==1.1925a.
【解析】(I)求出A为事件:“一续保人本年度的保费不高于基本保费”的人数.总事件人数,即可求P(A)的估计值;
(Ⅱ)求出B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”的人数.然后求P(B)的估计值;
(Ⅲ)利用人数与保费乘积的和除以总续保人数,可得本年度的平均保费估计值.
本题考查样本估计总体的实际应用,考查计算能力.