- 626.00 KB
- 2021-06-11 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
A组 基础关
1.观察下列各图形:
其中两个变量x,y具有相关关系的图是( )
A.①② B.①④ C.③④ D.②③
答案 C
解析 观察散点图可知,两个变量x,y具有相关关系的图是③④.
2.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
答案 D
解析 D选项中,若该大学某女生身高为170 cm,根据回归方程只能近似认为其体重为58.79 kg,但不是绝对的.故D不正确.故选D.
3.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙 C.丙 D.丁
答案 D
解析 在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两个变量有更强的线性相关性.故选D.
4.(2018·江西南城一中、高安中学联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
由K2=,得
K2=≈9.616.参照下表,
正确的结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
答案 C
解析 k≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”.故选C.
5.(2018·河南天一大联考)已知变量x,y之间满足线性相关关系=1.3x-1,且x,y之间的相关数据如下表所示:
则m=( )
A.0.8 B.1.8 C.0.6 D.1.6
答案 B
解析 依题意,==2.5,将=2.5代入=1.3x-1中,解得=2.25,故m=2.25×4-0.1-3.1-4=1.8.
6.已知两个随机变量x,y之间的相关关系如下表所示:
x
-4
-2
1
2
4
y
-5
-3
-1
-0.5
1
根据上述数据得到的回归方程为=x+,则大致可以判断( )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
答案 C
解析 由已知得,=0.2,=-1.7,
∴==>0,
∴=-1.7-×0.2<0,
或利用散点图,易判断>0,<0.故选C.
7.为了解疾病A是否与性别有关,在一医院随机地对入院的50人进行了问卷调查,得到了如下的列联表:
则有多大的把握认为患疾病A与性别有关( )
下面的临界值表供参考:
A.95% B.99% C.99.5% D.99.9%
答案 C
解析 根据所给的2×2列联表,得
K2=≈8.333>7.879.故有99.5%的把握认为患疾病A与性别有关.故选C.
8.在西非“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:
参照附表,在犯错误的概率不超过________的前提下,认为“小动物是否被感染与服用疫苗有关”.
答案 0.05
解析 由题意得,K2=≈4.762>3.841.
所以在犯错误的概率不超过0.05的前提下,认为“小动物是否被感染与服用疫苗有关”.
9.给出下列命题:
①线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱;
②由变量x和y的数据得到其回归直线方程为l:=bx+a,则l一定经过点P(,);
③在匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;
⑤在回归直线方程=0.1x+10中,当解释变量x每增加一个单位时,预报变量增加0.1个单位.
则所有正确的命题的序号是________.
答案 ②④⑤
解析 线性相关系数为r,当|r|越接近1时,两个变量的线性相关性越强;当|r|越接近0时,两个变量的线性相关性越弱,①错误;由变量x和y的数据得到其回归直线方程为l:=bx+a,则l一定经过P(,),②正确;每10分钟从匀速传递的产品流水线上,抽取一件产品进行某项指标检测,这样的抽样是系统抽样,③错误;相关指数R2用来刻画回归的效果,其计算公式是R2=1-,在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方,显然,R2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好,④正确;回归直线方程=0.1x+10中,当解释变量x每增加一个单位时,预报变量增加0.1个单位,⑤正确.
10.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动.经计算xi=11,yi=13,x=21,则实数b的值为________.
答案
解析 令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-,此时==,==,代入y=bt-,得=b×-,解得b=.
B组 能力关
1.(2017·山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与
x之间有线性相关关系.设其回归直线方程为=x+.已知i=225,i=1600,=4.该班某学生的脚长为24,据此估计其身高为( )
A.160 B.163 C.166 D.170
答案 C
解析 ∵i=225,∴=i=22.5.
∵i=1600,∴=i=160.
又=4,∴=-=160-4×22.5=70.
∴回归直线方程为=4x+70.
将x=24代入上式得=4×24+70=166.
故选C.
2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
A.成绩 B.视力 C.智商 D.阅读量
答案 D
解析 K=,
令=m,
则K=82m,同理,K=m×(4×20-12×16)2=1122m,
K=m×(8×24-8×12)2=962m,K=m×(14×30-6×2)2=4082m,∴K>K>K>K,则与性别有关联的可能性最大的变量是阅读量.故选D.
3.(2018·青岛模拟)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有________人.
答案 12
解析 设男生人数为x,由题意可得列联表如下:
若有95%的把握认为是否喜欢韩剧和性别有关,则k>3.841,
即k==>3.841,
解得x>10.243.
因为,为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人.
4.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t
;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
解 (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
(以上给出了2种理由,考生答出其中任意一种或其他合理理由均可.)
C组 素养关
1.某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制了频率分布直方图(如图所示),规定80分及以上者晋级成功,否则晋级失败(满分为100分).
(1)求图中a的值;
(2)估计该次考试的平均分(同一组中的数据用该组的区间中点值代表);
(3)根据已知条件完成下面的2×2列联表,并判断能否有85%的把握认为“晋级成功”与性别有关.
解 (1)由频率分布直方图中各小长方形的面积总和为1,可知(2a+0.020+0.030+0.040)×10=1,故a=0.005.
(2)由频率分布直方图知各小组的区间中点值分别为55,65,75,85,95,对应的频率分别为0.05,0.30,0.40,0.20,0.05,
故可估计平均分=55×0.05+65×0.3+75×0.4+85×0.2+95×0.05=74(分).
(3)由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25,
故晋级成功的人数为100×0.25=25,故填表如下:
K2=≈2.613>2.072,
所以有85%的把握认为“晋级成功”与性别有关.
2.(2018·汕头模拟)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:
下面是z关于x的折线图:
(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明;
(2)求y关于x的回归方程并预测某辆A型号二手车当使用年数为9年时售价约为多少?(,小数点后保留两位有效数字)
(3)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?
参考公式:回归方程=x+中斜率和截距的最小二乘估计公式分别为:
==,=-.
r= .
参考数据:
xiyi=187.4,xizi=47.64,x=139,
≈4.18, =13.96,
=1.53,ln 1.46≈0.38,ln 0.7118≈-0.34.
解 (1)由题意,计算=×(2+3+4+5+6+7)=4.5,
=×(3+2.48+2.08+1.86+1.48+1.10)=2,
且xizi=47.64, ≈4.18, =1.53,
所以r=
==-≈-0.99;
所以z与x的相关系数大约为-0.99,说明z与x的线性相关程度很高.
(2)利用最小二乘估计公式计算
===-
≈-0.36,
所以=-=2+0.36×4.5=3.62,
所以z与x的线性回归方程是=-0.36x+3.62,
又z=ln y,
所以y关于x的回归方程是=e-0.36x+3.62;令x=9,解得=e-0.36×9+3.62≈1.46,即预测某辆A型号二手车当使用年数为9年时售价约1.46万元.
(3)当≥0.7118时,e-0.36x+3.62≥0.7118=eln 0.7118=e-0.34,所以-0.36x+3.62≥-0.34,解得x≤11,因此预测在收购该型号二手车时车辆的使用年数不得超过11年.