- 337.00 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
课后限时集训61
变量间的相关关系、统计案例
建议用时:45分钟
一、选择题
1.某公司在2018年上半年的收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:
月份
1
2
3
4
5
6
收入x
12.3
14.5
15.0
17.0
19.8
20.6
支出y
5.63
5.75
5.82
5.89
6.11
6.18
根据统计资料,则 ( )
A.月收入的中位数是15,x与y有正线性相关关系
B.月收入的中位数是17,x与y有负线性相关关系
C.月收入的中位数是16,x与y有正线性相关关系
D.月收入的中位数是16,x与y有负线性相关关系
C [月收入的中位数是=16,由表可知收入增加,支出也增加,则x与y有正线性相关关系,故选C.]
2.对两个变量x,y进行线性相关检验,得线性相关系数r1=0.785 9,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0.956 8,则下列判断正确的是( )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
C [由线性相关系数r1=0.785 9>0知x与y正相关,
由线性相关系数r2=-0.956 8<0知u与v负相关,
又|r1|<|r2|,∴变量u与v的线性相关性比x与y的线性相关性强,故选C.]
3.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是( )
A.100个吸烟者中至少有99人患有肺癌
B.1个人吸烟,那么这个人有99%的概率患有肺癌
C.在100个吸烟者中一定有患肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
- 11 -
D [∵“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立,与多少个人患肺癌没有关系,只有D选项正确,故选D.]
4.已知变量x,y之间的线性回归方程为=-0.7x+10.3,且x,y之间的相关数据如表所示,则下列说法错误的是( )
x
6
8
10
12
y
6
m
3
2
A.可以预测,当x=20时,=-3.7
B.m=4
C.变量x,y之间呈负相关关系
D.变量x,y之间的线性相关系数为负数
B [由=-0.7x+10.3,取x=20,得=-3.7,故A正确;
=(6+8+10+12)=9,==,
代入=-0.7x+10.3,得=-0.7×9+10.3,即m=5,故B错误;
由线性回归方程可知,变量x,y之间呈负相关关系,且变量x,y之间的线性相关系数为负数,故C、D正确,故选B.]
5.为考察高中生的性别与是否喜欢数学课程之间的关系,利用2×2列联表进行检验,经计算χ2的观测值k=7.069,参考下表,则认为“性别与是否喜欢数学课程有关”犯错误的概率不超过 ( )
P(χ2≥k0)
0.100
0.050
0.025
0.010
0.001
k0
2.706
3.841
5.024
6.635
10.828
A.0.001 B.0.01 C.0.99 D.0.999
B [k=7.069>6.635,对照表格,则认为“性别与是否喜欢数学课程有关”犯错误的概率不超过0.01,故选B.]
二、填空题
6.(2019·合肥模拟)某企业的一种商品的产量与单位成本数据如表:
产量x(万件)
14
16
18
20
22
单位成本y(元/件)
12
10
7
a
3
若根据表中提供的数据,求出y关于x的线性回归方程为=-1.15x+28.1,则a=________.
- 11 -
5 [由表中数据,计算=×(14+16+18+20+22)=18,
=×(12+10+7+a+3)=.
由点(,)在线性回归方程=-1.15x+28.1上,
∴=-1.15×18+28.1,则32+a=7.4×5,解得a=5.]
7.某高校“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:
专业
性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2=≈4.844,因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.
5% [∵χ2≈4.844>3.841,∴有95%的把握认为主修统计专业与性别有关系,即作出“主修统计专业与性别有关系”的判断出错的可能性不超过5%.]
8.(2019·长沙模拟)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得回归直线方程=x+中的=-2,预测当气温为-4 ℃时,用电量约为________度.
68 [根据题意知==10,==40,所以=40-(-2)×10=60,=-2x+60,所以当x=-4时,y=(-2)×(-4)+60=68,所以用电量约为68度.]
三、解答题
9.为迎接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图.
- 11 -
(1)求a的值;
(2)记A表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A的概率;
(3)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成绩低于80分为“非优秀”.请将下面的2×2列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?
优秀
非优秀
合计
男生
40
女生
50
合计
100
参考公式及数据:χ2=,n=a+b+c+d.
P(χ2≥k)
0.10
0.05
0.025
0.010
0.005
0.001
k
2.706
3.841
5.024
6.635
7.879
10.828
[解](1)由题可得(0.005+0.010+0.020+0.030+a+0.010)×10=1,解得a=0.025.
(2)由(1)知a=0.025,则比赛成绩不低于80分的频率为(0.025+0.010)×10=0.35,故从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分的概率约为0.35.
(3)由(2)知,在抽取的100名学生中,比赛成绩优秀的有100×0.35=35人,由此可得完整的2×2列联表:
优秀
非优秀
合计
男生
10
40
50
女生
25
25
50
合计
35
65
100
所以χ2的观测值k==≈9.890<10.828,
所以没有99.9%的把握认为“比赛成绩是否优秀与性别有关”.
- 11 -
10.电动化是汽车工业未来发展的大趋势,在国家的节能减排、排放法规等硬性要求之下,新能源汽车乘势而起,来自中国汽车工业协会的统计数据显示,2018年新能源汽车累计销量已经超过100万台,意味着我国的新能源汽车市场的正式兴起.某人计划购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到2018年1月到5月的实际销量如下表:
月份(x)
1
2
3
4
5
销量(y,单位:辆)
500
600
1 000
1 400
1 700
(1)经分析发现,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(辆)与月份x之间的相关关系.请用最小二乘法求y关于x的线性回归方程=x+,并据此预测2018年10月份当地该品牌新能源汽车的销量;
(2)2018年6月12日,中央财政和地方财政将根据新能源汽车的最大续航里程对购车补贴进行新一轮调整.如图为2018年执行的补贴政策.
最大续航里程R(单位:km)
补贴金额(单位:万元)
150≤R<200
1.50
200≤R<250
2.40
250≤R<300
3.40
300≤R<400
4.50
R≥400
5.00
已知该品牌的新能源汽车的最大续航里程不小于250 km,某地的月销量为3 000辆,其中50%最大续航里程在[250,300)内.问购车补贴能否达到1 200万元?如果不能,请说明理由;如果能,请求出最大续航里程在[300,400)内的销售量范围.
参考公式:回归方程=x+,
[解](1)==3,==1 040,
- 11 -
所以y关于x的线性回归方程为=320x+80,
当x=10时,=320×10+80=3 280,
所以预测2018年10月份当地该品牌新能源汽车的销量约为3 280辆.
(2)设最大续航里程在[300,400)内的新能源汽车销售t辆,则购车补贴
T=1 500×3.4+4.5t+(3 000-1 500-t)×5=12 600-0.5t.
由T≥12 000,即12 600-0.5t≥12 000,解得t≤1 200,所以t∈[0,1 200].
故当最大续航里程在[300,400)内的销售量不高于1 200辆时,购车补贴能达到1 200万元.
1.(2019·肇庆模拟)如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程y=b2x+a2,相关系数为r2.则( )
A.0<r1<r2<1 B.0<r2<r1<1
C.-1<r1<r2<0 D.-1<r2<r1<0
D [根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,且点(10,21)是离群值;
方案一中,没剔除离群值,线性相关性弱些,成负相关;
方案二中,剔除离群值,线性相关性强些,也是负相关.
所以相关系数-1<r2<r1<0.故选D.]
2.某国企进行节能降耗技术改造,下面是该国企节能降耗技术改造后连续五年的生产利润:
年号x
1
2
3
4
5
年生产利润y (单位:千万元)
0.7
0.8
1
1.1
1.4
预测第8年该国企的生产利润约为( )
- 11 -
A.1.88千万元 B.2.21千万元
C.1.85千万元 D.2.34千万元
C [==3,==1.
==0.17,=- =1-0.17×3=0.49.
∴y关于x的线性回归方程为=0.17x+0.49.
取x=8,得=0.17×8+0.49=1.85.
即预测第8年该国企的生产利润约为1.85千万元,故选C.]
3.(2019·黄山模拟)在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是________.(填序号)
①若χ2的观测值为k=6.635,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌
②由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌
③若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误
③ [独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误. 故③正确.]
4.某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试.测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子完全停下所需要的距离).无酒状态与酒后状态下的试验数据分别列于表1和表2.
表1:无酒状态
停车距离d(米)
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
频数
26
m
n
8
2
表2:酒后状态
- 11 -
平均每毫升血液酒精含量x(毫克)
10
30
50
70
90
平均停车距离y(米)
30
50
60
70
90
已知表1数据的中位数估计值为26,回答以下问题.
(1)求m,n的值,并估计驾驶员无酒状态下停车距离的平均数;
(2)根据最小二乘法,由表2的数据计算y关于x的回归方程=x+;
(3)该测试团队认为:驾驶员酒后驾车的平均“停车距离”y大于(1)中无酒状态下的停车距离平均数的3倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?
(附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘估计分别为=
[解](1)依题意,得m=50-26,解得m=40,
又m+n+36=100,解得n=24.
故停车距离的平均数为
15×+25×+35×+45×+55×=27.
(2)依题意,可知=50,=60,
xiyi=10×30+30×50+50×60+70×70+90×90=17 800,x=102+302+502+702+902=16 500,
所以==0.7,
=60-0.7×50=25,
所以回归直线方程为=0.7x+25.
(3)由(1)知当y>81时认定驾驶员是“醉驾”.令>81,得0.7x+25>81,解得x>80,当每毫升血液酒精含量大于80毫克时认定为“醉驾”.
1.某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:
- 11 -
℃)的数据,绘制了下面的折线图.
已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是 ( )
A.最低气温与最高气温为正相关
B.10月的最高气温不低于5月的最高气温
C.月温差(最高气温减最低气温)的最大值出现在1月
D.最低气温低于0 ℃的月份有4个
D [在A中,最低气温与最高气温为正相关,故A正确;
在B中,10月的最高气温不低于5月的最高气温,故B正确;
在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;
在D中,最低气温低于0 ℃的月份有3个,故D错误.故选D.]
2.(2019·烟台模拟)某地级市共有200 000名中小学生,其中有7%的学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5∶3∶2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1 000元、1 500元、2 000元.经济学家调查发现,当地人均可支配收入较上一年每增加n%,一般困难的学生中有3n%会脱贫,脱贫后将不再享受“国家精准扶贫”政策,很困难的学生中有2n%转为一般困难,特别困难的学生中有n%转为很困难.现统计了该地级市2013年到2017年共5年的人均可支配收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x取13时代表2013年,x与y(万元)近似满足关系式y=C1·2C2x,其中C1,C2为常数(2013年至2019年该市中学生人数大致保持不变).
(ki-)2
(yi-)2
(xi-)(yi-
(xi-)(ki-
- 11 -
eq x o(y))
eq x o(k))
2.3
1.2
3.1
4.6
2
1
其中ki=log2yi,=ki.
(1)估计该市2018年人均可支配收入;
(2)求该市2018年的“专项教育基金”的财政预算大约为多少?
附:①对于一组具有线性相关关系的数据(u1,v1),(u2,v2),…,(un,vn),其回归直线方程=u+的斜率和截距的最小二乘估计分别为.
②
2-0.7
2-0.3
20.1
21.7
21.8
21.9
0.6
0.8
1.1
3.2
3.5
3.73
[解](1)因为=×(13+14+15+16+17)=15,所以 (xi-)2=(-2)2+(-1)2+02+12+22=10.
由k=log2y得k=log2C1+C2x,
log2C1=-C2=1.2-×15=-0.3,
所以C1=2-0.3=0.8,所以y=0.8×2.
当x=18时,y=0.8×21.8=0.8×3.5=2.8(万元).
即该市2018年人均可支配收入为2.8万元.
(2)由题意知2017年时该市享受“国家精准扶贫”政策的学生有200 000×7%=14 000人,
一般困难、很困难、特别困难的中学生依次有7 000人、4 200人、2 800人,2018年人均可支配收入比2017年增长
=20.1-1=0.1=10%,
所以2018年该市特别困难的中学生有
2 800×(1-10%)=2 520人.
- 11 -
很困难的学生有4 200×(1-20%)+2 800×10%=3 640人,
一般困难的学生有7 000×(1 -30%)+4 200×20%=5 740人.
所以2018年的“专项教育基金”的财政预算大约为5 740×1 000+3 640×1 500+2 520×2 000=16 240 000(元)=1 624(万元).
- 11 -