- 385.50 KB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
课后限时集训64
变量间的相关关系、统计案例
建议用时:45分钟
一、选择题
1.(2019·泉州模拟)在下列各图中,两个变量具有相关关系的是( )
(1) (2) (3) (4)
A.(1)(2) B.(1)(3)
C.(2)(4) D.(2)(3)
D [(1)是函数关系,(4)不具有相关关系,排除A,B,C,故选D.]
2.(2019·肇庆模拟)如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程y=b2x+a2,相关系数为r2.则( )
A.0<r1<r2<1 B.0<r2<r1<1
C.-1<r1<r2<0 D.-1<r2<r1<0
D [根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,且点(10,21)是离群值;
方案一中,没剔除离群值,线性相关性弱些,成负相关;
方案二中,剔除离群值,线性相关性强些,也是负相关.
所以相关系数-1<r2<r1<0.故选D.]
3.(2019·石家庄二模)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:
10
根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
D [由条形图知女生数量多于男生数量,有两理一文意愿的学生数量多于有两文一理意愿的学生数量,男生偏爱两理一文,女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故选D.]
4.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其线性回归方程是=x+,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数的值是( )
A. B.
C. D.
B [依题意可知样本点的中心为,则=×+,解得=.]
5.(2019·中原六校联考)某医疗所为了检查新开发的流感疫苗对甲型H1N1流感的预防作用,把1 000名注射疫苗的人与另外1 000名未注射疫苗的人半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算得P(χ2≥6.635)≈0.01,则下列说法正确的是( )
A.这种疫苗能起到预防甲型H1N1流感的有效率为1%
B.若某人未使用疫苗则他在半年中有99%的可能性得甲型H1N1流感
C.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”
D.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”
C [因为P(χ2≥6.635)≈0.01,这说明假设不合理的程度为99%,即这种疫苗不能起到预防甲型H1N1流感的作用不合理的程度约为99%,所以有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”,故选C.]
10
二、填空题
6.(2019·湖南衡阳联考)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则________同学的试验结果体现A,B两变量有更强的线性相关性.
丁 [r越大,m越小,线性相关性越强.]
7.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.
零件数x/个
10
20
30
40
50
加工时间y/min
62
75
81
89
现发现表中有一个数据看不清,请你推断出该数据的值为________.
68 [由=30,得=0.67×30+54.9=75.
设表中的“模糊数字”为a,
则62+a+75+81+89=75×5,即a=68.]
8.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.
① [χ2≈3.918>3.841,而P(χ2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.]
三、解答题
9.经调查,3个成年人中就有一个高血压,那么什么是高血压?血压多少是正常的?经国际卫生组织对大量不同年龄的人群进行血压调查,得出随年龄变化,收缩压的正常值变化情况如表所示.
年龄x
28
32
38
42
48
52
58
62
收缩压y
(单位:mm Hg)
114
118
122
127
129
135
140
147
10
其中=,=-,x=17 232,
xiyi=47 384.
(1)请画出表中数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;(,的值精确到0.01)
(3)若规定,一个人的收缩压为标准值的0.9~1.06倍,则为血压正常人群;收缩压为标准值的1.06~1.12倍,则为轻度高血压人群;收缩压为标准值的1.12~1.20倍,则为中度高血压人群;收缩压为标准值的1.20倍及以上,则为高度高血压人群.一位收缩压为180 mmHg的70岁的老人,属于哪类人群?
[解] (1)画出表中数据的散点图如图所示.
(2)==45,
==129,
∴===≈0.91,
10
=-=129-0.91×45=88.05,
∴回归直线方程=0.91x+88.05.
(3)根据回归直线方程的预测,年龄为70岁的老人标准收缩压为0.91×70+88.05=151.75(mgHg),
∵≈1.19,
且1.12<1.19<1.20,
∴收缩压为180 mmHg的70岁老人属于中度高血压人群.
10.(2019·清华大学附中三模)手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性、300名男性)进行调查,对手机进行评分,评分的频数分布表如下:
女性
用户
分值区间
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
20
40
80
50
10
男性
用户
分值区间
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
45
75
90
60
30
(1)完成下列频率分布直方图,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);
(2)把评分不低于70分的用户称为“评分良好用户”,能否有90%的把握认为是否是评分良好用户与性别有关?
参考公式及数据:χ2=,其中n=a+b+c+d.
P(χ2≥k)
0.10
0.05
0.01
0.001
k
2.706
3.841
6.635
10.828
[解] (1)女性用户和男性用户的频率分布直方图分别如下图所示:
女性用户 男性用户
由图可得女性用户的波动小,男性用户的波动大.
10
(2)由题可得2×2列联表如下:
女性用户
男性用户
合计
评分良好用户
140
180
320
不是评分良好用户
60
120
180
合计
200
300
500
则χ2==≈5.208>2.706,
所以有90%的把握认为是否是评分良好用户与性别有关.
1.(2019·衡水中学调研)已知变量x,y之间的线性回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误的是( )
x
6
8
10
12
y
6
m
3
2
A.变量x,y之间呈负相关关系
B.可以预测,当x=20时,=-3.7
C.m=4
D.该回归直线必过点(9,4)
C [由-0.7<0,得变量x,y之间呈负相关关系,故A正确;当x=20时,=-0.7×20+10.3=-3.7,故B正确;由表格数据可知=×(6+8+10+12)=9,=(6+m+3+2)=,则=-0.7×9+10.3,解得m=5,故C错;由m=5,得==4,所以该回归直线必过点(9,4),故D正确.故选C.]
2.(2019·大连模拟)在对具有线性相关的两个变量x和y进行统计分析时,得到如下数据:
x
4
m
8
10
12
y
1
2
3
5
6
由表中数据求得y关于x的回归方程为=0.65x-1.8,则(4,1),(m,2),(8,3)这三个样本点中落在回归直线下方的有( )
A.1个 B.2个
C.3个 D.0个
B [由表中数据,得
10
=×(4+m+8+10+12)=,
=×(1+2+3+5+6)=3.4,
代入回归方程=0.65x-1.8中,
得3.4=0.65×-1.8,
计算得出m=6.
所以x=4时,=0.65×4-1.8=0.8<1,点(4,1)在回归直线=0.65x-1.8上方;x=6时,=0.65×6-1.8=2.1>2,
点(6,2)在回归直线=0.65x-1.8下方;
x=8时,=0.65×8-1.8=3.4>3,点(8,3)在回归直线=0.65x-1.8下方.
综上,(4,1),(6,2),(8,3)这三个样本点中落在回归直线下方的有2个.故选B.]
3.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有________人.
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
18 [设男生人数为x,由题意可得列联表如下:
喜欢韩剧
不喜欢韩剧
总计
男生
x
女生
总计
若有95%的把握认为是否喜欢韩剧和性别有关,
则k≥3.841,即k==≥3.841,
解得x≥12.697.
因为各部分人数均为整数,所以x
10
是18的倍数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.]
4.(2019·莆田二模)某芯片公司为制定下一年的研发投入计划,需了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响.该公司对历史数据进行对比分析,建立了两个函数模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.
现该公司收集了近12年的年研发资金投入量xi和年销售额yi的数据,i=1,2,…,12,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值.
令ui=x,vi=ln yi(i=1,2,…,12),经计算得如下数据:
(xi-)2
(yi-)2
20
66
770
200
460
4.20
·(ui-)2
(ui-)·
(yi-)
(vi-)2
(xi-)·
(vi-)
3 125 000
21 500
0.308
14
(1)设{ui}和{yi}的相关系数为r1,{xi}和{vi}的相关系数为r2,请从相关系数的角度,选择一个拟合程度更好的模型;
(2)(ⅰ)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
(ⅱ)若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少亿元.
附:①相关系数r=,
回归直线=+x中斜率和截距的最小二乘估计公式分别为:=,
10
=-;
②参考数据:308=4×77,≈9.486 8,e4.499 8≈90.
[解] (1)由题意,r1=====0.86,r2====≈0.91,
则|r1|<|r2|,因此从相关系数的角度,模型y=eλx+t的拟合程度更好.
(2)(ⅰ)先建立v关于x的线性回归方程,
由y=eλx+t,得ln y=t+λx,即v=t+λx,
由于λ==≈0.018≈0.02,
t=-λ=4.20-0.018×20=3.84,
所以v关于x的线性回归方程为=0.02x+3.84,
所以ln =0.02x+3.84,则=e0.02x+3.84;
(ⅱ)下一年销售额y需达到90亿元,即y=90,
代入=e0.02x+3.84,得90=e0.02x+3.84,
又e4.4998≈90,
所以4.499 8≈0.02x+3.84,
所以x≈=32.99,
所以预测下一年的研发资金投入量约是32.99亿元.
1.(多选题)独立性检验中,为了调查变量X与变量Y的关系,经过计算得到P(χ2≥6.635)=0.01,表示的意义是( )
10
A.有99%的把握认为变量X与变量Y没有关系
B.有1%的把握认为变量X与变量Y有关系
C.有99%的把握认为变量X与变量Y有关系
D.有1%的把握认为变量X与变量Y没有关系
CD [独立性检验中,由P(K2≥6.635)=0.01,它表示的意义是:有1%的把握认为变量X与变量Y没有关系,D正确;即有99%的把握认为变量X与变量Y有关系,C正确.故选CD.]
2.已知由一组样本数据确定的回归直线方程为=1.5x+1,且=2,发现有两组数据(2.2,2.9)与(1.8,5.1)误差较大,去掉这两组数据后,重新求得回归直线的斜率为1,那么当x=4时,y的估计值为________.
6 [已知=2,则=1.5×2+1=4,由题意知去掉两组数据后中心没变,设重新求得的回归直线方程为=x+b,将样本点的中心(2, 4)代入得b=2,因而当x=4时,y的估计值为6.]
10