- 172.50 KB
- 2021-06-22 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第68讲 变量的相关性、回归分析、独立性检验
1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(D)
A.-1 B.0
C. D.1
由题意知,这组样本数据完全正相关,故相关系数为1,选D.
2.设某大学的女生的体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y =0.85x-85.71,则下列结论中不正确的是(D)
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生的身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生的身高为170 cm,则可断定其体重必为58.79 kg
A、B、C均正确,是回归方程的性质.D项是错误的,线性回归方程只能预测学生的体重,选项D应改为“若该大学某女生身高为170 cm,则估计其体重大约为58.79 kg”才正确.
3.(2015·福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
据此估计,该社区一户年收入为15万元家庭的年支出为(B)
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
由题意知,==10,
==8,
所以a =8-0.76×10=0.4,
所以当x=15时,y =0.76×15+0.4=11.8(万元).
4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=算得,
K2=≈7.8.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确结论是(A)
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
因为7.8>6.635,所以99%以上的把握认为“爱好该项运动与性别有关”,选A.
5.对于一组数据的两个函数模型,模型Ⅰ和模型Ⅱ的残差平方和分别为180.2和290.7,若从中选取一个拟合程度较好的函数模型,应选 模型Ⅰ .
残差平方和越小,函数模型对数据的拟合效果越好;残差平方和越大,说明函数模型对数据的拟合效果越差.
6.已知x、y的取值如下表所示,
x
0
1
3
4
y
2.2
4.3
4.8
6.7
从所得的散点图分析,y与x线性相关,且y=0.95x+a,则a= 2.6 .
因为回归直线方程必过样本点的中心(,),
解得=2,=4.5,将(2,4.5)代入y=0.95x+a,可得a=2.6.
7.(2015·重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y
(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程y =b t+a ;
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
附:回归方程y =b t+a 中,b =,a =-b .
(1)列表计算如下:
i
ti
yi
t
tiyi
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50
∑
15
36
55
120
这里n=5,=i==3,
=i==7.2.
又ltt=-n2=55-5×32=10,
lty=iyi-n=120-5×3×7.2=12,
从而b ===1.2,
a =-b =7.2-1.2×3=3.6,
故所求回归方程为y =1.2t+3.6.
(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y =1.2×
6+3.6=10.8(千亿元).
8.(2015·湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(C)
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=b y+a ,b >0,则z=b y+a =-0.1b x+b +a ,故x与z负相关.
9.某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过这种血清的人与另外500名未使用这种血清的人一年中的感冒记录比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2=3.918,经查临界值表知P(K2≥3.841)≈0.05.下列结论中,正确结论的序号是 ① .
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
因为K2=3.918≥3.841,而P(K2≥3.841)≈0.05,
所以有95%的把握认为“这种血清能起到预防感冒的作用”.
10.(2016·湖北省八校第二次联考)国内某知名大学有男生14000人,女生10000人.该校体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取120人,统计他们平均每天运动的时间,如下表:(平均每天运动的时间单位:小时,该校学生平均每天运动的时间范围是[0,3])
男生平均每天运动的时间分布情况:
平均每天
运动的时间
[0,
0.5)
[0.5,
1)
[1,
1.5)
[1.5,
2)
[2,
2.5)
[2.5,
3]
人数
2
12
23
18
10
x
女生平均每天运动的时间分布情况:
平均每天
运动的时间
[0,
0.5)
[0.5,
1)
[1,
1.5)
[1.5,
2)
[2,
2.5)
[2.5,
3]
人数
5
12
18
10
3
y
(1)请根据样本估算该校男生平均每天运动的时间(结果精确到0.1);
(2)若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”.
①请根据样本估算该校“运动达人”的数量;
②请根据上述表格中的统计数据填写下面2×2列联表,并通过计算判断能否在犯错误的概率不超过0.05的前提下认为“是否为'运动达人'与性别有关?”
运动达人
非运动达人
总计
男生
女生
总计
参考公式:K2=,其中n=a+b+c+d.
参考数据:
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
(1)由分层抽样得,男生抽取的人数为120×=70人,女生抽取的人数为120-70=50人,故x=5,y=2,
则该校男生平均每天运动的时间为:
(0.25×2+0.75×12+1.25×23+1.75×18+2.25×10+2.75×5)≈1.5,
故该校男生平均每天运动的时间约为1.5小时.
(2)①样本中“运动达人”所占比例是=,故估计该校“运动达人”有
×(14000+10000)=4000人.
②由表格可知:,
运动达人
非运动达人
总计
男生
15
55
70
女生
5
45
50
总计
20
100
120
故K2的观测值
k==≈2.743<3.841.
故在犯错误的概率不超过0.05的前提下不能认为“是否为'运动达人'与性别有关”.
相关文档
- 2019年高考数学总复习检测第22讲 2021-06-213页
- 2019年高考数学总复习检测第1讲 2021-06-212页
- 2019年高考数学总复习检测第50讲 2021-06-204页
- 2019年高考数学总复习检测第57讲 2021-06-193页
- 2019年高考数学总复习检测第63讲 2021-06-173页
- 2019年高考数学总复习检测第48讲 2021-06-175页
- 2019年高考数学总复习检测第2讲 2021-06-173页
- 2019年高考数学总复习检测第54讲 2021-06-163页
- 2019年高考数学总复习检测第64讲 2021-06-163页
- 2019年高考数学总复习检测第43讲 2021-06-164页