- 438.50 KB
- 2021-06-09 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
题组层级快练(七十四)
1.(2014·重庆理)已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
答案 A
解析 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B得A正确.
2.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:
甲
乙
丙
丁
r
-0.82
-0.78
-0.69
-0.85
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙
C.丙 D.丁
答案 D
3.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有( )
A.b与r的符号相同 B.a与r的符号相同
C.b与r的符号相反 D.a与r的符号相反
答案 A
4.下列有关样本相关系数的说法不正确的是( )
A.相关系数用来衡量变量x与y之间的线性相关程度
B.|r|≤1,且|r|越接近于1,相关程度越大
C.|r|≤1,且|r|越接近0,相关程度越小
D.|r|≥1,且|r|越接近1,相关程度越小
答案 D
5.下面是一个2×2列联表
y1
y2
总计
x1
a
21
73
x2
22
25
47
合计
b
46
120
其中a,b处填的值分别为( )
A.94 72 B.52 50
C.52 74 D.74 52
答案 C
解析 由a+21=73,得a=52,a+22=b,得b=74.故选C.
6.“十一”期间,邢台市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到了如下列联表,下列结论正确的是( )
做不到“光盘”行动
能做到“光盘”行动
男
45
10
女
30
15
A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’行动与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’行动与性别无关”
C.有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别有关”
D.有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别无关”
答案 C
解析 根据列联表中的数据得到K2=≈3.03>2.706,
∴有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别有关”.
7.(2017·山东师大附中模拟)某镇2011年至2017年中,每年的人口总数y(单位:万)的数据如下表:
年份
2011
2012
2013
2014
2015
2016
2017
年份代号t
0
1
2
3
4
5
6
人口总数y
6
6
5
9
11
12
14
若t与y之间具有线性相关关系,则其线性回归方程=t+一定过点( )
A.(4,11) B.(6,14)
C.(3,9) D.(9,3)
答案 C
解析 由题意,得==3,==9,∴线性回归方程=t+一定过点(3,9).
8.(2017·东北三校联考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=t+,其中=0.76,=-.据此估计,该社区一户年收入为15万元的家庭年支出为( )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
答案 B
解析 由已知得==10(万元),
==8(万元),故=8-0.76×10=0.4,所以回归直线方程为=0.76x+0.4,所以社区一户年收入为15万元的家庭年支出为=0.76×15+0.4=11.8(万元).
9.根据如下样本数据
x
3
4
5
6
7
y
4.0
2.5
0.5
0.5
2.0
得到的回归方程为=x+.若=7.9,则x每增加1个单位,y就( )
A.增加1.4个单位 B.减少1.4个单位
C.增加1.2个单位 D.减少1.2个单位
答案 D
解析 由已知求得样本中心为(5,1.9),代入回归直线方程可得1.9=×5+7.9⇒=-1.2,所以x每增加1个单位,y就减少1.2个单位.故选D.
10.(2017·湖南衡阳联考)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙
C.丙 D.丁
答案 D
解析 r越大,m越小,线性相关性越强.故选D.
11.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程=3-5x,变量x增加一个单位时,y平均增加5个单位;
③回归直线=x+必过点(,);
④在一个2×2列联表中,由计算得K2的观测值k=13.079,则在犯错误的概率不超过0.001的前提下认为这两个变量间有关系.其中错误的个数是( )
A.0 B.1
C.2 D.3
本题可以参考独立性检验临界值表
P(K2≥k)
0.5
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
答案 B
解析 只有②错误,应该是y平均减少5个单位.
12.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额约为________元.
答案 65.5
解析 由表可计算==,==42,
因为点(,42)在回归直线=x+上,且=9.4,
所以42=9.4×+,解得=9.1.
故回归方程为=9.4x+9.1.令x=6,得=65.5.
13.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)
学生的编号i
1
2
3
4
5
数学成绩x
80
75
70
65
60
物理成绩y
70
66
68
64
62
现已知其线性回归方程为=0.36x+ ,则根据此线性回归方程估计数学得90分的同学的物理成绩为________(四舍五入到整数).
答案 73
解析 ==70,==66,
所以66=0.36×70+ ,解得=40.8.所以0.36×90+40.8=73.2≈73.
14.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:
理科
文科
合计
男
13
10
23
女
7
20
27
合计
20
30
50
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.
根据表中数据,得到K2的观测值
k=≈4.844,则认为选修文科与性别有关系出错的可能性约为________.
答案 5%
解析 由K2的观测值k≈4.844>3.841,故认为选修文科与性别有关系出错的可能性约为5%.
15.(2017·河北邯郸一模)为了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下表:
患心肺疾病
不患心肺疾病
合计
大于40岁
16
小于等于40岁
12
合计
40
已知在全部的40人中随机抽取1人,抽到不患心肺疾病的概率为.
(1)请将2×2列联表补充完整;
(2)已知大于40岁患心肺疾病市民中,经检查其中有4名重症患者,专家建议重症患者住院治疗,现从这16名患者中选出两名,记需住院治疗的人数为ξ,求ξ的分布列和数学期望;
(3)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?
下面的临界值表供参考:
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:K2=,其中n=a+b+c+d)
答案 (1)略 (2) (3)能判定
解析 (1)
患心肺疾病
不患心肺疾病
合计
大于40岁
16
4
20
小于等于40岁
8
12
20
合计
24
16
40
(2)ξ可以取0,1,2,P(ξ=0)===,P(ξ=1)===,
P(ξ=2)===,
故ξ的分布列为
ξ
0
1
2
P
E(ξ)=0×+1×+2×=.
(3)K2=≈6.667>6.735,
所以在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关.
16.(2017·天星大联考)某部影片预计在2017年4月29日上映.某地电影院为了了解当地影迷对票价的看法,进行了一次调研,得到票价x(单位:元)与渴望观影人数y(单位;万人)的结果如下表:
x(单位:元)
30
40
50
60
y(单位:万人)
4.5
4
3
2.5
(1)若y与x具有较强的相关关系,试分析y与x之间是正相关还是负相关;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;
(3)根据(2)中求出的线性回归方程,预测票价定为多少元时,能获得最大票房收入.
答案 (1)负相关 (2) =-0.7x+6.65 (3)票价定为47.5元时,能获得最大票房收入.
解析 (1)由表中数据易知,y随x的增大而减小,故y与x之间是负相关.
(2)由表中数据可得=45,=3.5,
=6.65,所以所求线性回归方程为=-0.07x+6.65.
(3)根据(2)中的线性回归方程,若票价为x元,则渴望观影人数为(-0.07x+6.65)万人,,可预测票房收入为z=x(-0.07x+6.65)=-0.07x2+6.65x,易得,当x=47.5时,z取得最大值,即票价定为47.5元时,能获得最大票房收入.
1.下列四个散点图中,变量x与y之间具有负的线性相关关系的是( )
答案 D
解析 观察散点图可知,只有D项的散点图表示的是变量x与y之间具有负的线性相关关系.
2.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的R2如下,其中拟合效果最好的模型是( )
模型
模型1
模型2
模型3
模型4
R2
0.98
0.80
0.50
0.25
A.模型1 B.模型2
C.模型3 D.模型4
答案 A
解析 R2越大,拟合效果越好。
3.(2017·石家庄市二模)2015年国内物价持续上涨,某著名纺织集团为了降低生产成本继续走高的压力,计划提高某种产品的价格,为此销售部在10月1日至10月5日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查,其中该产品的价格x(元)与销售量y(万件)之间的数据如下表所示:
日期
10月1日
10月2日
10月3日
10月4日
10月5日
价格x(元)
9
9.5
10
10.5
11
销售量y(万件)
11
10
8
6
5
已知销售量y与价格x之间具有线性相关关系,其回归直线方程为:=-3.2x+a,若该集团提高价格后该批发市场的日销售量为7.36万件,则该产品的价格为( )
A.14.2元 B.10.8元
C.14.8元 D.10.2元
答案 D
解析 依题意x=×(9+9.5+10+10.5+11)=10,y=×(11+10+8+6+5)=8.因为线性回归直线必过样本中心点(x,y),所以8=-3.2×10+a,解得a=40.所以回归直线方程为=-3.2x+40.令=7.36,则7.36=-3.2x+40,解得x=10.2.所以该产品的价格为10.2元.
4.(2017·沧州七校联考)某单位为了制定节能减排的计划,随机统计了某4天的用电量y(单位:度)与当天气温x(单位:℃),并制作了对照表(如表所示).由表中数据,得线性回归方程=-2x+a,当某天的气温为-5℃时,预测当天的用电量约为________度.
x
18
13
10
-1
y
24
34
38
64
答案 70
解析 气温的平均值x=×(18+13+10-1)=10,用电量的平均值y=×(24+34+38+64)=40,因为回归直线必经过点(x,y),将其代入线性回归方程得40=-2×10+a,解得a=60,故回归方程为=-2x+60.
当x=-5时,=-2×(-5)+60=70.所以当某天的气温为-5℃时,预测当天的用电量约为70度.
5.(2017·广东中山模拟)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=,算得
K2=≈7.8.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
答案 C
解析 ∵K2≈7.8>6.635,∴有99%以上的把握认为“爱好该项运动与性别有关”,即犯错误的概率不超过1%.
6.(2014·江西理)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
成绩
性别
不及
格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
表2
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
表4
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成绩 B.视力
C.智商 D.阅读量
答案 D
解析 根据数据求出K2的值,再进一步比较大小.
A中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
K2==.
B中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
K2==.
C中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
K2==.
D中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
K2==.
∵<<<,∴与性别有关联的可能性最大的变量是阅读量.
7.某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:
x
6
8
10
12
y
2
3
5
6
则y对x的线性回归直线方程为( )
A.=2.3x-0.7 B.=2.3x+0.7
C.=0.7x-2.3 D. D.=0.7x+2.3
(相关公式:=,=y-x)
答案 C
解析 ∵xiyi=6×2+8×3+10×5+12×6=158,x==9,
y==4.∴==0.7,=4-0.7×9=-2.3.
故线性回归直线方程为=0.7x-2.3.
8.(2017·珠海一模)某学校一个生物兴趣小组对学校的人工湖
中养殖的某种鱼进行观测研究,在饲料充足的前提下,该兴趣小组得到一组饲养时间x(单位:月)与这种鱼的平均体重y(单位:千克)的观测值,如下表:
xi(月)
1
2
3
4
5
yi(千克)
0.5
0.9
1.7
2.1
2.8
请根据上表提供的数据,用最小二乘法的思想预测饲养满12个月时,这种鱼的平均体重是________千克.
(参考公式:=,=- )
答案 6.82
解析 由题意知,=3,=1.6,n2=45,n=24,xiyi=29.8,xi2=55,故===0.58,=-=1.6-0.58×3=-0.14,
故回归直线方程为=x+=0.58x-0.14,当x=12时,=0.58×12-0.14=6.82,
所以饲养满12个月时,这种鱼的平均体重约为6.82千克.
9.某工厂为了对一种新研发的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程为=-4x+.若在这些样本点中任取一点,则它在回归直线左下方的概率为________.
答案
解析 由表中数据得x=6.5,y=80,由y=-4x+,得=106,故线性回归方程为
=-4x+106.将(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)分别代入回归方程,可知有6个基本事件,因84<-4×5+106=86,68<-4×9+106=70,故(5,84)和(9,68)在直线的左下方,满足条件的只有2个,故所求概率为=.
10.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少小时?
(注:=,=y- x)
答案 (1)略 (2)y^=0.7x+1.05 (3)8.05小时
解析 (1)散点图如图.
(2)由表中数据得xiyi=52.5,=3.5,=3.5,xi2=54.
∴=0.7,∴=1.05.∴=0.7x+1.05.回归直线图略.
(3)将x=10代入回归直线方程,得y^=0.7×10+1.05=8.05(小时).
∴预测加工10个零件需要8.05小时.
11.(2015·新课标全国Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi-)2
(wi-)2
(xi-)(yi-)
(wi-)(yi-)
46.6
563
6.8
289.8
1.6
1 469
108.8
表中wi=,=wi.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利率z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利率的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:=,=- .
解析 (1)由散点图可以判断y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=,先建立y关于w的线性回归方程,由于===68,
∴=- =563-68×6.8=100.6.
∴y关于w的线性回归方程为=100.6+68w.
因此y关于x的回归方程为=100.6+68.
(3)①由(2)知x=49时,
年销售量y的预报值为=100.6+68=576.6.
年利润z的预报值=576.6×0.2-49=66.32.
②根据(2)的结果知年利润z的预报值为
=0.2(100.6+68)-x=-x+13.6+20.12.
当==6.8即x=46.24时,取得最大值.
∴年宣传费为46.24千元时,年利率的预报值最大.
12.(2013·福建文)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如下图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
P(K2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
附:K2=.
答案 (1) (2)没有90%的把握认为“生产能手与工人所在的年龄组有关”
解析 (1)由已知,得样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3人,记为A1,A2,A3;25周岁以下组工人有40×0.05=2人,记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.
(2)由频率分布直方图,可知在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15人,“25周岁以下组”中的生产能手有40×0.375=15人,据此可得2×2列联表如下:
生产能手
非生产能手
合计
25周岁以上组
15
45
60
25周岁以下组
15
25
40
合计
30
70
100
所以得K2==
=≈1.79.
因为1.79<2.706,
所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.
13.(2014·安徽文)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
P(K2≥k0)
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
附:K2=.
答案 (1)90 (2)0.75 (3)有95%的把握
思路 (1)根据抽样比计算分层抽样中应抽取的人数;(2)利用对立事件或互斥事件的概率公式求运动时间超过4小时的概率;(3)根据K2的计算公式求解.
解析 (1)300×=90,所以应收集90位女生的样本数据.
(2)由频率分布直方图得1-2×(0.025+0.100)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.
(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:
每周平均体育运动时间与性别列联表
男生
女生
总计
每周平均体育运动时间不超过4小时
45
30
75
每周平均体育运动时间超过4小时
165
60
225
总计
210
90
300
结合列联表可算得K2==≈4.762>3.841.
所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
14.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.
零件数x(个)
10
20
30
40
50
加工时间y(min)
62
75
81
89
现发现表中有一个数据模糊看不清,请你推断出该数据的值为________.
答案 68
解析 由已知可计算求出=30,而线性回归直线必过点(,),则=0.67×30+54.9=75,设模糊数字为a,则=75,计算得a=68.