- 757.00 KB
- 2021-06-12 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
变量间的相关关系与统计案例
(30分钟 60分)
一、选择题(每小题5分,共25分)
1.对于变量x,y有以下四个散点图,由这四个散点图可以判断变量x与y成负相关的是 ( )
【解析】选B.对于A,散点图呈片状分布,不具相关性;对于B,散点图呈带状分布,且y随x的增大而减小,是负相关;对于C,散点图中y随x的增大先增大再减小,不是负相关;对于D,散点图呈带状分布,且y随x的增大而增大,是正相关.
2.某考察团对全国10大城市居民人均工资水平x(千元)与居民人均消费水平y(千元)进行统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为 ( )
A.83% B.72% C.67% D.66%
【解析】选A.由7.675=0.66x+1.562,
得x≈9.262,
所以×100%≈83%.
3.(2018·衡水模拟)如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的
是 ( )
A.相关系数r变大
B.残差平方和变大
C.相关指数R2变大
D.解释变量x与预报变量y的相关性变强
【解析】选B.去掉D点后,相关性变强,模型拟合效果越好,故残差平方和变小.
4.根据如下样本数据得到的回归方程为=x+,若=5.4,则x每增加1个单位,y就 ( )
x
3
4
5
6
7
y
4
2.5
-0.5
0.5
-2
A.增加0.9个单位 B.减少0.9个单位
C.增加1个单位 D.减少1个单位
【解析】选B.由题意可得=×(3+4+5+6+7)=5,
=×(4+2.5-0.5+0.5-2)=0.9,
因为回归方程为=x+,=5.4,且回归直线过点(5,0.9),
所以0.9=5+5.4,解得=-0.9,
所以x每增加1个单位,y就减少0.9个单位.
5.观察两个变量(存在线性相关关系)得如下数据:
x
-10
-6.99
-5.01
-2.98
3.98
5
7.99
8.01
y
-9
-7
-5
-3
4.01
4.99
7
8
则两变量间的线性回归方程为 ( )
A.=x+1 B.=x
C.=2x+ D.=x+1
【解析】选B.根据表中数据,得
=(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,
=(-9-7-5-3+4.01+4.99+7+8)=0.
所以两变量x,y间的线性回归方程过样本中心点(0,0),只有B选项符合.
【变式备选】
已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是 ( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
【解析】选A.依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B得A正确.
二、填空题(每小题5分,共15分)
6.(2019·阜阳模拟)某班主任对全班30名男生进行了作业量多少的调查,数据如表:
认为作业多
认为作业不多
总计
喜欢玩电脑游戏
12
8
20
2
8
10
不喜欢玩电脑游戏
总计
14
16
30
该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过________.
【解析】计算得K2的观测值
k=≈4.286>3.841,
则推断犯错误的概率不超过0.05.
答案:0.05
7.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得回归直线方程=x+中的=-2,预测当气温为-4 ℃时,用电量约为________.
【解析】根据题意知
==10,
==40,
因为回归直线过样本点的中心,
所以=40-(-2)×10=60,
所以=-2x+60,
当x=-4时,=(-2)×(-4)+60=68,
所以当气温为-4 ℃时,用电量约为68度.
答案:68度
8.某炼钢厂废品率x(%)与成本y(元/吨)的线性回归方程为y=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产的1 000吨钢中,约有________吨钢是废品(结果保留两位小数).
【解析】因为176.5=105.492+42.569x,解得x≈1.668,
即当成本控制在176.5元/吨时,废品率约为1.668%,
所以生产的1 000吨钢中,约有1 000×1.668%=16.68吨是废品.
答案:16.68
【变式备选】经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
【解析】x变为x+1,=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.
答案:0.245
三、解答题(每小题10分,共20分)
9.已知某班n名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a,b,c成等差数列,且成绩在(90,100]内的有6人. 导学号
(1)求n的值.
(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析在犯错误的概率不超过0.1的前提下是否可以认为“本次测试的及格情况与性别有关”?
【解析】(1)依题意得b=0.01,
因为成绩在(90,100]内的有6人,
所以n=60.
(2)由于2b=a+c,而b=0.01,可得a+c=0.02,
则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,
于是本次测试的及格情况与性别的2×2列联表如下:
及格
不及格
总计
男
22
8
30
女
26
4
30
总计
48
12
60
结合列联表计算可得K2的观测值k≈1.667<2.706,
故在犯错误的概率不超过0.1的前提下不能认为“本次测试的及格情况与性别有关”.
【变式备选】
某养鸡场为检验某种药物预防某种疾病的效果,取100只鸡进行对比试验,得到如下列联表(表中部分数据丢失,a,b,d,e,f,g表示丢失的数据):
患病
未患病
总计
未服用药
a
b
50
服用药
15
d
g
总计
e
f
100
工作人员记得2a=3b.
(1)求出列联表中数据a,b,d,e,f,g的值.
(2)能否在犯错误的概率不超过0.005的前提下认为药物有效?
【解析】(1)因为a+b=50,2a=3b.
所以a=30,b=20.
由50+g=100,15+d=g,得g=50,d=35.
所以,e=a+15=45,f=b+d=55.
(2)由(1)可得
K2的观测值k=≈9.091>7.879.
因此,在犯错误的概率不超过0.005的前提下认为药物有效.
10.(2018·重庆模拟)第96届(春季)全国糖酒商品交易会于2018年3月23日至25日在四川举办,
展馆附近一家四川特色小吃店为了研究参会人数与本店所需原材料数量的关系,在交易会前查阅了最近5次交易会的参会人数x(万人)与店铺所用原材料数量y(袋),得到如下数据:
第一次
第二次
第三次
第四次
第五次
参会人数
x/万人
11
9
8
10
12
原材料
y/袋
28
23
20
25
29
(1)请根据所给五组数据,求出y关于x的线性回归方程=x+.
(2)若该店现有原材料12袋,据悉本次交易会大约有13万人参加,为了保证原材料能够满足需要,则该店应至少再补充原材料多少袋?
(参考公式: = = ,=-)
【解析】(1)由数据,求得==10,
==25,
(xi-)(yi-)=1×3+(-1)×(-2)+
(-2)×(-5)+0+2×4=23,
(xi-)2=12+(-1)2+(-2)2+02+22=10,
由公式,求得=2.3, =-·=2,
y关于x的线性回归方程为=2.3x+2.
(2)由x=13,得=31.9,
而31.9-12=19.9≈20,
所以,该店应至少再补充原材料20袋.
【变式备选】
为了研究男羽毛球运动员的身高x(单位:cm)与体重y(单位:kg)的关系,通过随机抽样的方法,抽取5名运动员测得他们的身高与体重关系如下表:
身高(x)
172
174
176
178
180
体重(y)
74
73
76
75
77
(1)从这5个人中随机地抽取2个人,求这2个人体重之差的绝对值不小于2 kg的概率.
(2)求回归直线方程=x+.
【解析】(1)从这5个人中随机地抽取2个人的体重的基本事件有(74,73),(74,76),(74,75),(74,77),(73,76),(73,75),(73,77),(76,75),(76,77),(75,77).
满足条件的有(74,76),(74,77),(73,76),(73,75),(73,77),(75,77)6种情况,故2个人体重之差的绝对值不小于2 kg的概率为=.
(2)=176,=75,
xi-
-4
-2
0
2
4
yi-
-1
-2
1
0
2
=
=
=0.4,
=-=4.6,所以=0.4x+4.6.
(20分钟 40分)
1.(5分)已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的
是 ( )
A. >b′, >a′ B. >b′, a′ D. a′.
2.(5分)(2019·汕头模拟)某厂家为了解销售轿车台数与广告宣传费之间的关系,得到如表统计数据表:根据数据表可得回归直线方程=x+,其中=2.4, =-,据此模型预测广告费用为9万元时,销售轿车台数为 ( )
广告费用x/万元
2
3
4
5
6
销售轿车y/台
3
4
6
10
12
A.17 B.18 C.19 D.20
【解析】选C.根据表中数据,计算
=×(2+3+4+5+6)=4,
=×(3+4+6+10+12)=7,
且回归直线方程为=2.4x+,
所以=-=7-2.4×4=-2.6,
所以回归方程为=2.4x-2.6;
当x=9时,=2.4×9-2.6=19,
即据此模型预测广告费用为9万元时,销售轿车台数为19.
3.(5分)已知回归直线斜率的估计值为1.23,样本点的中心为点(4,5),则回归直线的方程为________.
【解析】回归直线必过点(4,5),
所以y-5=1.23(x-4),
所以=1.23x+0.08.
答案:=1.23x+0.08
【变式备选】
已知回归直线方程为=4.4x+838.19,则可估计x与y增长速度之比约为________.
【解析】x与y增长速度之比为=.
答案:
4.(12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,
再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图. 导学号
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断在犯错误的概率不超过0.1的前提下能否认为“生产能手与工人所在的年龄组有关”.
【解析】(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.
所以,在样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2), (A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),故所求的概率P=.
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:
生产能手
非生产能手
总计
25周岁以上组
15
45
60
25周岁以下组
15
25
40
总计
30
70
100
所以K2=
=≈1.79,因为1.79<2.706,
所以在犯错误的概率不超过0.1的前提下不能认为“生产能手与工人所在的年龄组有关”.
5.(13分)某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试.测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子完全停下所需要的距离).无酒状态与酒后状态下的试验数据分别列于表1和表2. 导学号
表1:无酒状态
停车距
离d/米
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
频数
26
m
n
8
2
表2:酒后状态
平均每毫升血液酒精含量x/毫克
10
30
50
70
90
平均停车距离y/米
30
50
60
70
90
已知表1数据的中位数估计值为26,回答以下问题.
(1)求m,n的值,并估计驾驶员无酒状态下停车距离的平均数.
(2)根据最小二乘法,由表2的数据计算y关于x的回归方程=x+.
(3)该测试团队认为:驾驶员酒后驾车的平均“停车距离”y大于(1)中无酒状态下的停车距离平均数的3倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?
【解析】(1)依题意,得m=50-26,解得m=40,
又m+n+36=100,解得n=24.
故停车距离的平均数为
15×+25×+35×+45×+55×=27.
(2)依题意,可知=50,=60,
xiyi=10×30+30×50+50×60+70×70+90×90=17 800,
=102+302+502+702+902=16 500,
所以==0.7,
=60-0.7×50=25,
所以回归直线方程为=0.7x+25.
(3)由(1)知当y>81时认定驾驶员是“醉驾”.令>81,得0.7x+25>81,解得x>80,
当每毫升血液酒精含量大于80毫克时认定为“醉驾”.
【变式备选】
为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩.
数学
88
83
117
92
108
100
112
物理
94
91
108
96
104
101
106
(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明.
(2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.
【解析】(1)=100+=100;
=100+=100;
因为==142,=,
所以>,所以物理成绩更稳定.
(2)由于x与y之间具有线性相关关系,
所以==0.5, =100-0.5×100=50,
所以线性回归方程为=0.5x+50.
当=115时,x=130.
建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.
相关文档
- 高考文科数学(北师大版)专题复习课件2021-06-1237页
- 北师大版数学选修1-2练习:综合学习2021-06-126页
- 【数学】2021届一轮复习北师大版(理2021-06-129页
- 【数学】2021届一轮复习北师大版(文2021-06-1215页
- 【数学】2019届理科一轮复习北师大2021-06-128页
- 【数学】2019届高考一轮复习北师大2021-06-1213页
- 高考数学一轮复习第三章导数及其应2021-06-129页
- 2021版高考数学一轮复习第八章数列2021-06-1222页
- 北师大版数学选修1-2练习(第1章)统计2021-06-127页
- 2021高考数学一轮复习第9章平面解2021-06-129页