- 141.21 KB
- 2021-05-14 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
11.4变量间的相关关系与统计案例
考点一 变量间的相关关系
1.(2015湖北,4,5分)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
答案 C
8.(2015课标Ⅰ,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi-)2
(wi-)2
(xi-)(yi-)
(wi-)(yi-)
46.6
563
6.8
289.8
1.6
1 469
108.8
表中wi=,=wi.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
(i)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ii)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为
=,=- .
解析 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2分)
(2)令w=,先建立y关于w的线性回归方程.
由于===68,
=- =563-68×6.8=100.6,
所以y关于w的线性回归方程为=100.6+68w,
因此y关于x的回归方程为=100.6+68.(6分)
(3)(i)由(2)知,当x=49时,年销售量y的预报值
=100.6+68=576.6,
年利润z的预报值
=576.6×0.2-49=66.32.(9分)
(ii)根据(2)的结果知,年利润z的预报值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以当==6.8,即x=46.24时,取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.(12分)
9.(2015重庆,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程=t+;
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
附:回归方程=t+中,
==-.
解析 (1)列表计算如下:
i
ti
yi
tiyi
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50
15
36
55
120
这里n=5,=ti==3,=yi==7.2.
又ltt=-n=55-5×32=10,lty=tiyi-n =120-5×3×7.2=12,
从而===1.2,=-=7.2-1.2×3=3.6,
故所求回归方程为=1.2t+3.6.
(2) 将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).
2017高考理科数学《变量间的相关关系、统计案例》练习题
[A组 基础演练·能力提升]
一、选择题
1.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是( )
A.三维柱形图 B.二维条形图
C.等高条形图 D.独立性检验
解析:前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.
答案:D
2.(2014年广州调研)已知x,y的取值如下表:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
从所得的散点图分析,y与x线性相关,且=0.95x+,则=( )
A.2.1 B.2.2
C.2.4 D.2.6
解析:由题意得=2,=4.5,将(2,4.5)代入=0.95x+可得=2.6.
答案:D
3.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
解析:由题意知,成绩优秀的学生人数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A,B错误.根据列联表中的数据,得到K2的观测值为k=≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确,选项D错误.
答案:C
4.(2014年通州一模)对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( )
A.由样本数据得到的回归方程=x+必过样本点的中心(,)
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好
D.若变量y和x之间的相关系数r=-0.936 2,则变量y与x之间具有线性相关关系
解析:R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.
答案:C
5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=算得,
K2=≈7.8.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
解析:根据独立性检验的定义,由K2≈7.8>6.635可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.
答案:C
6.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析:∵==3.5(万元),
==42,
又=x+必过(,),∴42=×9.4+,∴=9.1.
∴线性回归方程为=9.4x+9.1,
∴当x=6时,=9.4×6+9.1=65.5(万元).
答案:B
二、填空题
7.(2014年韶关模拟)某市居民2008~2012年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:
年份
2008
2009
2010
2011
2012
收入x
11.5
12.1
13
13.3
15
支出y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.
解析:由中位数的定义知,总体个数为奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.
答案:13 正
8.(2014年甘肃部分示范校模拟)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元.
解析:由题意知0.15(x+1)+0.2-0.15x-0.2=0.15.
答案:0.15
9.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
理科
文科
男
13
10
女
7
20
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.
根据表中数据,得到k=≈4.844.
则认为选修文科与性别有关系出错的可能性为________.
解析:∵K2≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.
答案:5%
三、解答题
10.(2013年高考重庆卷)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,x=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程y=bx+a中,
b=,a=-b,
其中,为样本平均值.线性回归方程也可写为=x+.
解析:(1)由题意知n=10,=xi==8,=yi==2,
又lxx=x-n2=720-10×82=80,
lxy=xiyi-n =184-10×8×2=24,
由此得b===0.3,a=-b=2-0.3×8=-0.4,
故所求线性回归方程为y=0.3x-0.4.
(2)由于变量y的值随x的值增加而增加(b=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).
11.一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:
人数xi
10
15
20
25
30
35
40
件数yi
4
7
12
15
20
23
27
其中i=1,2,3,4,5,6,7.
(1)以每天进店人数为横轴,每天商品销售件数为纵轴,画出散点图;
(2)求回归直线方程.(结果保留到小数点后两位)
(3)预测进店人数为80人时,商品销售的件数.(结果保留整数)
解析:(1)散点图如图.
(2)∵xiyi=3 245,=25,=15.43,x=5 075,7()2=4 375,7 =2 695,
∴=≈0.79,
=-b=-4.32,
∴回归直线方程是=0.79x-4.32.
(3)进店人数为80人时,商品销售的件数y=0.79×80-4.32≈59.
12.(能力提升)(2013年高考福建卷)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
附:2=
P(2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
(注:此公式也可以写成K2=)
解析:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.
所以样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:
生产能手
非生产能手
合计
25周岁以上组
15
45
60
25周岁以下组
15
25
40
合计
30
70
100
所以得K2==
=≈1.79.
因为1.79<2.706,
所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.
[B组 因材施教·备选练习]
1.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程=x+,则“(x0,y0)满足线性回归方程=x+”是“x0=,y0=”的( )
A.充分不必要条件 B.必要不充分条件
C.充要条件 D.既不充分也不必要条件
解析:x0,y0为这10组数据的平均值,又因为线性回归方程=x+必过样本中心点(,),因此(,)一定满足线性回归方程,但满足线性回归方程的数组除了(,)外,可能还有其他样本点.
答案:B
2.(2014年江西重点中学盟校第二次联考)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.
零件数x(个)
10
20
30
40
50
加工时间y(min)
62
75
81
89
现发现表中有一个数据看不清,请你推断出该数据的值为________.
解析:由已知可计算求出=30,而回归直线方程必过点(,),则=0.67×30+54.9=75,设模糊数字为a,则
=75,计算得a=68.
答案:68
3.某超市为了了解热茶的销售量y(单位:杯)与气温x(单位:℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
杯数
24
34
38
64
由表中数据算得线性回归方程=bx+a中的b≈-2,预测当气温为-5 ℃时,热茶销售量为________杯.
解析:根据表格中的数据可得,=×(18+13+10-1)=10,=×(24+34+38+64)=40.
则a=-b=40-(-2)×10=60,故=-2x+60.
当x=-5时,=-2×(-5)+60=70.
答案:70