- 82.36 KB
- 2021-06-17 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
课时分层训练(六十一) 变量间的相关关系与统计案例
(对应学生用书第320页)
A组 基础达标
一、选择题
1.如图942对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )
(1) (2)
图942
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
C [由题图(1)可知y随x的增大而减小,各点整体呈下降趋势,故变量x与y负相关,由题图(2)知v随u的增大而增大,各点整体呈上升趋势,故变量v与u正相关.]
2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且y=2.347x-6.423;
②y与x负相关且y=-3.476x+5.648;
③y与x正相关且y=5.437x+8.493;
④y与x正相关且y=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①② B.②③
C.③④ D.①④
D [由回归直线方程y=bx+a,知当b>0时,y与x正相关;当b<0时,y与x负相关.所以①④一定错误.故选D.]
3.(2018·石家庄一模)下列说法错误的是( )
A.回归直线过样本点的中心(,)
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C.对分类变量X与Y,随机变量χ2的观测值k越大,则判断“X与Y有关系”的把握程度越小
D.在回归直线方程y=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量y平均增加0.2个单位
C [根据相关定义分析知A,B,D正确;C中对分类变量X与Y的随机变量χ2的观测值k来说,k越大,判断“X与Y有关系”的把握程度越大,故C错误,故选C.]
4.(2017·山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设其回归直线方程为y=bx+a.已知xi=225,yi=1 600,b=4.该班某学生的脚长为24,据此估计其身高为( )
【导学号:79140334】
A.160 B.163
C.166 D.170
C [∵xi=225,∴=xi=22.5.
∵vyi=1 600,∴=yi=160.
又b=4,∴a=-b=160-4×22.5=70.
∴回归直线方程为y=4x+70.
将x=24代入上式得y=4×24+70=166.
故选C.]
5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由χ2=,
算得χ2=≈7.8.
附表:
P(χ2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
C [根据独立性检验的定义,由χ2≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”.]
二、填空题
6.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y=0.67x+54.9.
零件数x(个)
10
20
30
40
50
加工时间y(min)
62
75
81
89
现发现表中有一个数据看不清,请你推断出该数据的值为________.
68 [由=30,得=0.67×30+54.9=75.
设表中的“模糊数字”为a,
则62+a+75+81+89=75×5,即a=68.]
7.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.
① [χ2=3.918≥3.841,而P(χ2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.]
8.(2017·长沙雅礼中学质检)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得回归直线方程y=bx+a中的b=-2,预测当气温为-4 ℃时,用电量为________度.
68 [根据题意知==10,==40,因为回归直线过样本点的中心,所以a=40-(-2)×10=60,所以当x=-4时,y=(-2)×(-4)+60=68,所以用电量为68度.]
三、解答题
9.(2018·合肥二检)某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查.现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.
【导学号:79140335】
(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?
(2)根据抽取的180名学生的调查结果,完成下面的2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?
选择自然科学类
选择社会科学类
总计
男生
女生
总计
附:χ2=,其中n=a+b+c+d.
P(χ2≥k0)
0.500
0.400
0.250
0.150
0.100
0.050
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
[解] (1)从高一年级学生中随机抽取1人,抽到男生的概率约为=.
(2)根据统计数据,可得2×2列联表如下:
选择自然科学类
选择社会科学类
总计
男生
60
45
105
女生
30
45
75
总计
90
90
180
则χ2==≈5.142 9>5.024,
所以能在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关.
10.(2016·全国卷Ⅲ)如图943是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
图943
注:年份代码1-7分别对应年份2008-2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注
参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646.
参考公式:相关系数r=,回归方程y=a+bt中斜率和截距的最小二乘估计公式分别为b=,a=-b.
[解] (1)由折线图中的数据和附注中的参考数据得
=4,(ti-)2=28,=0.55,
(ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,
r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1)得
b==≈0.103,
a=-b≈1.331-0.103×4≈0.92.
所以y关于t的回归方程为y=0.92+0.10t.
将2016年对应的t=9代入回归方程得y=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.
B组 能力提升
11.下列说法错误的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
B [根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据拟合程度好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好;二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C,D正确,故选B.]
12.2017年9月18日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:
价格x
9
9.5
m
10.5
11
销售量y
11
n
8
6
5
由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是y=-3.2x+40,且m+n=20,则其中的n=________.
【导学号:79140336】
10 [==8+,==6+,回归直线一定经过样本中心(,),即6+=-3.2+40,
即3.2m+n=42.
又因为m+n=20,即解得故n=10.]
13.(2018·东北三省三校二联)下表数据为某地区某种农产品的年产量x(单位:吨)及对应销售价格y(单位:千元/吨).
x
1
2
3
4
5
y
70
65
55
38
22
(1)若y与x有较强的线性相关关系,根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(2)若每吨该农产品的成本为13.1千元,假设该农产品可全部卖出,预测当年产量为多少吨时,年利润Z最大?参考公式:
[解] (1)∵==3,
==50,
xiyi=1×70+2×65+3×55+4×38+5×22=627,
x=1+4+9+16+25=55,
根据公式解得b=-12.3,
a=50+12.3×3=86.9,
∴y=-12.3x+86.9.
(2)∵年利润Z=x(86.9-12.3x)-13.1x=-12.3x2+73.8x=-12.3(x-3)2+110.7,
∴当x=3时,年利润Z最大.