- 131.50 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
课时作业60 变量间的相关关系与统计案例
[基础达标]
一、选择题
1.[2020·河南濮阳摸底]根据如表数据,得到的回归方程为=x+9,则=( )
x
4
5
6
7
8
y
5
4
3
2
1
A.2 B.1
C.0 D.-1
解析:由题意可得=×(4+5+6+7+8)=6,=×(5+4+3+2+1)=3,因为回归方程为=x+9且回归直线过点(6,3),所以3=6+9,解得=-1,故选D.
答案:D
2.[2019·石家庄模拟]下列说法错误的是( )
A.回归直线过样本点的中心(,)
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C.对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小
D.在回归直线方程=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位
解析:本题考查命题真假的判断.根据相关定义分析知A,B,D正确;C中对分类变量X与Y的随机变量K2的观测值k来说,k越大,判断“X与Y有关系”的把握程度越大,故C错误,故选C.
答案:C
3.[2019·河南洛阳尖子生第二次联考]已知x与y之间的一组数据如表:
x
0
1
2
3
y
m
3
5.5
7
已求得y关于x的线性回归方程为=2.1x+0.85,则m的值为( )
A.1 B.0.85
C.0.7 D.0.5
解析:==1.5,==,因为点(,)在回归直线上,所以=2.1×1.5+0.85,解得m=0.5,故选D.
答案:D
4.[2020·宁夏银川一中月考]利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问110名不同的大学生是否爱好该项运动,得到2×2列联表,并计算可得K2≈8.806.
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
参照临界值表,得到的正确结论是( )
A.有99.5%以上的把握认为“是否爱好该项运动与性别无关”
B.有99.5%以上的把握认为“是否爱好该项运动与性别有关”
C.在犯错误的概率不超过0.05%的前提下,认为“是否爱好该项运动与性别有关”
D.在犯错误的概率不超过0.05%的前提下,认为“是否爱好该项运动与性别无关”
解析:由于8.806>7.879,所以根据独立性检验的知识可知有99.5%以上的把握认为“是否爱好该项运动与性别有关”,故选B.
答案:B
5.[2019·辽宁沈阳市郊联体期末]下列四个命题中正确的是( )
A.由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,若某人数学成绩优秀,则他的物理成绩一定优秀
B.两个随机变量相关性越强,则相关系数的绝对值越接近于0
C.在线性回归方程=0.2x+12中,当变量x每增加1个单位时,变量增加0.2个单位
D.线性回归方程对应的直线=x+至少经过其样本数据点中的一个点
解析:由独立性检验可知,他的物理成绩不一定优秀,故A错误;两个随机变量相关性越强,则相关系数的绝对值越接近于1,故B错误;线性回归方程对应的直线=x+可能不经过其样本数据点中的任何点,故D错误;易知C正确.故选C.
答案:C
二、填空题
6.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得如下实验数据,计算得回归直线方程为=0.85x-0.25.由以上信息,得到下表中c的值为________.
天数x/天
3
4
5
6
7
繁殖个数y/千个
2.5
3
4
4.5
c
解析:==5,==,代入回归直线方程中得:=0.85×5-0.25,解得c=6.
答案:6
7.某校某次数学考试规定80分以上(含80分)为优分,在1 000名考生中随机抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:
优分
非优分
总计
男生
15
45
60
女生
15
25
40
总计
30
70
100
为了研究数学成绩与性别是否有关,采用独立检验的方法进行数据处理,则正确的结论是________.
附表及公式
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
K2=.
解析:k2=≈1.79,
因为1.79<2.706,
所以没有90%以上的把握认为“数学成绩与性别有关”.
答案:没有90%以上的把握认为“数学成绩与性别有关”
8.[2020·广东肇庆联考]某汽车4S店销售甲品牌A型汽车,在2019年元旦期间,进行了降价促销活动,根据以往数据统计,该型汽车的价格与月销售量之间有如下关系:
价格/万元
25
23.5
22
20.5
月销售量/辆
30
33
36
39
已知A型汽车的月销售量y(辆)与价格x(万元)符合线性回归方程=x+80.若A型汽车价格降到19万元,则预测它的月销售量是________辆.
解析:由题意可得==22.75,==34.5,代入回归方程,计算并得到=-2,所以=-2+80,当=19时,=42.
答案:42
三、解答题
9.某公司的科研人员在7块并排、形状和大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图;
(2)判断施化肥量x与产量y是否具有相关关系.
解析:(1)散点图如图所示:
(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.
10.[2020·甘肃张掖质检]某城市环保部门随机抽取2018年(365天)内100天的空气污染指数API的监测数据,结果统计如下:
API
[0,50]
[51,100]
[101,150]
[151,200]
[201,300]
>300
空气
质量
优
良
轻微
污染
轻度
污染
中度
重污染
重度
污染
天数
4
13
18
30
20
15
记某企业每天因为空气污染造成的经济损失为S(单位:元),设空气污染指数API为ω.当API在[0,100]内时,对该企业不会造成经济损失;当API在[101,300]内时,对该企业造成的经济损失呈线性关系(当API为150时,造成的经济损失为500元,当API为200时,造成的经济损失为700元);当API大于300时,造成的经济损失为2 000元.
(1)试写出S的表达式;
(2)在该年内随机抽取一天,试估计该天因为空气污染造成的经济损失S大于200元且不超过600元的概率;
(3)若本次抽取的100天中有30天是在供暖季,其中有8天为重度污染,完成下面的2×2列联表,并判断能否有95%的把握认为该城市该年空气重度污染与供暖有关.
非重度污染
重度污染
合计
供暖季
非供暖季
合计
100
附:K2=,n=a+b+c+d.
P(K2≥k0)
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解析:(1)由题意知,S=
(2)设“在该年内随机抽取一天,该天因为空气污染造成的经济损失大于200元且不超过600元”为事件A.
由200<S≤600,得101≤ω≤175,频数约为33,
∴P(A)=.
(3)根据题中数据,得到的2×2列联表如下,
非重度污染
重度污染
合计
供暖季
22
8
30
非供暖季
63
7
70
合计
85
15
100
k2=≈4.575>3.841,
所以有95%的把握认为该城市该年空气重度污染与供暖有关.
[能力挑战]
11.[2017·全国卷Ⅰ]为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得=i=9.97,s= =≈
0.212, ≈18.439,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:样本(xi,yi)(i=1,2,…,n)的相关系数r=, ≈0.09.
解析:(1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数
r=
≈≈-0.18.
由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)(ⅰ)由于=9.97,s≈0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(-3s,+3s)以外,因此需对当天的生产过程进行检查.
(ⅱ)剔除离群值,即第13个数据,剩下数据的平均数为
(16×9.97-9.22)=10.02,
这条生产线当天生产的零件尺寸的均值的估计值为10.02.
i≈16×0.2122+16×9.972≈1 591.134,
剔除第13个数据,剩下数据的样本方差为
(1 591.134-9.222-15×10.022)≈0.008,
这条生产线当天生产的零件尺寸的标准差的估计值为≈0.09.