- 106.50 KB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
1
课时作业 69 变量间的相关关系与统计案例
[基础达标]
一、选择题
1.[2020·河南濮阳摸底]根据如表数据,得到的回归方程为y^
= b^
x+9,则 b^
=( )
x 4 5 6 7 8
y 5 4 3 2 1
A.2 B.1
C.0 D.-1
解析:由题意可得x-
=
1
5×(4+5+6+7+8)=6, y-
=
1
5×(5+4+3+2+1)=3,因为回
归方程为 y^
= b^
x+9 且回归直线过点(6,3),所以 3=6 b^
+9,解得 b^
=-1,故选 D.
答案:D
2.[2019·石家庄模拟]下列说法错误的是( )
A.回归直线过样本点的中心( x-
, y-
)
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于 1
C.对分类变量 X 与 Y,随机变量 K2 的观测值 k 越大,则判断“X 与 Y 有关系”的把握
程度越小
D.在回归直线方程 y^
=0.2x+0.8 中,当解释变量 x 每增加 1 个单位时,预报变量 y^
平均增加 0.2 个单位
解析:本题考查命题真假的判断.根据相关定义分析知 A,B,D 正确;C 中对分类变量
X 与 Y 的随机变量 K2 的观测值 k 来说,k 越大,判断“X 与 Y 有关系”的把握程度越大,故
C 错误,故选 C.
答案:C
3.[2019·河南洛阳尖子生第二次联考]已知 x 与 y 之间的一组数据如表:
x 0 1 2 3
y m 3 5.5 7
已求得 y 关于 x 的线性回归方程为 y^
=2.1x+0.85,则 m 的值为( )
A.1 B.0.85
C.0.7 D.0.5
2
解析: x-
=
0+1+2+3
4 =1.5, y-
=
m+3+5.5+7
4 =
m+15.5
4 ,因为点( x-
, y-
)在回归直
线上,所以
m+15.5
4 =2.1×1.5+0.85,解得 m=0.5,故选 D.
答案:D
4.[2020·宁夏银川一中月考]利用独立性检验的方法调查大学生的性别与爱好某项运
动是否有关,通过随机询问 110 名不同的大学生是否爱好该项运动,得到 2×2 列联表,并
计算可得 K2≈8.806.
P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
参照临界值表,得到的正确结论是( )
A.有 99.5%以上的把握认为“是否爱好该项运动与性别无关”
B.有 99.5%以上的把握认为“是否爱好该项运动与性别有关”
C.在犯错误的概率不超过 0.05%的前提下,认为“是否爱好该项运动与性别有关”
D.在犯错误的概率不超过 0.05%的前提下,认为“是否爱好该项运动与性别无关”
解析:由于 8.806>7.879,所以根据独立性检验的知识可知有 99.5%以上的把握认为“是
否爱好该项运动与性别有关”,故选 B.
答案:B
5.[2019·辽宁沈阳市郊联体期末]下列四个命题中正确的是( )
A.由独立性检验可知,有 99%的把握认为物理成绩与数学成绩有关,若某人数学成绩
优秀,则他的物理成绩一定优秀
B.两个随机变量相关性越强,则相关系数的绝对值越接近于 0
C.在线性回归方程 y^
=0.2x+12 中,当变量 x 每增加 1 个单位时,变量 y^
增加 0.2 个
单位
D.线性回归方程对应的直线 y^
= b^
x+ a^
至少经过其样本数据点中的一个点
解析:由独立性检验可知,他的物理成绩不一定优秀,故 A 错误;两个随机变量相关性
越强,则相关系数的绝对值越接近于 1,故 B 错误;线性回归方程对应的直线 y^
= b^
x+ a^
可能不经过其样本数据点中的任何点,故 D 错误;易知 C 正确.故选 C.
答案:C
二、填空题
6.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得如下实验数据,计算得
回归直线方程为 y^
=0.85x-0.25.由以上信息,得到下表中 c 的值为________.
3
天数 x/天 3 4 5 6 7
繁殖个数 y/千个 2.5 3 4 4.5 c
解析: x-
=
3+4+5+6+7
5 =5, y-
=
2.5+3+4+4.5+c
5 =
14+c
5 ,代入回归直线方程中
得:
14+c
5 =0.85×5-0.25,解得 c=6.
答案:6
7.某校某次数学考试规定 80 分以上(含 80 分)为优分,在 1 000 名考生中随机抽取的
100 名学生中,“男生组”中的优分有 15 人,“女生组”中的优分有 15 人,据此可得 2×2
列联表如下:
优分 非优分 总计
男生 15 45 60
女生 15 25 40
总计 30 70 100
为了研究数学成绩与性别是否有关,采用独立检验的方法进行数据处理,则正确的结论
是________.
附表及公式
P(K2≥k0) 0.100 0.050 0.010 0.001
k0 2.706 3.841 6.635 10.828
K2=
nad-bc2
a+bc+da+cb+d.
解析:k2=
100 × 15 × 25-15 × 452
60 × 40 × 30 × 70 ≈1.79,
因为 1.79<2.706,
所以没有 90%以上的把握认为“数学成绩与性别有关”.
答案:没有 90%以上的把握认为“数学成绩与性别有关”
8.[2020·广东肇庆联考]某汽车 4S 店销售甲品牌 A 型汽车,在 2019 年元旦期间,进
行了降价促销活动,根据以往数据统计,该型汽车的价格与月销售量之间有如下关系:
价格/万元 25 23.5 22 20.5
月销售量/辆 30 33 36 39
已知 A 型汽车的月销售量 y(辆)与价格 x(万元)符合线性回归方程 y^
= b^
x+80.若 A 型
4
汽车价格降到 19 万元,则预测它的月销售量是________辆.
解析:由题意可得x=
25+23.5+22+20.5
4 =22.75,y=
30+33+36+39
4 =34.5,代入
回归方程,计算并得到 b^
=-2,所以 y^
=-2 x^
+80,当 x^
=19 时, y^
=42.
答案:42
三、解答题
9.某公司的科研人员在 7 块并排、形状和大小相同的试验田上对某棉花新品种进行施
化肥量 x 对产量 y 影响的试验,得到如下表所示的一组数据(单位:kg):
施化肥量 x 15 20 25 30 35 40 45
棉花产量 y 330 345 365 405 445 450 455
(1)画出散点图;
(2)判断施化肥量 x 与产量 y 是否具有相关关系.
解析:(1)散点图如图所示:
(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量 x 与产量 y 具
有线性相关关系.
10.[2020·甘肃张掖质检]某城市环保部门随机抽取 2018 年(365 天)内 100 天的空气
污染指数 API 的监测数据,结果统计如下:
API [0,50] [51,100] [101,150] [151,200] [201,300] >300
空气
质量
优 良
轻微
污染
轻度
污染
中度
重污染
重度
污染
天数 4 13 18 30 20 15
记某企业每天因为空气污染造成的经济损失为 S(单位:元),设空气污染指数 API 为
ω.当 API 在[0,100]内时,对该企业不会造成经济损失;当 API 在[101,300]内时,对该企
业造成的经济损失呈线性关系(当 API 为 150 时,造成的经济损失为 500 元,当 API 为 200
时,造成的经济损失为 700 元);当 API 大于 300 时,造成的经济损失为 2 000 元.
(1)试写出 S 的表达式;
5
(2)在该年内随机抽取一天,试估计该天因为空气污染造成的经济损失 S 大于 200 元且
不超过 600 元的概率;
(3)若本次抽取的 100 天中有 30 天是在供暖季,其中有 8 天为重度污染,完成下面的
2×2 列联表,并判断能否有 95%的把握认为该城市该年空气重度污染与供暖有关.
非重度污染 重度污染 合计
供暖季
非供暖季
合计 100
附:K2=
nad-bc2
a+bc+da+cb+d,n=a+b+c+d.
P(K2≥k0) 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
解析:(1)由题意知,S=Error!
(2)设“在该年内随机抽取一天,该天因为空气污染造成的经济损失大于 200 元且不超
过 600 元”为事件 A.
由 200<S≤600,得 101≤ω≤175,频数约为 33,
∴P(A)=
33
100.
(3)根据题中数据,得到的 2×2 列联表如下,
非重度污染 重度污染 合计
供暖季 22 8 30
非供暖季 63 7 70
合计 85 15 100
k2=
100 × 22 × 7-63 × 82
85 × 15 × 30 × 70 ≈4.575>3.841,
所以有 95%的把握认为该城市该年空气重度污染与供暖有关.
[能力挑战]
11.[2017·全国卷Ⅰ]为了监控某种零件的一条生产线的生产过程,检验员每隔 30 min
从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽
取的 16 个零件的尺寸:
6
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得x=
1
16
16
∑
i=1
xi=9.97,s= 1
16
16
∑
i=1
xi-x2= 1
16
16
∑
i=1
x 2i-16x2≈0.212,
16
∑
i=1
i-8.52≈18.439,
16
∑
i=1
(xi- x-
)(i-8.5)=-2.78,其中 xi 为抽取的第 i 个零件
的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)的相关系数 r,并回答是否可以认为这一天生产的零件
尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生
产过程的进行而系统地变大或变小);
(2)一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生
产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在( x-
-3s, x-
+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天
生产的零件尺寸的均值与标准差.(精确到 0.01)
附 : 样 本 (xi , yi)(i = 1,2 , … , n) 的 相 关 系 数 r =
∑n
i=1
xi- x-
yi- y-
∑n
i=1
xi-x2 ∑n
i=1
yi- y-
2
, 0.008≈0.09.
解析:(1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数
r=
∑16
i=1
xi- x-
i-8.5
∑16
i=1
xi- x-
2 ∑16
i=1
i-8.52
≈
-2.78
0.212 × 16 × 18.439≈-0.18.
由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大
或变小.
(2)(ⅰ)由于 x-
=9.97,s≈0.212,因此由样本数据可以看出抽取的第 13 个零件的尺寸
在( x-
-3s, x-
+3s)以外,因此需对当天的生产过程进行检查.
(ⅱ)剔除离群值,即第 13 个数据,剩下数据的平均数为
7
1
15(16×9.97-9.22)=10.02,
这条生产线当天生产的零件尺寸的均值的估计值为 10.02.
16
∑
i=1
x2i≈16×0.2122+16×9.972≈1 591.134,
剔除第 13 个数据,剩下数据的样本方差为
1
15(1 591.134-9.222-15×10.022)≈0.008,
这条生产线当天生产的零件尺寸的标准差的估计值为 0.008≈0.09.