- 314.00 KB
- 2021-06-19 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
- 1 -
[练案 73]第三讲 变量间的相关关系、统计案例
A 组基础巩固
一、单选题
1.观察下列各图形,
其中两个变量 x,y 具有相关关系的图是( C )
A.①② B.①④
C.③④ D.②③
[解析] 由散点图知③中的点都分布在一条直线附近.④中的点都分布在一条曲线附近,
所以③④中的两个变量具有相关关系.
2.(2019·广西柳州模拟)根据如下样本数据
x 3 4 5 6 7 8
y 4.0 2.5 -0.5 0.5 -2.0 -3.0
得到了回归方程 y^
=bx+a,则( C )
A.a>0,b>0 B.a<0,b>0
C.a>0,b<0 D.a<0,b<0
[解析] 由表格数据可知 y 与 x 是负相关关系,所以 b<0,且当 x=0 时,y>0,所以
a>0,故选 C.
3.(2019·山东师大附中模拟)为了规定工时定额,需要确定加工零件所花费的时间,为
此进行了 5 次试验,得到 5 组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),根据
收集到的数据可知 x1+x2+x3+x4+x5=150,由最小二乘法求得回归直线方程为 y^
=0.67x+
24.9,则 y1+y2+y3+y4+y5=( C )
A.45 B.125.4
C.225 D.350.4
[解析] 因为 x1+x2+x3+x4+x5=150,所以x=
x1+x2+x3+x4+x5
5 =
150
5 =30.又因为
(30,y)在回归直线y
^
=0.67x+24.9 上,将(30,y)代入y
^
=0.67x+24.9,可求得y=45=
y1+y2+y3+y4+y5
5 ,所以 y1+y2+y3+y4+y5=225,故选 C.
4.(2020·西北狼联盟质检)广告投入对商品的销售额有较大影响,某电商对连续 5 个年
- 2 -
度的广告费 x 和销售额 y 进行统计,得到统计数据如下表(单位:万元)
广告费 x 2 3 4 5 6
销售额 y 29 41 50 59 71
由上表可得回归方程y
^
=10.2x+a
^
,据此模型,预测广告费为 10 万元时销售额约为
( B )
A.118.2 万元 B.111.2 万元
C.108.8 万元 D.101.2 万元
[解析] 由表格中数据可得,x=4,y=50,
∴50=4×10.2+a
^
,解得a
^
=9.2,
∴回归方程为y
^
=10.2x+9.2,
∴当 x=10 时,y
^
=10.2×10+9.2=111.2,
即预测广告费 10 万元时销售额约为 111.2,故选 B.
5.(2019·沧州七校联考)通过随机询问 200 名性别不同的大学生是否爱好踢毽子运动,
计算得到统计量 K2 的观测值 k≈4.892,参照附表,得到的正确结论是( C )
P(K2≥k) 0.10 0.05 0.025
k 2.706 3.841 5.024
A.有 97.5%以上的把握认为“爱好该项运动与性别有关”
B.有 97.5%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过 5%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过 5%的前提下,认为“爱好该项运动与性别无关”
6.(2019·河南商丘)某医疗所为了检查新开发的流感疫苗对甲型 H1N1 流感的预防作用,
把 1 000 名注射疫苗的人与另外 1 000 名未注射疫苗的人半年的感冒记录作比较,提出假设 H0:
“这种疫苗不能起到预防甲型 H1N1 流感的作用”,并计算得P(K2≥6.635)≈0.01,则下列说
法正确的是( C )
A.这种疫苗能起到预防甲型 H1N1 流感的有效率为 1%
B.若某人未使用疫苗则他在半年中有 99%的可能性得甲型 H1N1 流感
C.有 99%的把握认为“这种疫苗能起到预防甲型 H1N1 流感的作用”
D.有 1%的把握认为“这种疫苗能起到预防甲型 H1N1 流感的作用”
[解析] 因为 P(K2≥6.635)≈0.01,这说明假设不合理的程度为 99%,即这种疫苗不能起
到预防甲型 H1N1 流感的作用不合理的程度约为 99%,所以有 99%的把握认为“这种疫苗能起
到预防甲型 H1N1 流感的作用”,故选 C.
7.(2020·吉林省吉林市调研)对两个变量进行回归分析,给出如下一组样本数据:(0.675,
- 3 -
-0.989),(1.102,-0.010),(2.899,1.024),(9.101,2.978),下列函数模型中拟合较好
的是( D )
A.y=3x B.y=3x
C.y=-(x-1)2 D.y=log3x
[解析] 如图,作出 A,B,C,D 中四个函数图象,
同时描出题中的四个点,它们在曲线 y=log3x 的两侧,与其他三个曲线都离得很远,因
此 D 是正确选项,故选 D.
二、多选题
8.某车间为了规划生产进度提高生产效率,记录了不同时段生产零件个数 x(单位:百个)
与相应加工总时长 y(单位:小时)的几组对应数据,根据表中提供的数据,求出 y 关于 x 的线
性回归方程为 y^
=0.7x+0.05,则下列结论正确的是( ABC )
x 2 3 4 5
y 1.5 2 m 3.5
A.加工总时长与生产零件数呈正相关
B.该回归直线一定过点(3.5,2.5)
C.零件每增加 1 百个,相应加工总时长约增加 0.7 小时
D.m 的值是 2.85
[解析] 依题意,对于 A,注意到 0.7>0,因此加工总时长与生产零件数呈正相关,选项
A 正确;对于 B,当 x=3.5 时,y=0.7×3.5+0.05=2.5,因此回归直线一定过点(3.5,2.5),
选项 B 正确;对于 C,易知零件每增加 1 百个,相应加工总时长约增加 0.7 小时,因此选项 C
正确;回归直线必过样本点的中心,x=
2+3+4+5
4 =3.5,于是有y=
1.5+2+m+3.5
4 =2.5,
由此解得 m=3,因此选项 D 不正确.故选 A、B、C.
9.(2020·山东日照联考)某大学进行自主招生测试,需要对逻辑思维和阅读表达进行能
力测试.学校对参加测试的 200 名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩
进行了排名.其中甲、乙、丙三位同学的排名情况如图所示,下列叙述正确的是( AC )
- 4 -
A.甲同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前
B.乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前
C.甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前
D.甲同学的总成绩排名比丙同学的总成绩排名更靠前
[解析] 根据图示,可得甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前,
他的阅读表达成绩排名靠后.故选 AC.
10.(2020·山东烟台期末)某大学为了解学生对学校食堂服务的满意度,随机调查了 50
名男生和 50 名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如图所示的列联
表.经计算 K2 的观测值 k≈4.762,则可以推断出( ACD )
满意 不满意
男 30 20
女 40 10
P(k2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
A.该学校男生对食堂服务满意的概率的估计值为
3
5
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.有 95%的把握认为男、女生对该食堂服务的评价有差异
D.在犯错概率不超过 5%的前提下认为男、女生对该食堂服务的评价有差异
[ 解 析 ] 由 表 易 知 男 生 比 女 生 对 食 堂 服 务 满 意 率 低 , 故 B 错 , 又 K2 =
100 × 30 × 10-40 × 202
70 × 30 × 50 × 50 ≈4.8>3.841,∴ACD 正确.
三、填空题
11.关于独立性检测,K2 越大,则“X 与 Y 有关系”这种判断犯错的概率__越小__.
12.(2019·吉林市五地六校适应性考试)公司对 2019 年 1~4 月份的获利情况进行了数
据统计,如下表所示:
月份 x 1 2 3 4
- 5 -
利润 y/万元 5 6 6.5 8
利用线性回归分析思想,预测出 2019 年 8 月份的利润为 11.6 万元,则 y 关于 x 的线性
回归方程为 y^
=0.95x+4 .
[解析] 设线性回归方程为 y^
=b
^
x+ a^
,
因为 x-
=
5
2, y-
=
51
8 ,
由题意可得Error!,解得b
^
=0.95, a^
=4,
即 y^
=0.95x+4.故答案为 y^
=0.95x+4.
四、解答题
13.(2020·唐山模拟)随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网
站为增加收入,促销策略越来越多样化,促销费用也不断增加,下表是某购物网站 2017 年 1-
8 月促销费用 x(万元)和产品销量 y(万件)的具体数据.
月份 1 2 3 4 5 6 7 8
促销费用 x 2 3 6 10 13 21 15 18
产品销量 y 1 1 2 3 3.5 5 4 4.5
(1)根据数据绘制的散点图能够看出可用线性回归模型拟合 y 与 x 的关系,请用相关系数
r 加以说明;(系数精确到 0.001)
(2)建立 y 关于 x 的回归方程 y^
=b
^
x+ a^
(系数精确到 0.01),如果该公司计划在 9 月份实
现产品销量超 6 万件,预测至少需投入促销费用多少万元.(结果精确到 0.01)
参考数据: ∑
8
i=1 (xi-11)(yi-3)=74.5, ∑
8
i=1 (xi-11)2=340, ∑
8
i=1 (yi-3)2=16.5,
340≈18.44, 16.5=4.06,其中 xi,yi 分别为第 i 个月的促销费用和产品销量,i=
1,2,3,…,8.
参 考 公 式 : (i) 样 本 (xi , yi)(i = 1,2 , … , n) 的 相 关 系 数 r =
∑
n
i=1 xi-xyi-y
∑
n
i=1 xi-x2 ∑
n
i=1 yi-y2
.
(ii)对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程 y^
=b
^
x+ a^
的斜率和
截距的最小二乘估计分别为b
^
=
∑
n
i=1 xi-xyi-y
∑
n
i=1 xi-x2
, a^
=y-b
^
x-
.
- 6 -
[解析] (1)由题可知 x-
=11, y-
=3,
将数据代入 r=
∑
n
i=1 xi-xyi-y
∑
n
i=1 xi-x2 ∑
n
i=1 yi-y2
,
得 r≈
74.5
18.44 × 4.06=
74.5
74.866 4≈0.995.
因为 y 与 x 的相关系数近似为 0.995,说明 y 与 x 的线性相关性很强,从而可以用线性回
归模型拟合 y 与 x 的关系.(需要突出“很强”,“一般”或“较弱”不给分)
(2)将数据代入b
^
=
∑
n
i=1 xi-xyi-y
∑
n
i=1 xi-x2
,
得b
^
=
74.5
340 =0.219,
a^
=y-b
^
x-
=3-0.219×11≈0.59,
所以 y 关于 x 的回归方程为 y^
=0.22x+0.59.
由 y^
=0.22x+0.59>6,解得 x>24.59,
即至少需要投入促销费用 24.59 万元.
14.(2020·山东潍坊期末)读书可以使人保持思想活力,让人得到智慧启发,让人滋养
浩然正气.书籍是文化的重要载体.读书是承继文化的重要方式.某地区为了解学生课余时
间的读书情况.随机抽取了 n 名学生进行调查,根据调查得到的学生日均课余读书时间绘制
成如图所示的频率分布直方图,将日均课余读书时间不低于 40 分钟的学生称为“读书之星”,
日均课余读书时间低于 40 分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书
时间低于 10 分钟的有 10 人.
(1)求 n,p 的值;
(2)根据已知条件完成下面的 2×2 列联表,并判断是否有 95%以上的把握认为“读书之星”
与性别有关?
- 7 -
非读书之星 读书之星 总计
男
女 10 55
总计
(3)将上述调查所得到的频率视为概率,现从该地区大量学生中,随机抽取 3 名学生,每
次抽取 1 名,已知每个人是否被抽到互不影响,记被抽取的“读书之星”人数为随机变量 X,
求 X 的分布列和期望 E(X).
附:K2=
nad-bc2
a+bc+da+cb+d,其中 n=a+b+c+d.
P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
[解析] (1)由频率分布直方图可知,p=0.01,
所以 n=
10
0.1=100.
(2)因为 n=100,
所以“读书之星”有 100×0.25=25,
从而 2×2 列联表如下图所示:
非读书之星 读书之星 总计
男 30 15 45
女 45 10 55
总计 75 25 100
将 2×2 列联表中的数据代入公式计算得
K2=
100 × 30 × 10-15 × 452
45 × 55 × 75 × 25 =
100
33 ≈3.030,
因为 3.030<3.841,所以没有 95%以上的把握认为“读书之星”与性别有关.
(3)将频率视为概率,即从该地区学生中抽取一名学生是“读书之星”的概率为
1
4,
由题意可知 X~B(3,
1
4),
所以 P(X=0)=C03(
1
4)0×(1-
1
4)3=
27
64,
P(X=1)=C13×
1
4×(1-
1
4)2=
27
64,
P(X=2)=C23(
1
4)2×(1-
1
4)=
9
64,
P(X=3)=C33×(
1
4)3=
1
64,
- 8 -
所以 X 的分布列为
X 0 1 2 3
P 27
64
27
64
9
64
1
64
故 E(X)=3×
1
4=
3
4.
B 组能力提升
1.(2020·西安模拟)以模型 y=cekx 去拟合一组数据时,为了求出回归方程,则 z=ln
y,其变换后得到线性回归方程 z=0.3x+4,则 c=( D )
A.0.3 B.e0.3
C.4 D.e4
[解析] z=ln y=ln(cekx)=ln c+kx,因为 z=0.3x+4,所以 ln c=4,则 c=e4.故选
D.
2.(2019·湖南师大附中模拟)在西非肆虐的“埃博拉病毒”的传播速度很快,已经成为
全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取 100 只小鼠进行试验,得
到如下列联表:
感染 未感染 总计
服用 10 40 50
未服用 20 30 50
总计 30 70 100
参考公式:K2=
nad-bc2
a+bc+da+cb+d
P(K2>k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
参照附表,在犯错误的概率最多不超过 5% (填百分比)的前提下,可认为“该种疫苗
有预防埃博拉病毒感染的效果”.
[解析] 由题意可得,K2=
100 × 10 × 30-20 × 402
50 × 50 × 30 × 70 ≈4.762>3.841,参照附表
可得,在犯错误的概率不超过 5%的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效
果”.
3.(2019·赣州模拟)在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若
所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-
1
3附近波动,经计算 ∑
6
i=1xi=11, ∑
6
i=1yi=
13, ∑
6
i=1x2i=21,则实数 b 的值为
5
7 .
- 9 -
[解析] 令 t=x2,则曲线的回归方程变为线性的回归方程,即 y=bt-
1
3,此时t=
∑
6
i=1x2i
6
=
7
2,y=
∑
6
i=1yi
6 =
13
6 ,代入 y=bt-
1
3,得
13
6 =b×
7
2-
1
3,解得 b=
5
7.
4.(2019·福建龙岩、漳州模拟)某手机厂商在销售 200 万台某型号手机时开展“手机碎
屏险”活动.活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x 元.若
在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这 200 万台该型号手机全部
销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取 1000 名,每名
用户赠送 1000 元的红包.为了合理确定保费 x 的值,该手机厂商进行了问卷调查,统计后得
到下表(其中 y 表示保费为 x 元时愿意购买该“手机碎屏险”的用户比例):
x 10 20 30 40 50
y 0.79 0.59 0.38 0.23 0.01
(1)根据上面的数据求出 y 关于 x 的回归直线方程;
(2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为
0.2%.已知更换一次该型号手机屏幕的费用为 2 000 元,若该手机厂商要求在这次活动中因销
售该“手机碎屏险”产生的利润不少于 70 万元,能否把保费 x 定为 5 元?
参 考 公 式 : 回 归 方 程 y = bx + a 中 斜 率 和 截 距 的 最 小 二 乘 估 计 分 别 为 b
^
=
∑n
i=1
xi- x-
yi- y-
∑n
i=1
xi- x-
2
, a^
= y-
-b
^
x-
.
参考数据:表中 x 的 5 个值从左到右分别记为 x1,x2,x3,x4,x5,相应的 y 值分别记为
y1,y2,y3,y4,y5,经计算有
5
∑
i=1
(xi- x-
)(yi- y-
)=-19.2,
其中 x-
=
1
5
5
∑
i=1
xi, y-
=
1
5
5
∑
i=1
yi.
[解析] (1)由 x-
=30, y-
=0.4,
5
∑
i=1
(xi- x-
)(yi- y-
)=-19.2,
5
∑
i=1
(xi- x-
)2=1 000,
得b
^
=
∑5
i=1
xi- x-
yi- y-
∑5
i=1
xi- x-
2
=-0.019 2,
a^
= y-
-b
^
x-
=0.976,
- 10 -
所以 y 关于 x 的回归直线方程为
y=-0.019 2x+0.976.
(2)能把保费 x 定为 5 元.
理由如下:若保费 x 定为 5 元,则估计
y=-0.019 2×5+0.976=0.88
估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的利润为
2 000 000×0.88×5-2 000 000×0.88×0.2%×2 000-1 000×1 000=0.76×106(元)=
76(万元)>70(万元)
所以能把保费 x 定为 5 元.
5.(2020·百校联盟(全国Ⅰ卷)教质监)为了响应国家号召,某校组织部分学生参与了“垃
圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类,
统计如下所示.
(1)是否有 90%以上的把握认为“性别”与“问卷的结果”有关?
(2)在成绩合格的学生中,利用性别进行分层抽样,共选取 9 人进行座谈,再从这 9 人中
随机抽取 5 人发送奖品,记拿到奖品的男生人数为 X,求 X 的分布列及数学期望 E(X).
不合格 合格
男生 14 16
女生 10 20
参考公式:K2=
nad-bc2
a+bc+da+cb+d,其中 n=a+b+c+d.
参考数据:
P(K2≥k0) 0.10 0.05 0.010 0.001
k0 2.706 3.841 6.635 10.828
[解析] (1)完善列联表如下所示:
不合格 合格
男生 14 16 30
女生 10 20 30
合计 24 36 60
∴K2=
60 × 14 × 20-10 × 162
30 × 30 × 24 × 36 ≈1.111<2.706,
故没有 90%的把握认为“性别”与“问卷的结果”有关.
(2)依题意,成绩合格的男生抽取 4 人,成绩合格的女生抽取 5 人,
故 X 的可能取值为 0,1,2,3,4,
- 11 -
P(X=0)=
C55
C59=
1
126,
P(X=1)=
C45C14
C59 =
20
126=
10
63,
P(X=2)=
C35C24
C59 =
60
126=
10
21,
P(X=3)=
C25C34
C59 =
40
126=
20
63,
P(X=4)=
C15C44
C59 =
5
126,
故 X 的分布列为:
X 0 1 2 3 4
P 1
126
10
63
10
21
20
63
5
126
所以 E(X)=0×
1
126+1×
20
126+2×
60
126+3×
40
126+4×
5
126=
20
9 .
相关文档
- 专题14 统计易错大全-决胜2018年高2021-06-1773页
- 2021版高考文科数学(北师大版)一轮复2021-06-1740页
- 专题21+算法初步、概率统计(二)-20192021-06-1711页
- 浙江专用2021届高考数学一轮复习第2021-06-1722页
- 2020年高中数学第二章统计2021-06-175页
- 高考数学一轮复习精品题集之统计2021-06-1720页
- 2011高考数学专题复习:《变量间的相2021-06-176页
- 专题09+概率与统计-备战2018高考高2021-06-1721页
- 2020届艺术生高考数学二轮复习课时2021-06-174页
- 2019高三数学理北师大版一轮课时分2021-06-1710页