- 289.00 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
对应学生用书[练案69理][练案64文]
第四讲 变量间的相关关系、统计案例
A组基础巩固
一、选择题
1.观察下列各图形,
其中两个变量x,y具有相关关系的图是( C )
A.①② B.①④
C.③④ D.②③
[解析] 由散点图知③中的点都分布在一条直线附近.④中的点都分布在一条曲线附近,所以③④中的两个变量具有相关关系.
2.某车间为了规划生产进度提高生产效率,记录了不同时段生产零件个数x(单位:百个)与相应加工总时长y(单位:小时)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为=0.7x+0.05,则下列结论错误的是( D )
x
2
3
4
5
y
1.5
2
m
3.5
A.加工总时长与生产零件数呈正相关
B.该回归直线一定过点(3.5,2.5)
C.零件每增加1百个,相应加工总时长约增加0.7小时
D.m的值是2.85
[解析] 依题意,对于A,注意到0.7>0,因此加工总时长与生产零件数呈正相关,选项A正确;对于B,当x=3.5时,y=0.7×3.5+0.05=2.5,因此回归直线一定过点(3.5,2.5),选项B正确;对于C,易知零件每增加1百个,相应加工总时长约增加0.7小时,因此选项C正确;故选D.(事实上回归直线必过样本点的中心,==3.5,于是有==2.5,由此解得m=3,因此选项D不正确.)
3.(2019·广西柳州模拟)根据如下样本数据
X
3
4
5
6
7
8
Y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到了回归方程=bx+a,则( C )
A.a>0,b>0 B.a<0,b>0
C.a>0,b<0 D.a<0,b<0
[解析] 由表格数据可知y与x是负相关关系,所以b<0,且当x=0时,y>0,所以a>0,故选C.
4.(2019·山东师大附中模拟)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),根据收集到的数据可知x1+x2+x3+x4+x5=150,由最小二乘法求得回归直线方程为=0.67x+24.9,则y1+y2+y3+y4+y5=( C )
A.45 B.125.4
C.225 D.350.4
[解析] 因为x1+x2+x3+x4+x5=150,所以===30.又因为(30,)在回归直线 =0.67x+24.9上,将(30,)代入 =0.67x+24.9,可求得=45=,所以y1+y2+y3+y4+y5=225,故选C.
5.(2020·西北狼联盟质检)广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费x和销售额y进行统计,得到统计数据如下表(单位:万元)
广告费x
2
3
4
5
6
销售额y
29
41
50
59
71
由上表可得回归方程 =10.2x+,据此模型,预测广告费为10万元时销售额约为( B )
A.118.2万元 B.111.2万元
C.108.8万元 D.101.2万元
[解析] 由表格中数据可得,=4,=50,
∴50=4×10.2+ ,解得 =9.2,
∴回归方程为 =10.2x+9.2,
∴当x=10时, =10.2×10+9.2=111.2,
即预测广告费10万元时销售额约为111.2,故选B.
6.(2019·沧州七校联考)通过随机询问200名性别不同的大学生是否爱好踢毽子运动,计算得到统计量K2的观测值k≈4.892,参照附表,得到的正确结论是( C )
P(K2≥k)
0.10
0.05
0.025
k
2.706
3.841
5.024
A.有97.5%以上的把握认为“爱好该项运动与性别有关”
B.有97.5%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”
7.(2019·河南商丘)某医疗所为了检查新开发的流感疫苗对甲型H1N1流感的预防作用,把1 000名注射疫苗的人与另外1 000名未注射疫苗的人半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算得P(K2≥6.635)≈0.01,则下列说法正确的是( C )
A.这种疫苗能起到预防甲型H1N1流感的有效率为1%
B.若某人未使用疫苗则他在半年中有99%的可能性得甲型H1N1流感
C.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”
D.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”
[解析] 因为P(K2≥6.635)≈0.01,这说明假设不合理的程度为99%,即这种疫苗不能起到预防甲型H1N1流感的作用不合理的程度约为99%,所以有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”,故选C.
8.(2019·广西柳州模拟)如图记录了一种叫万年松的树生长时间t(年)与树高y(m)之间的散点图.请你据此判断,拟合这种树生长的年数与树高的关系式,选择的函数模型是好的是( B )
A.y=2t B.y=log2t
C.y=t3 D.y=2t2
二、填空题
9.(2019·北京模拟)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.
从这次考试成绩看,
①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是乙 ;
②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是数学 .
[解析] 由高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况的散点图可知①在甲、乙丙人中,其语文成绩名次比其总成绩名次靠前的学生是乙;②观察散点图,作出对角线y=x,发现丙的坐标横坐标大于纵坐标,说明数学成绩的名次小于总成绩名次,所以在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是数学.
10.(2019·吉林市五地六校适应性考试)公司对2019年1~4月份的获利情况进行了数据统计,如下表所示:
月份x
1
2
3
4
利润y/万元
5
6
6.5
8
利用线性回归分析思想,预测出2019年8月份的利润为11.6万元,则y关于x的线性回归方程为=0.95x+4 .
[解析] 设线性回归方程为= x+,
因为=,=,
由题意可得,解得 =0.95,=4,
即=0.95x+4.故答案为=0.95x+4.
三、解答题
11.(2020·唐山模拟)随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加,下表是某购物网站2017年1-8月促销费用x(万元)和产品销量y(万件)的具体数据.
月份
1
2
3
4
5
6
7
8
促销费用x
2
3
6
10
13
21
15
18
产品销量y
1
1
2
3
3.5
5
4
4.5
(1)根据数据绘制的散点图能够看出可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;(系数精确到0.001)
(2)建立y关于x的回归方程=x+(系数精确到0.01),如果该公司计划在9月份实现产品销量超6万件,预测至少需投入促销费用多少万元.(结果精确到0.01)
参考数据: (xi-11)(yi-3)=74.5, (xi-11)2=340, (yi-3)2=16.5,≈18.44,=4.06,其中xi,yi分别为第i个月的促销费用和产品销量,i=1,2,3,…,8.
参考公式:(i)样本(xi,yi)(i=1,2,…,n)的相关系数r=.
(ii)对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程=x+的斜率和截距的最小二乘估计分别为=,=- .
[解析] (1)由题可知=11,=3,
将数据代入r=,
得r≈=≈0.995.
因为y与x的相关系数近似为0.995,说明y与x的线性相关性很强,从而可以用线性回归模型拟合y与x的关系.(需要突出“很强”,“一般”或“较弱”不给分)
(2)将数据代入 =,
得 ==0.219,
=- =3-0.219×11≈0.59,
所以y关于x的回归方程为=0.22x+0.59.
由=0.22x+0.59>6,解得x>24.59,
即至少需要投入促销费用24.59万元.
12.(2019·湖北省荆、荆、襄、宜四地七校联考)为积极响应国家“阳光体育运动”的号召,某学校在了解到学生的实际运动情况后,发起以“走出教室,走进操场,走到阳光”
为口号的课外活动倡议.为调查该校学生每周平均体育运动时间的情况,从高一高二基础年级与高三三个年级学生中按照4︰3︰3的比例分层抽样,收集300位学生每周平均体育运动时间的样本数据(单位:小时),得到如图所示的频率分布直方图.
(1)据图估计该校学生每周平均体育运动时间.并估计高一年级每周平均体育运动时间不足4小时的人数;
(2)规定每周平均体育运动时间不少于6小时记为“优秀”,否则为“非优秀”,在样本数据中,有30位高三学生的每周平均体育运动时间不少于6小时,请完成下列2×2列联表,并判断是否有99%的把握认为“该校学生的每周平均体育运动时间是否“优秀”与年级有关”.
基础年级
高三
合计
优秀
非优秀
合计
300
P(K2≥k0)
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
附:K2=,n=a+b+c+d.
[解析] (1)该校学生每周平均体育运动时间
=1×0.05+3×0.2+5×0.3+7×0.25+9×0.15+11×0.05=5.8
高一年级每周平均体育运动时间不足4小时的人数:
=300××(0.025×2+0.100×2)=30人
(2)列联表如下:
基础年级
高三
合计
优秀
105
30
135
非优秀
105
60
165
合计
210
90
300
假设该校学生的每周平均体育运动时间是否优秀与年级无关,
则K2==≈7.071>6.635
又P(K2≥6.635)=0.01.
所以有99%的把握认为“该校学生的每周平均体育运动时间是否‘优秀’与年级有关”.
B组能力提升
1.(2020·西安模拟)以模型y=cekx去拟合一组数据时,为了求出回归方程,则z=ln y,其变换后得到线性回归方程z=0.3x+4,则c=( D )
A.0.3 B.e0.3
C.4 D.e4
[解析] z=ln y=ln(cekx)=ln c+kx,因为z=0.3x+4,所以ln c=4,则c=e4.故选D.
2.(2019·湖南师大附中模拟)在西非肆虐的“埃博拉病毒”的传播速度很快,已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:
感染
未感染
总计
服用
10
40
50
未服用
20
30
50
总计
30
70
100
参考公式:K2=
P(K2>k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参照附表,在犯错误的概率最多不超过5% (填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.
[解析] 由题意可得,K2=≈4.762>3.841,参照附表可得,在犯错误的概率不超过5%的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.
3.(2019·赣州模拟)在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动,经计算xi=11,yi=13,x=21,则实数b的值为 .
[解析] 令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-,此时==,==,代入y=bt-,得=b×-,解得b=.
4.(2019·福建龙岩、漳州模拟)某手机厂商在销售200万台某型号手机时开展“手机碎屏险”活动.活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x元.若在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这200万台该型号手机全部销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取1 000名,每名用户赠送1 000元的红包.为了合理确定保费x的值,该手机厂商进行了问卷调查,统计后得到下表(其中y表示保费为x元时愿意购买该“手机碎屏险”的用户比例):
x
10
20
30
40
50
y
0.79
0.59
0.38
0.23
0.01
(1)根据上面的数据求出y关于x的回归直线方程;
(2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为0.2%.已知更换一次该型号手机屏幕的费用为2 000元,若该手机厂商要求在这次活动中因销售该“手机碎屏险”产生的利润不少于70万元,能否把保费x定为5元?
参考公式:回归方程y=bx+a中斜率和截距的最小二乘估计分别为=,=- .
参考数据:表中x的5个值从左到右分别记为x1,x2,x3,x4,x5,相应的y值分别记为y1,y2,y3,y4,y5,经计算有(xi-)(yi-)=-19.2,
其中=i,=i.
[解析] (1)由=30,=0.4,
(xi-)(yi-)=-19.2,(xi-)2=1 000,
得==-0.019 2,
=- =0.976,
所以y关于x的回归直线方程为
y=-0.019 2x+0.976.
(2)能把保费x定为5元.
理由如下:若保费x定为5元,则估计
y=-0.019 2×5+0.976=0.88
估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的利润为
2 000 000×0.88×5-2 000 000×0.88×0.2%×2 000-1 000×1 000=0.76×106(元)=76(万元)>70(万元)
所以能把保费x定为5元.
5.(2020·陕西省联考)按照国家质量标准:某种工业产品的质量指标值落在[100,120)内,则为合格品,否则为不合格品.某企业有甲、乙两套设备生产这种产品,为了检测这两套设备的生产质量情况,随机从两套设备生产的大量产品中各抽取了50件产品作为样本对规定的质量指标值进行检测.表是甲套设备的样本频数分布表,图是乙套设备的样本频率分布直方图.
表:甲套设备的样本频数分布表
质量指标值
[95,100)
[100,105)
[105,110)
[110,115)
[115,120)
[120,125]
频数
1
4
19
20
5
1
(1)将频率视为概率,若乙套设备生产了5 000件产品,则其中不合格品约有多少件?
(2)填写下面2×2列联表,并根据列联表判断是否有95%的把握认为这种产品的质量指标值与甲乙两套设备的选择有关:
甲套设备
乙套设备
合计
合格品
不合格品
合计
(3)根据表和图,对甲、乙两套设备的优劣进行比较.
参考公式及数据:x2=
P(x2≥k)
0.100
0.050
0.010
k
2.706
3.841
6.635
[解析] (1)由图知,乙套设备生产的不合格品率约为(0.01+0.022)×5=0.16;
∴乙套设备生产的5 000件产品中不合格品约为5 000×0.16=800(件);
(2)由表和图得到列联表:
甲套设备
乙套设备
台计
合格品
48
42
90
不合格品
2
8
10
合计
50
50
100
将列联表中的数据代入公式计算得K2==4>3.841;
∴有95%的把握认为产品的质量指标值与甲、乙两套设备的选择有关;
(3)由表和图知,甲套设备生产的合格品的概率约为=0.96,
乙套设备生产的合格品的概率约为1-0.16=0.84,
且甲套设备生产的产品的质量指标值主要集中在[105,115)之间,
乙套设备生产的产品的质量指标值与甲套设备相比较为分散;
因此,可以认为甲套设备生产的合格品的概率更高,且质量指标值更稳定,所以甲套设备优于乙套设备.