- 151.00 KB
- 2021-06-15 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
2020届二轮复习 变量间的相关关系、统计案例 学案
五年高考
考点 变量的相关性、统计案例
1.(2018山东,5,5分)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+.已知xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为( )
A.160 B.163
C.166 D.170
答案 C
2.(2018福建,4,5分)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=-.
据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
答案 B
3.(2018湖北,4,5分)根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为=bx+a,则( )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
答案 B
4.(2018课标Ⅰ,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi-)2
(wi-)2
(xi-)(yi-)
(wi-)(yi-)
46.6
563
6.8
289.8
1.6
1 469
108.8
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
(i)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ii)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为
=,=- .
解析 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2分)
(2)令w=,先建立y关于w的线性回归方程.由于
===68,
=- =563-68×6.8=100.6,
所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.(6分)
(3)(i)由(2)知,当x=49时,年销售量y的预报值
=100.6+68=576.6,
年利润z的预报值=576.6×0.2-49=66.32.(9分)
(ii)根据(2)的结果知,年利润z的预报值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以当==6.8,
即x=46.24时,取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.(12分)
教师用书专用(5—6)
5.(2018重庆,3,5分)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
答案 A
6.(2018课标Ⅱ,19,12分)某地区2018年至2018年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年 份
2018
2018
2009
2018
2018
2018
2018
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2018年至2018年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:
=,=-.
解析 (1)由所给数据计算得
=×(1+2+3+4+5+6+7)=4,
=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
===0.5,
=-=4.3-0.5×4=2.3,所求回归方程为=0.5t+2.3.
(2)由(1)知,=0.5>0,故2018年至2018年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2018年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,
故预测该地区2018年农村居民家庭人均纯收入为6.8千元.
三年模拟
A组 2018—2018年模拟·基础题组
考点 变量的相关性、统计案例
1.(2018云南昆明一中第一次摸底,2)当变量x的取值为3,4,5,6,7时,变量y对应的值依次为4.0,2.5,-0.5,-1,-2;当变量u的取值为1,2,3,4时,变量v对应的值依次为2,3,4,6,则变量x和y,变量u和v的相关关系是( )
A.变量x和y是正相关,变量u和v是正相关
B.变量x和y是正相关,变量u和v是负相关
C.变量x和y是负相关,变量u和v是负相关
D.变量x和y是负相关,变量u和v是正相关
答案 D
2.(2018湖南邵阳二模,3)假设有两个分类变量X和Y的2×2列联表:
y1
y2
总计
x1
a
10
a+10
x2
c
30
c+30
总计
60
40
100
对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为( )
A.a=45,c=15 B.a=40,c=20
C.a=35,c=25 D.a=30,c=30
答案 A
3.(2018湖南益阳调研,4)某公司2018~2018年的年利润(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:
年份
2018
2018
2018
2018
2018
2018
利润x(百万元)
12.2
14.6
16
18
20.4
22.3
支出y(百万元)
0.62
0.74
0.81
0.89
1.00
1.11
根据统计资料,则( )
A.年利润中位数是16,y与x具有正的线性相关关系
B.年利润中位数是17,y与x具有正的线性相关关系
C.年利润中位数是17,y与x具有负的线性相关关系
D.年利润中位数是18,y与x具有负的线性相关关系
答案 B
4.(2018江西鹰潭一模,3)以下四个命题:
①从匀速传送的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样.
②两个随机变量相关性越强,则相关系数的绝对值越接近于1.
③在回归直线方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位.
④对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大
其中正确的是( )
A.①④ B.②③
C.①③ D.②④
答案 B
5.(2018广东惠州第三次调研,14)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):
零件数x(个)
10
20
30
40
50
加工时间y(分钟)
62
68
75
81
89
由最小二乘法求得回归方程为=0.67x+,则的值为 .
答案 54.9
B组 2018—2018年模拟·提升题组
(满分:40分 时间:50分钟)
一、选择题(每小题5分,共15分)
1.(2018山东实验中学上学期第二次诊断,11)某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=并参照附表,得到的正确结论是 ( )
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”
C.有99.9%的把握认为“爱好游泳运动与性别有关”
D.有99.9%的把握认为“爱好游泳运动与性别无关”
答案 A
2.(2018江西南城一中、高安中学等九校3月联考,7)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
非一线
一线
总计
愿生
45
20
65
不愿生
13
22
35
总计
58
42
100
由K2=,
得K2=≈9.616.
参照下表,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
正确的结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
答案 C
3.(2018福建福州外国语学校适应性考试(一),5)如下表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归方程为=0.8x-155,后因某未知原因第5组数据的y值模糊不清,此位置数据记为m(如表所示),则利用回归方程可求得实数m的值为( )
x
196
197
200
203
204
y
1
3
6
7
m
A.8.3 B.8.2 C.8.1 D.8
答案 D
二、解答题(共25分)
4.(2018广东东莞模拟,19)某城市随机抽取一年(365天)内100天的空气质量指数AQI的监测数据,结果统计如下:
AQI
[0,
50]
(50,
100]
(100,
150]
(150,
200]
(200,
250]
(250,
300]
>300
空气
质量
优
良
轻微
污染
轻度
污染
中度
污染
中度
重污染
重度
污染
天数
4
13
18
30
9
11
15
记某企业每天由空气污染造成的经济损失为S(单位:元),空气质量指数AQI为ω.在区间[0,100]对企业没有造成经济损失;在区间(100,300]对企业造成经济损失成直线模型(当AQI为150时,造成的经济损失为500元,当AQI为200时,造成的经济损失为700元);当AQI大于300时,造成的经济损失为2 000元.
(1)试写出S(ω)的表达式;
(2)试估计在本年内随机抽取一天,该天经济损失S大于200元且不超过600元的概率;
(3)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面2×2列联表,并判断能否有95%的把握认为该城市本年空气重度污染与供暖有关.
非重度污染
重度污染
合计
供暖季
非供暖季
合计
100
附:
P(K2≥k0)
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
1.32
2.07
2.70
3.84
8.02
6.63
7.87
10.82
K2=.
解析 (1)由已知可得S(ω)=
(2)设“在本年内随机抽取一天,该天经济损失S大于200元且不超过600元”为事件A,
由2003.84,
所以有95%的把握认为该城市本年空气重度污染与供暖有关.
5.(2018河南百校联盟4月模拟,18)国内某知名连锁店分店开张营业期间,在固定的时间段内消费达到一定标准的顾客可参加一次抽奖活动,随着抽奖活动的有效开展,参与抽奖活动的人数越来越多,该分店经理对开业前7天参加抽奖活动的人数进行统计,y表示开业第x天参加抽奖活动的人数,得到统计表格如下:
x
1
2
3
4
5
6
7
y
5
8
8
10
14
15
17
经过进一步统计分析,发现y与x具有线性相关关系.
(1)根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(2)若该分店此次抽奖活动自开业起,持续10天,参加抽奖的每位顾客抽到一等奖(奖品价值200元)的概率为,抽到二等奖(奖品价值100元)的概率为,抽到三等奖(奖品价值10元)的概率为.试估计该分店在此次抽奖活动结束时共送出价值多少元的奖品.
参考公式:=,=-.
解析 (1)依题意知=×(1+2+3+4+5+6+7)=4,
=×(5+8+8+10+14+15+17)=11,
===2,=-=11-2×4=3,
则y关于x的线性回归方程为=2x+3.
(2)设一位参加抽奖的顾客获得的奖品价值X元,则X的分布列为
X
200
100
10
P
EX=200×+100×+10×=.
由y关于x的线性回归方程为=2x+3,
得x=8时,=19,x=9时,=21,x=10时,=23,
则此次活动参加抽奖的人数约为5+8+8+10+14+15+17+19+21+23=140,又140×=8 800,
所以估计该分店在此次抽奖活动结束时共送出价值8 800元的奖品.
C组 2018—2018年模拟·方法题组
方法1 回归直线方程的求解
1.(2018陕西汉中一模,3)已知两个随机变量x,y之间的相关关系如表所示:
x
-4
-2
1
2
4
y
-5
-3
-1
-0.5
1
根据上述数据得到的回归方程为=x+,则大致可以判断( )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
答案 C
2.(2018重庆南开二诊模拟,18)某品牌新款夏装即将上市,为了对夏装进行合理定价,在该地区的三家连锁店各进行了两天试销售,得到如下数据:
连锁店
A店
B店
C店
售价x(元)
80
86
82
88
84
90
销售量y(件)
88
78
85
75
82
66
(1)以三家连锁店分别的平均售价和平均销量为样本数据,求出售价与销量的回归直线方程=x+;
(2)在大量投入市场后,销售量与单价仍然服从(1)中的关系,且该夏装成本价为40元/件,为使该款夏装在销售上获得最大利润,该款夏装的单价应定为多少元?(保留整数)
附:==-.
解析 (1)A,B,C三家连锁店平均售价和销量分别为(83,83),(85,80),(87,74),∴=85,=79,∴==-2.25,
∴=-=270.25,∴=-2.25x+270.25.
(2)设该款夏装的单价为x元,利润为f(x)元,则f(x)=(x-40)(-2.25x+270.25)=-2.25x2+360.25x-10 810,∴当x≈80时, f(x)取得最大值.故该款夏装的单价应定为80元.
方法2 独立性检验
3.(2018湖南师大附中月考(三),14)在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:
感染
未感染
总计
服用
10
40
50
未服用
20
30
50
总计
30
70
100
参照附表,在犯错误的概率不超过 (填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.
参考公式:K2=.
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
答案 5%
4.(2018安徽合肥二模,18)某校计划面向高一年级1 200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类,自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.
(1)分别计算抽取的样本中男生及女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生数;
(2)根据抽取的180名学生的调查结果,完成下列列联表,并判断能否在犯错误的概率不超过0.025的前提下认为课程的选择与性别有关.
选择自然科学类
选择社会科学类
合计
男生
45
105
女生
45
合计
180
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解析 (1)由条件知,抽取的男生为105人,女生为180-105=75人,
男生选择社会科学类的频率为,女生选择社会科学类的频率为,
由题意知,高一年级的男生总数为1 200×=700,女生总数为1 200×=500,所以估计实际选课中选择社会科学类的学生数为700×+500×=600人.
(2)根据统计数据,可得列联表如下:
选择自然科学类
选择社会科学类
合计
男生
60
45
105
女生
30
45
75
合计
90
90
180
K2==≈5.1429>5.024,
所以在犯错误的概率不超过0.025的前提下认为课程的选择与性别有关.