- 128.86 KB
- 2021-07-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第二讲 变量间的相关关系与统计案例
1.[2020南昌市测试]已知一组样本数据(x1,y1),(x2,y2),(x3,y3),…,(x6,y6),用最小二乘法得到其线性回归方程为y^=-2x+4,若x1,x2,x3,…,x6的平均数为1,则y1+y2+y3+…+y6= ( )
A.10 B.12 C.13 D.14
2.[多选题]2019年是中华人民共和国成立七十周年,中华人民共和国成立以来,我国文化事业得到了充分发展,图12-2-1是根据2013年到2018年我国公共图书馆业机构数与对应年份编号绘制的散点图(为便于计算,将2013年编号为1, 2014年编号为2,…,2018年编号为6,把每年的公共图书馆业机构数作为预报变量,把年份编号作为解释变量进行回归分析),得到的回归直线方程为y^=13.743x+3 095.7,其相关指数R2=0.981 7,则下列结论正确的是( )
图12-2-1
A.公共图书馆业机构数与年份编号的正相关性较强
B.公共图书馆业机构数平均每年增加13.743
C.可预测2021年公共图书馆业机构数为3 129
D.在2014~2018年间,2016年公共图书馆业机构数增加量最多
3.[2019蓉城名校高三第一次联考]某校高三“数学月”活动记录了4名学生改进数学学习方法后,每天增加学习时间x(单位:分)与月考成绩增加分数y(单位:分)的几组对应数据:
x
3
4
5
6
y
2
4
m
5
根据表中提供的数据,若求出y关于x的线性回归方程为y^=0.98x-0.46,则表中m的值为( )
A.4 B.4.15 C.4.8 D.4.35
4.[多选题]2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如图12-2-2(1)(2)所示的等高条形图:
(1) (2)
图12-2-2
根据图中的信息,下列结论中正确的是( )
A.样本中男性比女性更关注地铁1号线全线开通
B.样本中多数女性是35岁及以上
C.样本中35岁以下的男性人数比35岁及以上的女性人数多
D.样本中35岁及以上的人对地铁1号线开通的关注度更高
5.[2020贵州贵阳南明区模拟]2013年以来精准扶贫政策的落实,使我国扶贫工作有了新进展,农村贫困发生率由2012年年底的10.2%下降到2018年年底的1.7%,创造了人类减贫史上的中国奇迹.贫困发生率是指低于贫困线的人口占所统计的全部人口的百分比,2012年年底至2018年年底我国农村贫困发生率的数据如下表所示.
年份t
2012
2013
2014
2015
2016
2017
2018
贫困发生率y/%
10.2
8.5
6.2
5.7
4.5
3.1
1.7
(1)从表中所给的7个贫困发生率数据中任选2个,求至少有1个低于5%的概率;
(2)设年份代码x=t-2 015,求出y与x的线性回归方程.
附:回归直线y^=b^x+a^的斜率和截距的最小二乘估计公式分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nx y∑i=1nxi2-nx2,a^=y-b^x(b^,a^的值均保留到小数点后三位).
6.[2020惠州市一调]某品牌汽车4S店,对该品牌旗下的A型、B型、C型汽车进行维修保养,汽车4S店记录了100辆该品牌三种类型汽车的维修情况,整理得下表:
车型
A型
B型
C型
频数
20
40
40
假设该店采用分层抽样的方法从上述维修的100辆该品牌三种类型汽车中随机抽取10辆进行问卷回访.
(1)求A型、B型、C型各车型汽车抽取的数量.
(2)维修结束后这100辆汽车的司机采用“100分制”打分的方式表示对4S店的满意度,按照大于等于80分为优秀,小于80分为合格,得到如下列联表:
优秀
合格
合计
男司机
10
38
48
女司机
25
27
52
合计
35
65
100
能否在犯错误的概率不超过0.01的前提下认为司机对4S店的满意度与性别有关系?请说明原因.
附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d;
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
7.[2019山西晋城三模]某机构为了了解不同年龄的人对同一款智能家电的评价,随机选取了50名购买该款智能家电的消费者,让他们根据实际使用体验进行评分.
(1)设消费者的年龄为x,对该款智能家电的评分为y.若根据统计数据,用最小二乘法得到y关于x的线性回归方程为y^=1.2x+40,且年龄x的方差为sx2=14.4,评分y的方差为sy2=22.5.求y与x的相关系数r,并据此判断对该款智能家电的评分与年龄的相关性的强弱.
(2)根据50名消费者的年龄将消费者的年龄所处的阶段划分为“青年”和“中老年”,按一定的标准将评分划分为“好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该款智能家电的评价与年龄所处的阶段有关.
好评
差评
青年
8
16
中老年
20
6
附:回归直线y^=b^x+a^的斜率和截距的最小二乘估计分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a ^=y-b^x;相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2;
K2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d),其中n=a+b+c+d,
P(K2≥k0)
0.05
0.010
0.001
k0
3.841
6.635
10.828
8.[2020吉林长春实验中学测试][新角度题]通常用PM 2.5的值表示空气的污染情况,PM 2.5的值越高,空气污染就越严重,下表是某公园中参加室外锻炼的人数y与PM 2.5的值x的一些数据.
x
110
100
80
60
50
y/人
90
95
100
105
110
(1)请用相关系数r(精确到0.01)说明y与x之间具有什么样的相关关系;
(2)根据上表提供的数据,估计当PM 2.5的值为40时该公园中参加室外锻炼的人数;
(3)将表格中的数据看作五个点的坐标(xj,yj)(j=1,2,…,5),从这五个点中任意抽取两个点,求这两个点都在圆(x-80)2+(y-90)2=100外的概率.
参考公式:r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2=∑i=1nxiyi-nx y(∑i=1nxi2-nx2)(∑i=1nyi2-ny2);
线性回归方程y^=b^x+a^中,b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nx y∑i=1nxi2-nx2,a^=y-b^x.
参考数据:∑i=15xiyi=39 200,∑i=15xi2=34 600,∑i=15yi2=50 250,26≈5.10,250≈15.81.
9.[2020河北辛集模拟] [交汇题] 由中央电视台综合频道(CCTV-1)和唯众传媒联合制作的《开讲啦》是中国首档青年电视公开课.每期节目由一位知名人士讲述自己的故事,分享他们对于生活和生命的感悟,给予中国青年现实的讨论和心灵的滋养,讨论青年
们的人生问题,同时也在讨论青春中国的社会问题,受到了青年观众的喜爱.为了了解观众对节目的喜爱程度,电视台随机调查了A,B两个地区的100名观众,得到如下所示的2×2列联表.
非常喜欢
喜欢
合计
A
30
15
B
x
y
合计
已知在被调查的100名观众中随机抽取1名,该观众来自B地区且喜爱程度为“非常喜欢”的概率为0.35.
(1)现从100名观众中根据喜爱程度用分层抽样的方法抽取20名进行问卷调查,则应抽取喜爱程度为“非常喜欢”的A,B地区的人数各是多少?
(2)完成上述表格,并根据表格判断是否有95%的把握认为观众的喜爱程度与所在地区有关系.
(3)若以抽样调查的频率为概率,从A地区随机抽取3人,设抽到喜爱程度为“非常喜欢”的观众的人数为X,求X的分布列和期望.
附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d,
P(K2≥k0)
0.05
0.010
0.001
k0
3.841
6.635
10.828
第二讲 变量间的相关关系与统计案例
1.B 回归直线过样本点的中心(x,y),因为x=1,所以y=- 2×1+4=2,所以y1+y2+y3+…+y6=6×2=12.故选B.
2.AB 因为散点图中各点散布在从左下角到右上角的区域内,所以为正相关,因为R2=0.981 7,接近于1,所以公共图书馆业机构数与年份编号的相关性较强,故A正确;因为回归直线的斜率为13.743,所以公共图书馆业机构数平均每年增加13.743,故B正确;将x=9代入回归直线方程y^=13.743x+3 095.7,解得y^=3 219.387≈3 219,所以可预测2021年公共图书馆业机构数为3 219,故C错误.由题图可知,在2014~2018年间,2015年公共图书馆机构数增加量最多,故D错误.故选AB.
3.C 根据回归直线过样本点的中心(3+4+5+64,2+4+m+54),即(92,11+m4),可得11+m4=0.98×92- 0.46,解得m=4.8.故选C.
4.ABD 设等高条形图对应的2×2列联表如下:
35岁及以上
35岁以下
总计
男性
a
c
a+c
女性
b
d
b+d
总计
a+b
c+d
a+b+c+d
根据题图12- 2- 2(1)可知,35岁及以上男性比35岁及以上女性多,即a>b;35岁以下男性比35岁以下女性多,即c>d.
根据题图12- 2- 2(2)可知,男性中35岁及以上的比35岁以下的多,即a>c;女性中35岁及以上的比35岁以下的多,即b>d.
对于A,男性人数为a+c,女性人数为b+d,因为a>b,c>d,所以a+c>b+d,所以A正确;
对于B,35岁及以上女性人数为b,35岁以下女性人数为d,因为b>d,所以B正确;
对于C,35岁以下男性人数为c,35岁及以上女性人数为b,无法直接判断b与c的大小关系,所以C不一定正确;
对于D,35岁及以上的人数为a+b,35岁以下的人数为c+d,因为a>c,b>d,所以a+b>c+d,所以D正确.故选ABD.
【归纳总结】 解决此类问题时,可以借助2×2列联表进行数据分析,找出数据关系,然后逐一判断即可.
5. (1)记事件A表示“从表中所给的7个贫困发生率数据中任选2个,至少有1个低于5%”,则P(A)=C32+C31C41C72=57.
(2)由题意可得下表:
年份t
2012
2013
2014
2015
2016
2017
2018
年份代码x
- 3
- 2
- 1
0
1
2
3
贫困发生率y/%
10.2
8.5
7.2
5.7
4.5
3.1
1.7
由表中数据,计算得x=17×(- 3- 2- 1+0+1+2+3)=0,
y=17×(10.2+8.5+7.2+5.7+4.5+3.1+1.7)=40970,
∑i=17xiyi=- 3×10.2- 2×8.5- 1×7.2+0×5.7+1×4.5+2×3.1+3×1.7=- 39,
∑i=17xi2- 7x 2=(- 3)2+(- 2)2+(- 1)2+02+12+22+32- 7×02=28,
所以b^=∑i=17xiyi- 7x y∑i=17xi2- 7x 2=- 39- 7×0×4097028≈- 1.393,所以a^=y-b^x=40970- (- 1.393)×0≈5.843.则y关于x的线性回归方程为y^=- 1.393x+5.843.
6.(1)A型、B型、C型汽车抽取的数量分别为20100×10=2,40100×10=4,40100×10=4.
(2)根据题意得,K2的观测值k=100×(10×27- 38×25)248×52×35×65≈8.143 1.
因为8.143 1>6.635,
所以能在犯错误的概率不超过0.01的前提下认为司机对4S店的满意度与性别有关系.
7.(1)由题意得,相关系数r=∑i=150(xi- x)(yi- y)∑i=150(xi- x)2∑i=150(yi- y)2=∑i=150(xi- x)(yi- y)∑i=150(xi- x)2·∑i=150(xi- x)2∑i=150(yi- y)2=b^·50sx250sy2=1.2×45=0.96.
故对该款智能家电的评分与年龄的相关性较强.
(2)由题意得,K2的观测值k=50×(8×6- 20×16)224×26×28×22≈9.624>6.635.
故有99%的把握认为对该款智能家电的评价与年龄所处的阶段有关.
8.(1)x=15×(110+100+80+60+50)=80,y=15×(90+95+100+105+110)=100,
r=∑i=15(xi- x)(yi- y)∑i=15(xi- x)2∑i=15(yi- y)2
=∑i=15xiyi- 5x y(∑i=15xi2- 5x 2)(∑i=15yi2- 5y 2)
=39 200- 5×80×100(34 600- 5×802)×(50 250- 5×1002)
=- 8002 600×250
≈- 0.99,
所以y关于x之间具有较强的负相关关系.
(2)b^=∑i=15xiyi- 5x y∑i=15xi2- 5x 2=39 200- 5×80×10034 600- 5×802=- 8002 600≈- 0.31,
a^=y-b^x=100+0.31×80=124.8.
所以y关于x的线性回归方程为y^=- 0.31x+124.8.
当x=40时,y^=- 0.31×40+124.8=112.4≈112.
所以估计当PM 2.5的值为40时该公园中参加室外锻炼的人数为112人.
(3)易知五个点中,只有点(80,100)(记为点A)在圆上,其余四个点(分别记为点B,C,D,E)都在圆外,
所以从这五个点中任意抽取两个点,基本事件有{A,B},{A,C},{A,D},{A,E},{B,C},{B,D},{B,E},{C,D},{C,E},{D,E},共10个.
两个点都在圆外包含的基本事件为{B,C},{B,D},{B,E},{C,D},{C,E},{D,E},共6个.
所以所求概率P=610=35.
9.(1)由题意得x100=0.35,解得x=35,
所以应从A地抽取30×20100=6(人),从B地抽取35×20100=7(人).
(2)完成表格如下:
非常喜欢
喜欢
合计
A
30
15
45
B
35
20
55
合计
65
35
100
所以K2的观测值k=n(ad- bc)2(a+b)(c+d)(a+c)(b+d)=100×(30×20- 35×15)265×35×45×55=1001 001≈0.1<3.841,所以没有95%的把握认为观众的喜爱程度与所在地区有关系.
(3)从A地区随机抽取1人,抽到的观众的喜爱程度为“非常喜欢”的概率为23,
从A地区随机抽取3人,X的所有可能取值为0,1,2,3,
则P(X=0)=(13)3=127,
P(X=1)=C31(23)1(13)2=29,
P(X=2)=C32(23)2(13)1=49,
P(X=3)=(23)3=827.
所以X的分布列为
X
0
1
2
3
P
127
29
49
827
E(X)=0×127+1×29+2×49+3×827=2.
相关文档
- 【数学】2019届一轮复习北师大版理2021-07-0113页
- 2021版高考数学一轮复习第四章三角2021-07-0152页
- 北师大版数学选修1-2练习:综合学习2021-07-018页
- 高考数学一轮复习核心素养测评六十2021-07-019页
- 【数学】2021届一轮复习北师大版(理2021-07-018页
- 【数学】2020届一轮复习北师大版 2021-07-016页
- 【北师大版】2021版高考数学一轮复2021-07-018页
- 【数学】2019届理科一轮复习北师大2021-07-018页
- 【数学】2018届一轮复习北师大版(理2021-07-0120页
- 【数学】2020届一轮复习北师大版统2021-07-015页