- 4.21 MB
- 2021-06-20 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
§11.3 变量间的相关关系、统计案例
基础知识 自主学习
课时作业
题型分类 深度剖析
内容索引
基础知识 自主学习
1.两个变量的线性相关
知识梳理
(1)正相关
在散点图中,点散布在从 到 的区域,对于两个变量的
这种相关关系,我们将它称为正相关.
(2)负相关
在散点图中,点散布在从 到 的区域,两个变量的这
种相关关系称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在 ,就称这两
个变量之间具有线性相关关系,这条直线叫做回归直线.
左下角 右上角
左上角 右下角
一条直线附近
2.回归方程
(1)最小二乘法
求回归直线,使得样本数据的点到它的 的方法叫
做最小二乘法.
(2)回归方程
是两个具有线性相关关系的变量的一组数据(x1,y1),
(x2,y2),…,(xn,yn)的回归方程,其中 , 是待定参数.
距离的平方和最小
1
2
1
( )( )
( )
n
i i
i
n
i
i
y yx x
x x
1
2
2
1
( )
n
i i
i
n
i
i
n
n
y yx x
x x
ˆy b x
3.回归分析
(1)定义:对具有 的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),
其中 称为样本点的中心.
(3)相关系数
当r>0时,表明两个变量 ;
当r<0时,表明两个变量 .
相关关系
正相关
负相关
r的绝对值越接近于1,表明两个变量的线性相关性 .
r的绝对值越接近于0,表明两个变量之间 .
通常|r|大于 时,认为两个变量有很强的线性相关性.
越强
几乎不存在线性相关关系
0.75
4.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的 ,像这类变量
称为分类变量.
(2)列联表:列出两个分类变量的 ,称为列联表.假设有两个分类
变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联
表(称为2×2列联表)为
不同类别
频数表
2×2列联表
构造一个随机变量K2= ,其中n=
为样本容量.
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
a+b+c+d
(3)独立性检验
利用随机变量 来判断“两个分类变量 ”的方法称为独立性
检验.
K2 有关系
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(
)
(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关
关系.( )
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( )
思考辨析
×
√
√
(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程
=-2.352x+147.767,则气温为2℃时,一定可卖出143杯热饮.( )
(5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.(
)
(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有
关,某人数学成绩优秀,则他有99%的可能物理优秀.( )
×
√
×
考点自测
1.(2015·湖北)已知变量x和y满足关系 =-0.1x+1,变量y与z正相关.
下列结论中正确的是
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
答案 解析
所以x与y负相关.又y与z正相关,
所以x与z负相关.
故选C.
2.(教材改编)下面是2×2列联表:则表中a,b的值分别为 答案 解析
A.94,72 B.52,50 C.52,74 D.74,52
∵a+21=73,∴a=52.又a+22=b,∴b=74.
y1 y2 合计
x1 a 21 73
x2 22 25 47
合计 b 46 120
3.(2016·河南八市质检)为了研究某大型超市当天销售额与开业天数的
关系,随机抽取了5天,其当天销售额与开业天数的数据如下表所示:
答案 解析
A.67 B.68 C.68.3 D.71
根据上表提供的数据,求得y关于x的线性回归方程为=0.67x+54.9,
由于表中有一个数据模糊看不清,请你推断出该数据的值为
开业天数x 10 20 30 40 50
当天销售额y/万元 62 75 81 89
4.(2017·湖南三校联考)某产品在某零售摊位的零售价x(单位:元)与每
天的销售量y(单位:个)的统计资料如下表所示:
答案 解析
x 16 17 18 19
y 50 34 41 31
由上表可得线性回归方程 ,据此模型预测零售价
为15元时,每天的销售量为
A.51个 B.50个 C.49个 D.48个
5.(2016·玉溪一中月考)利用独立性检验来判断两个分类变量X和Y是否
有关系,通过查阅下表来确定“X和Y有关系”的可信度.为了调查用
电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进
行调查.经过计算得K2≈3.855,那么就有________%的把握认为用电
脑时间与视力下降有关系. 答案 解析
根据表格发现3.855>3.841,3.841对应的是0.05,所以根据独立性检验
原理可知有95%的把握认为用电脑时间与视力下降有关系.
95
P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
k0 3.841 5.024 6.635 7.879 10.828
题型分类 深度剖析
题型一 相关关系的判断
例1 (1)四名同学根据各自的样本数据研究变量x,y之间的相关关系,
并求得线性回归方程,分别得到以下四个结论:
其中一定不正确的结论的序号是 答案 解析
A.①② B.②③ C.③④ D.①④
∴①④一定错误.
(2)x和y的散点图如图所示,则下列说法中所
有正确命题的序号为_____. 答案 解析
①x,y是负相关关系;
③x、y之间不能建立线性回归方程.
①②
2ec x
①显然正确;
2ec x
判定两个变量正、负相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的
分布从左上角到右下角,两个变量负相关.
(2)相关系数:r>0时,正相关;r<0时,负相关.
思维升华
跟踪训练1 (1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,
x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,
n)都在直线y= x+1上,则这组样本数据的样本相关系数为
A.-1 B.0 C. D.1
所有点均在直线上,则样本相关系数最大,即为1,故选D.
答案
解析
(2)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),
(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),
(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与
U之间的线性相关系数,则
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;
对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,
故选C.
答案 解析
题型二 线性回归分析
例2 (2016·全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理
量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数
加以说明;
注:年份代码17分别对应年份2008-2014.
解答
由折线图中数据和附注中参考数据得
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,
从而可以用线性回归模型拟合y与t的关系.
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾
无害化处理量.
附注:
解答
所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.
线性回归分析问题的类型及解题方法
(1)求线性回归方程
①利用公式,求出回归系数
②待定系数法:利用回归直线过样本点的中心求系数.
(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.
(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数 .
(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,
两变量的线性相关性越强.
思维升华
跟踪训练2 (2015·课标全国Ⅰ)某公司为确定
下一年度投入某种产品的宣传费,需了解年宣
传费x(单位:千元)对年销售量y(单位:t)和年
利润z(单位:千元)的影响,对近8年的年宣传
费xi和年销售量yi(i=1,2,…,8)数据作了初步
处理,得到下面的散点图及一些统计量的值.
46.6 563 6.8 289.8 1.6 1 469 108.8
解答
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; 解答
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果
回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少? 解答
②年宣传费x为何值时,年利润的预报值最大? 解答
根据(2)的结果知,年利润z的预报值
故年宣传费为46.24千元时,年利润的预报值最大.
题型三 独立性检验
例3 (2016·福建厦门三中模拟)某大型企业人力资源部为了研究企业员
工工作积极性和对待企业改革的关系,随机抽取了100名员工进行调查,
其中支持企业改革的调查者中,工作积极的有46人,工作一般的有35
人,而不太赞成企业改革的调查者中,工作积极的有4人,工作一般的
有15人.
(1)根据以上数据建立一个2×2列联表; 解答
根据题设条件,得2×2列联表如下:
支持企业改革 不太赞成企业改革 总计
工作积极 46 4 50
工作一般 35 15 50
总计 81 19 100
(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体
员工对待企业改革的态度与其工作积极性有关系? 解答
P(K2
≥k0)
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
提出假设:企业的全体员工对待企业改革的态度与其工作积极性无关.
根据(1)中的数据,可以求得
所以有99%的把握认为抽样员工对待企业改革的态度与工作积极性
有关,
从而认为企业的全体员工对待企业改革的态度与其工作积极性有关.
(1)比较几个分类变量有关联的可能性大小的方法
①通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.
②通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性
越大.
(2)独立性检验的一般步骤
①根据样本数据制成2×2列联表.
思维升华
③比较k与临界值的大小关系,作统计推断.
跟踪训练3 (2017·衡阳联考)2016年9月20日是第28个全国爱牙日,为
了迎接此节日,某地区卫生部门成立了调查小组,调查“常吃零食与
患龋齿的关系”,对该地区小学六年级800名学生进行检查,按患龋齿
和不患龋齿分类,并汇总数据:不常吃零食且不患龋齿的学生有60名,
常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有
140名.
(1)能否在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零
食与患龋齿有关系? 解答
由题意可得2×2列联表如下:
根据2×2列联表中数据,得K2的观测值为
不常吃零食 常吃零食 总计
不患龋齿 60 100 160
患龋齿 140 500 640
总计 200 600 800
∴能在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零
食与患龋齿有关系.
(2)4名卫生部门的工作人员随机分成两组,每组2人,一组负责数据
收集,另一组负责数据处理,求工作人员甲分到收集数据组,工作人
员乙分到处理数据组的概率. 解答
P(K2≥k0) 0.010 0.005 0.001
k0 6.635 7.879 10.828
设其他工作人员为丙和丁,4人分组的所有情况如下表.
由表可知,分组的情况共有6种,工作人员甲负责收集数据且工作人
员乙负责处理数据的有2种,
小组 1 2 3 4 5 6
收集数据 甲乙 甲丙 甲丁 乙丙 乙丁 丙丁
处理数据 丙丁 乙丁 乙丙 甲丁 甲丙 甲乙
典例 (12分)某地最近十年粮食需求量逐年上升,下表是部分统计数据:
思想方法指导 规范解答
求线性回归方程的方法技巧思想与方法系列24
年份 2006 2008 2010 2012 2014
需求量/万吨 236 246 257 276 286
(1)利用所给数据求年需求量与年份之间的线性回归方程 ;
(2)利用(1)中所求出的线性回归方程预测该地2016年的粮食需求量.
回归分析是处理变量相关关系的一种数学方法.
主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之
间贴近的数学表达式;
(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;
(3)求出线性回归方程。
返回
解 (1)由所给数据看出,年需求量与年份之间近似直线上升,下面来
求线性回归方程,先将数据处理如下表.
年份-2010 -4 -2 0 2 4
需求-257 -21 -11 0 19 29
由上述计算结果,知所求线性回归方程为
(2)利用所求得的线性回归方程,
可预测2016年的粮食需求量大约为
6.5×(2016-2010)+260.2=6.5×6+260.2=299.2(万吨). [12分]
返回
课时作业
1.(2016·衡水质检)具有线性相关关系的变量x,y满足一组数据如下表所
示.若y与x的线性回归方程为 ,则m的值是
1 2 3 4 5 6 7 8 9 10
答案 解析
x 0 1 2 3
y -1 1 m 8
√
2.(2017·武汉质检)根据如下样本数据
x 3 4 5 6 7 8
y 4.0 2.5 -0.5 0.5 -2.0 -3.0
1 2 3 4 5 6 7 8 9 10
答案 解析
√
作出散点图如下:
1 2 3 4 5 6 7 8 9 10
3.(2017·泰安月考)为了普及环保知识,增强环保意识,某大学从理工类
专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试.统计
得到成绩与专业的列联表:
优秀 非优秀 总计
A班 14 6 20
B班 7 13 20
总计 21 19 40
1 2 3 4 5 6 7 8 9 10
附:参考公式及数据:
(2)独立性检验的临界值表:
P(K2≥k0) 0.050 0.010
k0 3.841 6.635
1 2 3 4 5 6 7 8 9 10
则下列说法正确的是
A.有99%的把握认为环保知识测试成绩与专业有关
B.有99%的把握认为环保知识测试成绩与专业无关
C.有95%的把握认为环保知识测试成绩与专业有关
D.有95%的把握认为环保知识测试成绩与专业无关
答案 解析
√
3.841
相关文档
- 高科数学专题复习课件:第十一章 11_2021-06-1967页
- 高科数学专题复习课件:第十章 10_32021-06-1954页
- 高科数学专题复习课件:第十二章 12_2021-06-1971页
- 高科数学专题复习课件:6_2 等差数2021-06-1967页
- 高科数学专题复习课件:第十二章 12_2021-06-1784页
- 高科数学专题复习课件:第二章 2_3函2021-06-1659页
- 高科数学专题复习课件:第三章 3_1导2021-06-1654页
- 高科数学专题复习课件:第一章 1_2命2021-06-1650页
- 高科数学专题复习课件:8_5 直线、2021-06-1686页
- 高科数学专题复习课件:高考专题突破2021-06-1647页