- 33.50 KB
- 2021-06-19 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
变量间的相关关系、统计案例
主标题:变量间的相关关系、统计案例
副标题:为学生详细的分析变量间的相关关系、统计案例的高考考点、命题方向以及规律总结。
关键词:相关关系,线性回归方程,独立性检验
难度:2
重要程度:4
考点剖析:
1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
4.了解回归分析的基本思想、方法及其简单应用.
命题方向:
1.独立性检验是一种统计案例,是高考命题的一个热点,多以解答题的形式出现,试题难度不大,多为中档题.
2.高考中对独立性检验的考查主要有以下几个命题角度:
(1)已知分类变量数据,判断两类变量的相关性;
(2)已知某些数据,求分类变量的部分数据;
(3)已知χ2,判断几种命题的正确性.
规律总结:
1种求法——相关关系的判定和线性回归方程的求法
(1)函数关系一种理想的关系模型,而相关关系是一种更为一般的情况.
(2)如果两个变量不具有线性相关关系,即使求出回归直线方程也毫无意义,而且用其进行估计和预测也是不可信的.
(3)回归直线方程只适用于我们所研究的样本的总体.样本的取值范围一般不超过回归直线方程的适用范围,否则就没有实用价值.
1个难点——独立性检验思想的理解
独立性检验的思想类似于反证法,即要确定“两个变量X和Y有关系”这一结论成立的可信度,首先假设结论不成立,即它们之间没关系,也就是它们是相互独立的,利用概率的乘法公式可推知,(ad-bc)接近于零,也就是随机变量χ2=应该很小,如果计算出的χ2不是很小,通过查表P(χ2≥k)的概率很小.又根据小概率事件不可能发生,由此判断假设不成立,从而可以肯定地断言X与Y之间有关系.
知 识 梳 理
1.相关性
(1)线性相关:
若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的,此时可用一条直线来近似.
(2)非线性相关:
若两个变量x和y的散点图中,所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关,此时可用一条曲线来拟合.
(3)不相关
如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.
2.最小二乘法
(1)最小二乘法:
如果有n个点(x1,y1),(x2,y2),……,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+……+[yn-(an+bxn)]2使得上式达到最小值的直线y=a+bx即所求直线,这种方法称为最小二乘法.
(2)线性 回归方程:
线性回归方程为y=bx+a,其中b=,
a=-b.
3.相关系数r
(1)r==.
(2)当r>0时,称两个变量正相关.
当r<0时,称两个变量负相关.
当r=0,称两个变量线性不相关.
r的绝对值越接近于1,表明两个变量之间的线性相关程度越高;r的绝对值越接近于0,表明两个变量之间的线性相关程度越低.
4.独立性检验
(1)2×2列联表:
设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=;变量B:B1,B2=,通过观察得到下表所示的数据:
B
A
B1
B2
总计
A1
a
b
a+b
A2
c
d
c+d
总计
a+c
b+d
n=a+b+c+d
其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.
(2)独立性判断方法:
选取统计量χ2=,用它的大小来检验变量之间是否独立.
①χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;
②χ2>2.706时,有90%的把握判定变量A,B有关联;
③当χ2>3.841时,有95%的把握判定变量A,B有关联;
④当χ2>6.635时,有99%的把握判定变量A,B有关联.