- 288.00 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第八章相关与回归分析●相关分析●回归分析\n8.1相关分析8.1.1相关分析的概念和种类8.1.1.1相关分析的概念相关关系是指现象之间确实存在的,但其关系值不确定的相互依存关系。8.1.1.2相关关系的主要特点⒈相关关系表现为数量相互依存关系⒉相关关系在数量上表现为非确定的相互依存关系。\n8.1.1.3相关关系的种类⒈从相关关系涉及的因素多少来分,可分为单相关和复相关。■两个因素之间的相关关系,称为单相关,也称一元相关。■三个或三个以上因素的相关关系称为复相关,也称多元相关。例:研究施肥量、浇水量、密植量和产量的关系。\n⒉从相关关系的表现形式来分,可分为直线相关的曲线相关■直线相关是指当x值发生变动时,因变量y值随之发生大致相等的变化,从图形上看观察值近似地表现为直线的形式。..........\n■曲线相关:指当x值发生变动时,但这种变动不是均等的,如果画有图上其观察点的分布表现为各种不同的曲线形式。\n⒊直线相关按照变化的方向来分,可分为正相关和互相关。正相关是指在直线相关中,两个变量的变动方向相同,即自变量(x)的数值增加,因变量(y)的数值也相应增加。例:施肥量增加,产量增加负相关是指在直线相关中,两个变量的变动方向相反,即自变量的数值增加,因变量的数值减少。例:劳动生产率提高,成本降低\n⒋按相关的密切程度来分,可分为完全相关、不完全相关和不相关。完全相关是指两个变量之间有确定的函数关系。如果不存在严格的函数关系是不完全相关。当一个变量变化,另一个不变化,或呈现不规则变化,两者没有相关关系是不相关。\n8.1.1.4相关分析的主要内容⒈确定现象之间有无相关关系及相关关系的表现形式。这个问题是相关分析的出发点,因为只在存在相关关系,才能用相关分析的方法进行分析。通常是借助相关表和相关图来判断。\n⒉确定相关关系的密切程度确定的方法是绘制相关图和计算相关系数。相关图能帮助我们做一般性的判断,相关系数则能从数量上明确地说明关系的密切程度。\n⒊测定两个变量之间的一般关系值即建立函数关系的近似表达式,并作为判断,推息和预测的根据。\n⒋测定因变量估计值和实际值之间的差异,用来反映应变量估计值的可靠性。测定的差异小,说明估计值比较可靠,测定的差异大,说明估计值不够准确。在相关分析中用来反映因变量估计值的准确程度的指标,叫估计标准差。\n8.1.2相关分析方法8.1.2.1相关表和相关图⒈相关表编制程序:①将相关资料的两个变量,分别为自变量和因变量。②将两个变量值一一对应,按自变量的变量值从小到大顺序排列。\n【例8-1】机床使用年限与维修费相关表序号机床歙用年限x年维修费y1232022320334004441055480665607690086920\n说明:机床使用年限和维修费用的关系虽然不十分严格,但有直线相关的趋势(即y值随着x值的增大而相应增大),而且大致可以看出关系比较密切。\n⒉相关图\n3.1.2.2相关系数\n判断标准:■R的绝对值越接近于1,表明相关关系越密切;越接近于0,表明相关关系越不密切。■R等于+1或-1,表明现种现象完全相关。■R等于0,表明两变量无直线相关关系。■r>0,表明现象呈正直线相关,r<0,表明现象呈负直线相关。实际中,︱r︱<0.3视为无相关,0.3≤︱r︱<0.5为低度相关,0.5≤︱r︱<0.8为显暑相关;︱r︱≥0.8为高度相关。\n【例8-2】某地国内生产总值和社会商品零售总额资料年份国内生产总值(亿元)社会商品零售总额(亿元)19943920199545221996522619976334199870361999803920008540根据资料计算相关系数\n解:计算结果列表计算如下:国内生产总值(亿元)x商品零售总额(亿元)y3920-23-112385291214522-17-9153289815226-10-55010025633413319703685406425803918814432464854023920752981--8501836406\n据上表资料得:\n8.2回归分析8.2.1回归分析的概念现象之间的相关关系,虽然不是严格的函数关系,但现象之间的一般关系值,可以通过函数关系的近似表达式来反映,这种表达式根据相关现象的实际对应资料,运用数学的方法来建立,这类数学方法称为回归分析。\n8.2.2回归分析的特点⒈回归分析的两个变量是非对等关系。相关关系的两个变量是对等的,回归分析的两个变量是因果关系,必须明确哪个是自变量,哪个是因变量。⒉在回归分析中,因变量是随机变量,自变量是可控制变量。\n8.2.3回归分析的内容⒈确定现象之间相关关系的数学模型⒉测定数学模型的拟合精度数学模型是现象间相关与回归关系的数量描述形式,模型拟合的精度,直接影响着统计分析结论的准确性。因此,在模型建立后,需要对其精度进行检验。统计上一般通过计算估计标准误差来测定。估计标准差小,说明模型的拟合精度高。\n8.2.4回归模型的建立与检测8.2.4.1一元线性回归模型⒈配合直线回归的前提条件①现象之间确实存在数量上的相互关系②现象之间存在直线相关关系③要有一定数量的自变量与因变量的对应资料,而且要确定哪个是自变量,哪个是应变量。\n⒉如何配合回归直线问题:因为配合直线的意思是说要找到一条直线,用直线上的点来代表所有的相关点,但是为了代表所有的相关点,可以画出无数条直线。···········\n分析:哪条直线最合理?高等数学证明了符合“离差平方和最少”的这个条件的直线最合理。也就是说使观察值Y与配合直线上的对应点估计值ŷ之间的误差平方和为最小。用数学式子表示:根据“离差平方和最小”这个条件去求解最合理的直线称为最小平方法。\n⒊直线回归方程及其求解公式\n【例8-3】序号机床使用年限X维修费YX²XYŶ1240048002254041080481.553352091560557.704464016256054740162960656002530007580025400086700364200967603645601069003654001188406467201291080819720合计60852035246560\n解:根据上表计算结果代入公式得:8520=12a+60b46560=60a+352bb=76.15a=329.25Ŷ=329.25+76.15xa=329.25元这是维修费的起点值b=76.15这是机床使用年限增加一年时,维修费的平均增加值\n8.2.4.2估计标准差⒈根据因变量实际值和估计值的离差计算:⒉根据a.b两个参数值计算\n8.2.4.3相关系数和估计标准误差的关系\n■根据相关系数推断估计误差\n本章小结一、理论体系讲两大问题:相关分析相关关系概念特点种类相关分析内容方法\n回归分析回归模型的建立与检测内容特点概念\n二、学习方法指导了解相关关系的概念、特点及其种类重点掌握相关系数的计算和判断相关程度。重点掌握直线回归分析,懂得计算估计标准误差。