• 519.00 KB
  • 2021-06-24 发布

高一数学 (人教版必修3):第四章 线性回归方程 word版含解析

  • 13页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
重点列表: 重点 名称 重要指数 重点 1 相关关系的判断 ★★★★ 重点 2 线性回归方程有关概念 ★★★ 重点 3 散点图 ★★★★ 重点详解: 1.变量间的相关关系 常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是________;与函数关 系不同,相关关系是一种________关系,带有随机性. 2.两个变量的线性相关 (1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有 ____________,这条直线叫________. (2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系 称为________;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称 为________. ※ (3)相关系数 r=       n j j n i i n i ii yyxx yyxx 1 2 1 2 1 )()( ))(( ,当 r>0 时,表示两个变量正相关;当 r<0 时,表示两个 变量负相关.r 的绝对值越接近________,表示两个变量的线性相关性越强;r 的绝对值 越接近________,表示两个变量的线性相关性越弱.通常当 r 的绝对值大于 0.75 时,认 为两个变量具有很强的线性相关关系. 3.回归直线方程 (1)通过求 Q=    n i ii xy 1 2)(  的最小值而得出回归直线的方法,即使得样本数据的点到回 归直线的距离的平方和最小的方法叫做____________.该式取最小值时的α,β的值即分别 为,. (2)两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方 程为 axby ˆˆˆ  ,则                       .ˆˆ , )( ))(( ˆ 1 22 1 1 2 1 xbya xnx yxnyx xx yyxx b n i i n i ii n i i n i ii 【答案】 1.相关关系 非确定性 2.(1)线性相关关系 回归直线 (2)正相关 负相关 (3)1 0 3.最小二乘法 重点 1:相关关系的判断 【要点解读】 在研究两个变量之间是否存在某种关系时,必须从散点图入手.对于散点图,可以做出如下 判断: (1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之 间具有函数关系. (2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系. (3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. 【考向 1】确定性关系与随机关系 【例题】下列变量之间的关系不是..相关关系的是( ) A.已知二次函数 y=ax2+bx+c,其中 a,c 是已知常数,取 b 为自变量,因变量是这个函数 的判别式Δ=b2-4ac B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩施用肥料量和粮食亩产量 解:由函数关系和相关关系的定义可知,A 中Δ=b2-4ac,因为 a,c 是已知常数,b 为自变 量,所以给定一个 b 的值,就有唯一确定的Δ与之对应,所以Δ与 b 之间是一种确定的关系, 是函数关系.B,C,D 中两个变量之间的关系都是相关关系.故选 A. 【评析】要注意函数关系与相关关系的区别:函数关系是确定性关系,而相关关系是随机 的、不确定的. 重点 2:线性回归方程有关概念 【要点解读】 样本中心点一定在回归直线上 【考向 1】样本中心点 【例题】为了考查两个变量 x 和 y 之间的线性关系,甲、乙两位同学各自独立做了 10 次和 15 次试验,并且利用线性回归方法,求得回归直线分别为 l1,l2,已知两人得到的试验数据中, 变量 x 的平均值都等于 s,变量 y 的平均值都等于 t,那么下列说法正确的是( ) A.直线 l1 和 l2 一定有公共点(s,t) B.直线 l1 和 l2 相交,但交点不一定是(s,t) C.必有直线 l1∥l2 D.直线 l1 和 l2 必定重合 【评析】回归方程一定通过样本点的中心(, y );中心相同的样本点的回归方程不一定相同. 【考向 2】线性回归直线的理解 【例题】由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程 axby ˆˆˆ  ,那 么下面说法错误..的是( ) A.直线 axby ˆˆˆ  必经过点(, y ) B.直线 axby ˆˆˆ  至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点 C.直线 axby ˆˆˆ  的斜率=       n i i n i ii xnx yxnyx 1 22 1 D.直线 axby ˆˆˆ  和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差    n i ii axby 1 2)]ˆˆ([ 是该坐 标平面上所有直线与这些点的偏差中最小的 重点 3:散点图 【要点解读】 根据散点图可以直观判断正负相关以及数据所对应的函数模型 【考向 1】正相关与负相关 【例题】(1)对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10),得散点图 1;对变量 u,v 有观测数据(ui,vi)(i=1,2,…,10),得散点图 2.由这两个散点图可以判断( ) 图 1 图 2 A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关 解:由这两个散点图可以判断,变量 x 与 y 负相关,u 与 v 正相关,故选 C. 【评析】点分布在从左下角到右上角的区域时,两个变量的相关关系为正相关;点分布在从 左上角到右下角的区域时,两个变量的相关关系为负相关. (2)下面是一块田的水稻产量与施化肥量的一组观测数据(单位:kg): 施化肥量 15 20 25 30 35 40 45 水稻产量 320 330 360 410 460 470 480 (Ⅰ)将上述数据制成散点图; (Ⅱ)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥 量的增加而增长吗? 解:(Ⅰ)散点图如下: (Ⅱ)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时, 水稻产量由小变大.图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近 似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长,不会一直 随化肥施用量的增加而增长. 【评析】任何一组数据(二元数据)都可以作出散点图,散点图可以直观地观察两个变量间的 关系. 【考向 2】散点图的画法及相关关系识别 【例题】(1)从左至右,观察下列三个散点图,变量 x 与 y 的关系依次为________(正相关记 作①;负相关记作②;不相关记作③). (2)科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均 气温的统计数据(单位分别是 mm,℃),并作了统计: 年平均气温 12.51 12.84 12.84 13.69 13.33 12.74 13.05 年降 雨量 748 542 507 813 574 701 432 (Ⅰ)试画出散点图; (Ⅱ)判断两个变量是否具有线性相关关系. 解:(Ⅰ)作出散点图如图所示. (Ⅱ)由散点图可知,各点并不在一条直线附近,所以两个变量不具有线性相关关系. 难点列表: 难点 名称 难度指数 难点 1 求回归方程及用回归方程进行估计 ★★★★ 难点 2 复数的模与共轭复数 ★★★★★ 难点详解: 求线性回归直线方程的步骤 (1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系; (2)求系数b ^ :公式有两种形式,b ^ = ∑ n i=1 (xi-x - )(yi-y - ) ∑ n i=1 (xi-x - )2 = ∑ n i=1 xiyi-nx - y - ∑ n i=1 x2 i-nx - 2 ,根据题目具体情况 灵活选用; (3)求a ^ :a ^ =y - -b ^ x - ; (4)写出回归直线方程. 说明:当数据较复杂时,题目一般会给出部分中间结果,观察这些中间结果可确定选用公式 的哪种形式求b ^ . 难点 1:求回归方程及用回归方程进行估计 【要点解读】 (1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性 时,求出的回归直线方程才有实际意义,否则无意义. (2)根据回归方程进行的估计仅是一个预测值,而不是真实发生的值. (3)用最小二乘法求回归方程,关键在于正确求出系数,,由于,的计算量大,计算时应仔细 小心,分层进行(最好列出表格),避免因计算而产生错误. 【考向 1】求线性回归方程 【例题】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的生 产能耗 y(吨标准煤)的几组对照数据: x 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程; (3)已知该厂技术改造前 100 吨甲产品能耗为 90 吨标准煤,试根据(2)求出的线性回归方程, 预测生产 100 吨甲产品的生产能耗比技术改造前降低多少吨标准煤? (参考值 3×2.5+4×3+5×4+6×4.5=66.5) 解:(1)散点图如下: (2)由系数公式可知,=4.5, y =3.5, =66.5-4×4.5×3.5 86-4×4.52 =0.7, =3.5-0.7×4.5=0.35, 所以线性回归方程为 yˆ =0.7x+0.35. (3)x=100 时, yˆ =0.7x+0.35=70.35,所以预测生产 100 吨甲产品的生产能耗比技术改造 前降低 19.65 吨标准煤. 【评析】牢记求线性回归方程的步骤:(1)列表;(2)计算, y ,   n i ii yx 1 ,   n i ix 1 2 ;(3)代入公 式求,再利用 xbya ˆˆ  求,(4)写出回归方程. 【考向 2】利用线性回归方程进行预测 【例题】从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千元)与月储 蓄 yi(单位:千元)的数据资料,算得   10 1i ix =80,   10 1i iy =20,   10 1i ii yx =184,   10 1 2 i ix =720. (1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 y=bx+a; (2)判断变量 x 与 y 之间是正相关还是负相关; (3)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄. 附:线性回归方程 y=bx+a 中, b=       n i i n i ii xnx yxnyx 1 22 1 , xbya  , 其中, y 为样本平均值,线性回归方程也可写为y^=b^x+a^. 解:(1)由题意知 n=10,=1 n   n i ix 1 =80 10 =8, y =1 n   n i iy 1 =20 10 =2,又   n i ix 1 2 - n2 =720 -10×82=80,   n i ii yx 1 -n yx =184-10×8×2=24, 由此得 b=24 80 =0.3, a= y -b=2-0.3×8=-0.4, 故所求回归方程为 y=0.3x-0.4. (2)由于变量 y 的值随 x 的值增加而增加(b=0.3>0),故 x 与 y 之间是正相关. (3)将 x=7 代入回归方程可以预测该家庭的月储蓄为 y=0.3×7-0.4=1.7(千元). 难点 2:非线性相关转化为线性相关 【要点解读】 通过观察散点图,分析其函数模型,然后转化成线性相关 【考向 1】非线性相关转化为线性相关 【例题】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x(单位:千元)对年 销售量 y(单位:t)和年利润 z(单位:千元)的影响.对近 8 年的年宣传费 xi 和年销售量 yi(i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. (1)根据散点图判断,y=a+bx 与 y=c+d x哪一个适宜作为年销售量 y 关于年宣传费 x 的回 归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程. (3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y-x.根据(2)的结果回答下列问题: ①年宣传费 x=49 时,年销售量及年利润的预报值是多少? ②年宣传费 x 为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线 v=α+β u 的斜率和截距 的最小二乘估计分别为β^ = 解题指导] 切入点:回归分析中对散点图的理解,回归方程的求法和应用;关键点:通过换 元把非线性回归方程转化为线性回归方程求解. 解] (1)由散点图可以判断,y=c+d x适宜作为年销售量y 关于年宣传费 x 的回归方程类型. (2)令 w= x,先建立 y 关于 w 的线性回归方程. c^=y-d^ w=563-68×6.8=100.6, 所以 y 关于 w 的线性回归方程为y^=100.6+68w, 因此 y 关于 x 的回归方程为y^=100.6+68 x. (3)①由(2)知,当 x=49 时, 年销售量 y 的预报值y^=100.6+68 49=576.6, 年利润 z 的预报值z^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润 z 的预报值 z^=0.2(100.6+68 x)-x=-x+13.6 x+20.12. 所以当 x=13.6 2 =6.8,即 x=46.24 时,z^取得最大值. 故年宣传费为 46.24 千元时,年利润的预报值最大. 【趁热打铁】 1.两个变量成负相关关系时,散点图的特征是( ) A.点分布在从左下角到右上角的区域 B.散点图在某方形区域内 C.散点图在某圆形区域内 D.点分布在从左上角到右下角的区域 2.对于给定的两个变量的统计数据,下列说法正确的是( ) A.都可以分析出两个变量的关系 B.都可以用一条直线通过近似表示两者关系来估计总体的均值 C.都可以作出散点图 D.都可以用确定的表达式表示两者的关系 3.下列命题: ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系; ③某商品的需求与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的; ⑤两个变量间的相关关系可以通过回归直线把非确定性问题转化为确定性问题进行研究. 其中正确的命题为( ) A.①③④ B.②④⑤ C.③④⑤ D.②③⑤ 4.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( ) A.r2