• 1.43 MB
  • 2021-06-24 发布

2021版高考数学一轮复习第十章统计与统计案例10-3变量的相关性与统计案例课件苏教版

  • 24页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第三节 变量的相关性 与统计案例 内容索引 必备知识 · 自主学习 核心考点 · 精准研析 核心素养 · 微专题 核心素养测评 【 教材 · 知识梳理 】 1. 独立性检验 一般地 , 对于两个研究对象 Ⅰ 和 Ⅱ,Ⅰ 有两类取值 , 即类 A 和类 B( 如吸烟与不吸烟 );Ⅱ 也有两类取值 , 即类 1 和类 2( 如患呼吸道疾病和未患呼吸道疾病 ). 我们得到如下列联表所示的抽样数据 : Ⅱ 类 1 类 2 合计 Ⅰ 类 A a b a+b 类 B c d c+d 合  计 a+c b+d a+b+c+d 要推断“ Ⅰ 与 Ⅱ 有关系” , 可按下面的步骤进行 : (1) 提出假设 H 0 ;Ⅰ 与 Ⅱ 没有关系 . (2) 根据 2×2 列联表与公式 χ 2 = 计算 χ 2 的值 . (3) 参照表中临界值 , 作出判断 . 2. 回归分析 (1) 线性回归方程 直线 称为线性回归方程 . (2) 样本相关系数 r. ① 计算公式 r= ② 性质 : A.|r|≤1;B.|r| 越接近于 1,x,y 的线性相关程度越强 ;C.|r| 越接近于 0,x,y 的线 性相关程度越弱 . ③ 基本步骤 : A. 提出统计假设 H 0 : 变量 x,y 不具有线性相关关系 ; B. 如果以 95% 的把握作出推断 , 那么可以根据 1-0.95=0.05 与 n-2 在附录 2 中查出一个 r 的临界值 r 0.05 ( 其中 1-0.95=0.05 称为检验水平 ); C. 计算样本相关系数 r; D. 作出统计推断 : 若 |r|>r 0.05 , 则否定 H 0 , 表明有 95% 的把握认为 x 与 y 之间具有线性相关关系 ; 若 |r|≤r 0.05 , 则没有理由拒绝原来的假设 H 0 , 即就目前数据而言 , 没有充分理由认为 y 与 x 之间有线性相关关系 . 【 知识点辨析 】   ( 正确的打“√” , 错误的打“ ×”) (1)“ 名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系 . (    ) (2) 散点图是判断两个变量是否相关的一种重要方法和手段 . (    ) (3) 通过回归直线方程 可以估计预报变量的取值和变化趋势 . (    ) (4) 回归直线方程 至少经过点 (x 1 ,y 1 ),(x 2 ,y 2 ),…,(x n ,y n ) 中的一个点 . (    ) (5) 因为由任何一组观测值都可以求得一个线性回归方程 , 所以没有必要进行相 关性检验 . (    ) (6) 事件 X,Y 关系越密切 , 则由数据计算得到的 χ 2 的值越大 . (    ) 提示 : (1)√. 名师出高徒显示的是正相关关系 . (2)√. 散点图可以直观反映是否相关 . (3)√. 由回归直线方程的意义可知其正确 . (4) × . 回归直线可能不经过任意一个数据点 . (5) × . 由任何一组观测值都可以求得一个线性回归方程 , 但可能没有任何意义 . (6)√. χ 2 的值越大 , 相关的可能性越大 . 【 易错点索引 】 序号 易错警示 典题索引 1 相关系数 r 与相关性强弱的关系 考点一、 T2,3 2 χ 2 的值越大 , 相关的可能性越大 . 考点二、典例 3 先由散点图、相关系数确定相关性 , 再计算回归方程 , 预测才有意义 考点三、 角度 2 【 教材 · 基础自测 】 1.( 必修 3P76 例 1 改编 ) 某研究机构对高三学生的记忆力 x 和判断力 y 进行统计分析 , 所得数据如表 : x 6 8 10 12 y 2 3 5 6 则 y 对 x 的线性回归直线方程为 (    ) A. =2.3x-0.7 B. =2.3x+0.7 C. =0.7x-2.3 D. =0.7x+2.3 【 解析 】 选 C. 易求 =9, =4, 样本点的中心 (9,4) 代入验证 , 满足 =0.7x-2.3. 2.( 选修 2-3P109 练习 T1 改编 ) 设某大学的女生体重 y( 单位 :kg) 与身高 x( 单位 :cm) 具有线性相关关系 , 根据一组样本数据 (x i ,y i )(i=1,2,…,n), 用最小二乘法建立 的回归方程为 =0.85x-85.71, 则下列结论中不正确的是 (    ) A.y 与 x 具有正的线性相关关系 B. 回归直线过样本点的中心 ( , ) C. 若该大学某女生身高增加 1 cm, 则其体重约增加 0.85 kg D. 若该大学某女生身高为 170 cm, 则可断定其体重必为 58.79 kg 【 解析 】 选 D. 由于线性回归方程中 x 的系数为 0.85, 因此 y 与 x 具有正的线性相关 关系 , 故 A 正确 ; 又线性回归方程必过样本点的中心 ( , ), 故 B 正确 ; 由线性回 归方程中系数的意义知 ,x 每增加 1 cm, 其体重约增加 0.85 kg, 故 C 正确 ; 当某女生 的身高为 170 cm 时 , 其体重估计值是 58.79 kg, 而不是具体值 , 故 D 不正确 . 3.( 选修 2-3P97 练习 T2 改编 ) 为了判断高中三年级学生是否选修文科与性别的关系 , 现随机抽取 50 名学生 , 得到如下 2×2 列联表 : 理科 文科 男 13 10 女 7 20 已知 P(χ 2 ≥3.841)≈0.05,P(χ 2 ≥5.024)≈0.025. 根据表中数据 , 得到 χ 2 = ≈4.844. 则有 ________ 的把握认为选修文科与性别有关系 .  【 解析 】 χ 2 ≈4.844, 这表明小概率事件发生 . 根据假设检验的基本原理 , 应该断定有 95% 的把握认为选修文科与性别之间有关系 . 答案 : 95% 核心素养 数据分析 —— 线性回归方程应用中的数据分析能力  【 素养诠释 】 在现实生活中有许多问题应当先做调查研究 , 收集数据 , 通过分析作出判断 , 体会数据中蕴涵的信息 ; 对于同样的数据可以有多种分析的方法 , 需要根据问题的背景选择合适的方法 ; 通过数据分析体验随机性 , 一方面 , 对于同样的事情每次收集到的数据可能不同 ; 另一方面 , 只要有足够的数据就可以从中发现规律 . 数据分析是统计的核心 . 【 典例 】 某电视厂家准备在五一举行促销活动 , 现在根据近七年的广告费与销售量的数据确定此次广告费支出 . 广告费支出 x( 万元 ) 和销售量 y( 万台 ) 的数据如下 : 年份 2012 2013 2014 2015 2016 2017 2018 广告 费支 出 x 1 2 4 6 11 13 19 销售 量 y 1.9 3.2 4.0 4.4 5.2 5.3 5.4 (1) 若用线性回归模型拟合 y 与 x 的关系 , 求出 y 关于 x 的线性回归方程 ( 其中 x i y i =279.4; ) (2) 若用模型 y=c+d 拟合 y 与 x 的关系 , 可得回归方程 =1.63+0.99 , 经计算线性回归模型和该模型的 R 2 分别约为 0.75 和 0.88, 请用 R 2 说明选择哪 个回归模型更好 . (3) 已知利润 z 与 x,y 的关系为 z=200y-x. 根据 (2) 的结果回答 : 当广告费 x=20 时 , 销售量及利润的预测值是多少 ?( 精确到 0.01) 参考数据 : ≈2.236. 【 素养立意 】 将数据代入相关公式计算 , 运用获得的结果结合相关指数的意义进行解释 , 通过回归方程进行预测 . 【 解析 】 (1) 由题意有 =8, =4.2, x i y i =279.4, =708, 所以 =0.17, 所以 y 关于 x 的线性回归方程为 =0.17x+2.84; (2)R 2 越接近于 1, 模型的拟合效果越好 , 故选用 =1.63+0.99 更好 ; (3) 广告费 x=20 时 , 销售量预测值为 =1.63+0.99 ≈6.057≈6.06( 万台 ), 故利润的预测值为