• 114.50 KB
  • 2021-06-16 发布

人教A版数学必修三2-2-2众数中位数平均数

  • 6页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
§2.2.2 用样本的数字特征估计总体的数字特征 一、教材分析 教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数 的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某 些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让 学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在 得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进 一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样 本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、 均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表, 用教科书中的方法也可以得到总体的中位数、均值和众数的估计. 教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还 需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性 思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考 栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用. 二、教学目标 1、知识与技能 (1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。 (2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如 平均数、标准差),并做出合理的解释。 (3)会用样本的基本数字特征估计总体的基本数字特征。 (4)形成对数据处理过程进行初步评价的意识。 2、过程与方法 在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思 想和逻辑推理的数学方法。 3、情感态度与价值观 会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作 用,能够辨证地理解数学知识与现实世界的联系。 三、重点难点 教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体 的基本数字特征;体会样本数字特征具有随机性. 教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简 单的实际问题. 四、课时安排 2 课时 五、教学设计 第 1 课时 众数、中位数、平均数 (一)导入新课 思路 1 在一次射击比赛中,甲、乙两名运动员各射击 10 次,命中环数如下﹕ 甲运动员:7,8,6,8,6,5,8,10,7,4; 乙运动员:9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握 总体的规律,我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计 总体的数字特征.(板书课题) 思路 2 在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征, 例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然 不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的 寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征 来估计总体的数字特征. (二)推进新课、新知探究、提出问题 (1)什么是众数、中位数、平均数? (1)如何绘制频率分布直方图? (3)如何从频率分布直方图中估计众数、中位数、平均数? 活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导. 讨论结果: (1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小 顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均 数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息. (2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定 组距与组数;将数据分组;列频率分布表;画频率分布直方图. (3)教材前面一节在调查 100 位居民的月均用水量的问题中,从这些样本数据的频率分布直方 图可以看出,月均用水量的众数是 2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水 量为 2.25 t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少. 请大家翻回到课本看看原来抽样的数据,有没有 2.25 这个数值呢?根据众数的定 义,2.25 怎么会是众数呢?为什么?(请大家思考作答) 分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而 2.25 是由样 本数据的频率分布直方图得来的,所以存在一些偏差. 提问:那么如何从频率分布直方图中估计中位数呢? 分析:在样本数据中,有 50%的个体小于或等于中位数,也有 50%的个体大于或等于中位 数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的 直方图的面积应该相等.由此可以估计出中位数的值为 2.02. 思考:2.02 这个中位数的估计值,与样本的中位数值 2.0 不一样,你能解释其中的原因吗?(原 因同上:样本数据的频率分布直方图把原始的一些数据给遗失了) 课本显示,大部分居民的月均用水量在中部(2.02 t 左右),但是也有少数居民的月均用水 量特别高,显然,对这部分居民的用水量作出限制是非常合理的. 思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不 敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例) 对极端值不敏感有利的例子:考察课本中表 21 中的数据,如果把最后一个数据错写成 22, 并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据 的影响,而在实际应用中,人为操作的失误经常造成错误数据. 对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作, 这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒 这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数 对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均 工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况. 同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于 频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的 月均用水量的平均值为 2.02 t. 显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样 本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具 有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数 据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的 月均用水量与平均数相差太多了. 利用频率分布直方图估计众数、中位数、平均数: 估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等. 估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本 众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中 排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值 越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的 平均水平,是一组数据的“重心”. (三)应用示例 思路 1 例 1 (1)若 M 个数的平均数是 X,N 个数的平均数是 Y,则这 M+N 个数的平均数是 ___________; ( 2 ) 如 果 两 组 数 x1,x2,…,xn 和 y1,y2,…,yn 的 样 本 平 均 数 分 别 是 x 和 y, 那 么 一 组 数 x1+y1,x2+y2,…,xn+yn 的平均数是___________. 活动:学生思考或交流,教师提示,根据平均数的定义得到结论. 解:(1) NM NYMX   ; (2) 2 yx  . 例 2 某校高一年级的甲、乙两个班级(均为 50 人)的语文测试成绩如下(总分:150 分), 试确定这次考试中,哪个班的语文成绩更好一些. 甲班: 112 86 106 84 100 105 98 102 94 107 87 112 94 94 99 90 120 98 95 119 108 100 96 115 111 104 95 108 111 105 104 107 119 107 93 102 98 112 112 99 92 102 93 84 94 94 100 90 84 114 乙班: 116 95 109 96 106 98 108 99 110 103 94 98 105 101 115 104 112 101 113 96 108 100 110 98 107 87 108 106 103 97 107 106 111 121 97 107 114 122 101 107 107 111 114 106 104 104 95 111 111 110 分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个 班的平均分即可. 解:用计算器分别求出甲班的平均分为 101.1,乙班的平均分为 105.4,故这次考试乙班成 绩要好于甲班. 思路 2 例 1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠 时间. 睡眠时间 人数 频率 [6,6.5) 5 0.05 [6.5,7) 17 0.17 [7,7.5) 33 0.33 [7.5,8) 37 0.37 [8,8.5) 6 0.06 [8.5,9) 2 0.02 合计 100 1 分析:要确定这 100 名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个 体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示. 解法一:总睡眠时间约为 6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h), 故平均睡眠时间约为 7.39 h. 解法二:求组中值与对应频率之积的和 6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h). 答:估计该校学生的日平均睡眠时间约为 7.39 h. 例 2 某单位年收入在 10 000 到 15 000、15 000 到 20 000、20 000 到 25 000、25 000 到 30 000、 30 000 到 35 000、35 000 到 40 000 及 40 000 到 50 000 元之间的职工所占的比分别为 10%,15%,20%,25%,15%,10%和 5%,试估计该单位职工的平均年收入. 分析:上述百分比就是各组的频率. 解:估计该单位职工的平均年收入为 12 500×10%+17 500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元). 答:估计该单位人均年收入约为 26 125 元. (四)知能训练 从甲、乙两个公司各随机抽取 50 名员工月工资: 甲公司: 800 800 800 800 800 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 500 1 500 1 500 1 500 1 500 1 500 1 500 2 000 2 000 2 000 2 000 2 000 2 500 2 500 2 500 乙公司: 700 700 700 700 700 700 700 700 700 700 700 700 700 700 700 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 6 000 8 000 10 000 试计算这两个公司 50 名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资. 答案:甲公司:员工月工资平均数 1 240,众数 1 200,中位数 1 200; 乙公司:员工月工资平均数 1 330,众数 1 000,中位数 1 000;从总体上看乙公司员工月工资比 甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数. (五)拓展提升 “用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误 导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层 次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数 比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回 答有关工资待遇方面的提问. 你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释? 这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确 理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水 平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含 义. 在这里应该注意以下几点: 1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一 部分信息,通常用于描述分类变量的中心位置. 2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用 了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入 错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟 样本,向学生展示错误数据对样本中位数的影响程度. 3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中 位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的 中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对 样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用 “去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或 过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公 平性 . 4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在 许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解 样本数据中极端数据的信息,帮助我们作出决策. 5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一 些误导作用. (六)课堂小结 1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数), 会用样本的基本数字特征估计总体的基本数字特征; 2.平均数对数据有“取齐”的作用,代表一组数据的平均水平; 3.形成对数据处理过程进行初步评价的意识. (七)作业 习题 2.2A 组 3.