- 921.50 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.
4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
知识点一 用样本的频率分布估计总体分布
1.通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.
2.在频率分布直方图中,纵轴表示______,数据落在各小组内的频率用__________________表示,各小长方形的面积总和等于____.
3.连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的______增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为____________,它能够更加精细的反映出总体在各个范围内取值的百分比.
4.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
答案
2. 各小长方形的面积 1
3.组数 总体密度曲线
1.判断正误
(1)在频率分布直方图中,小矩形的高表示频率.( )
(2)频率分布直方图中各个长方形的面积之和为1.( )
答案:(1)× (2)√
2.(2016·山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60
C.120 D.140
解析:由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D.
答案:D
3.甲、乙两个班各随机选出15名同学进行测验,所得成绩的茎叶图如图.从图中看________班的平均成绩较高.
解析:结合茎叶图中成绩的情况可知,乙班平均成绩较高.
答案:乙
知识点二 用样本的数字特征估计总体的数字特征
1.众数、中位数、平均数
(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:样本数据的算术平均数,即=__________________.在频率分布直方图中,中位数左边和右边的直方图的面积______.
2.样本方差、标准差
标准差s=________________________________________.
其中xn是样本数据的第n项,n是样本容量,是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
答案
1.(3)(x1+x2+…+xn) 相等
2.
4.某厂10名工人在一个小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
解析:把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,中位数b==15,众数c=17,则a0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.
热点二 茎叶图及应用
【例3】 (2017·福州模拟)某大学为调查来自南方和北方的大学生的身高差异,从2013级的年龄在18—19岁之间的大学生中随机抽取了来自南方和北方的大学生各10名,测量得他们的身高(单位:cm)如下:
南方:158,170,166,169,180,175,171,176,162,163.
北方:183,173,169,163,179,171,157,175,178,166.
画出题中两组数据的茎叶图,并根据茎叶图对来自南方和北方的大学生的身高进行比较,写出两个统计结论.
【解】 题中两组数据的茎叶图如图所示:
统计结论:①北方大学生的平均身高大于南方大学生的平均身高;②南方大学生的身高比北方大学生的身高更整齐;③南方大学生的身高的中位数是169.5,北方大学生的身高的中位数是172;④南方大学生的身高基本上是对称的,而且大多数集中在均值附近,北方大学生的身高分布较分散.
【总结反思】
(1)茎叶图保留了全部的样本数据;(2)从茎叶图上可以发现样本数据的分散与集中程度,从而对样本数据的平均值和方差作出定性判断.
(1)某中学从甲、乙两个艺术班中各选出7名学生参加市级才艺比赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是83,则x+y的值为( )
A.6 B.8 C.9 D.11
(2)为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近6次数学测试的分数进行统计,甲、乙两人的平均成绩分别是甲、乙,则下列说法正确的是( )
A.甲>乙,乙比甲成绩稳定,应选乙参加比赛
B.甲>乙,甲比乙成绩稳定,应选甲参加比赛
C.甲<乙,甲比乙成绩稳定,应选甲参加比赛
D.甲<乙,乙比甲成绩稳定,应选乙参加比赛
解析:(1)由茎叶图可知,茎为8时,甲班学生成绩对应数据只能是80,80+x,85,因为甲班学生成绩众数是85,所以85出现的次数最多,可知x=5.由茎叶图可知,乙班学生成绩为76,81,81,80+y,91,91,96,由乙班学生成绩的中位数是83,可知y=3.所以x+y=8.故选B.
(2)由茎叶图知甲==82.乙=
≈87.33.所以甲<乙,又由乙的茎集中在8,而甲较分散,即乙比甲成绩稳定.故选D.
答案:(1)B (2)D
热点三 样本的数字特征
【例4】 (必修③P79练习第3题改编)将甲、乙两个篮球队10场比赛的得分数据整理成如图所示的茎叶图,由图可知( )
A.甲、乙两队得分的中位数相等
B.甲、乙两队得分的平均数相等
C.甲、乙两队得分的极差相等
D.甲、乙两队得分的方差相等
【解析】 由中位数定义知,甲的中位数为=37,乙的中位数为=37.5,故选项A错误;由平均数定义得甲=(24+26+33+33+36+38+43+47+49+51)=38,乙=(22+25+32+33+34+41+44+45+51+53)=38,故选项B正确;由极差定义得,甲的极差为51-24=27,乙的极差为53-22=31,故选项C错误;由方差定义知,s=[(24-38)2+(26-38)2+…+(51-38)2]=79,s=[(22-38)2+(25-38)2+…+(53-38)2]=99,故选项D错误.故选B.
【答案】 B
【总结反思】
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(1)对于一组数据xi(i=1,2,3,…,n),如果将它们改变为xi+C(i=1,2,3,…,n),其中C≠0,则下列结论正确的是( )
A.平均数与方差均不变 B.平均数变,方差保持不变
C.平均数不变,方差变 D.平均数与方差均发生变化
(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为( )
A. B.
C.36 D.
解析:(1)依题意,记原数据的平均数为,方差为s2,则新数据的平均数为
=+C
,即新数据的平均数改变;新数据的方差为{[(x1+C)-(+C)]2+[(x2+C)-(+C)]2+…+[(xn+C)-(+C)]2}=s2,即新数据的方差不变.
(2)根据茎叶图,去掉1个最低分87,1个最高分99,则[87+94+90+91+90+(90+x)+91]=91,所以x=4.所以s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=.
答案:(1)B (2)B
1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
3.若取值x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均值为x1p1+x2p2+…+xnpn;若x1,x2,…,xn的平均数为,方差为s2,则ax1+b,ax2+b,…,axn+b的平均数为a+b,方差为a2s2.
频率分布直方图易误点梳理
利用频率分布直方图估计总体的基本数字特征,简单地说,就是能“制图”,会“用图”,而我们在应用中产生的错误也主要发生在这两个过程中.
错误一、制图——分组不对,频数统计错误
【例1】 某校在开学之初,以班级为单位,对学生自行购买保险的情况进行了抽样统计,得到了如下20个班级购买保险人数情况:
12,9,5,11,10,22,28,6,30,14,15,12,16,26,18,27,22,14,12,5
试作出该样本的一个频率分布直方图.
【错解】 这组数据的极差为30-5=25,将组距定为5,组数定为5,则可将20个数据分为[5,10],[10,15],[15,20],[20,25],[25,30]这5组,得到每组的频数分别为5,8,3,2,4.(剩余解答略)
【正解】 在上述解答中,各小组频数之和为22,大于样本容量,显然是错误的.原因是分组区间全是双闭区间,则数据“10”在第一组和第二组均被计入频数,数据“15”也是如此.
在分组时,应将20个数据分为[5,10),[10,15),[15,20),[20,25),[25,30]这5组,得到每组的频数分别为4,7,3,2,4.(剩余解答略)
【易错总结】 分组时,每组所在区间一般是选择“左闭右开”
,而不是“双闭”或“双开”,防止某些数据漏选或被多次计入不同小组,从而导致频数统计失误.规避这种失误,可以检查各组频数之和是否等于样本容量.
错误二、用图——将频率分布直方图的纵坐标“”误认为是“频率”
【例2】 某校高一年级有400名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]后得到如图的频率分布直方图.求该校高一年级期中考试数学成绩不低于80分的人数.
【错解】 根据频率分布直方图知,成绩不低于80分的频率为0.025+0.01=0.035.∴该校高一年级期中考试数学成绩不低于80分的人数为400×0.035=14.
【正解】 根据频率分布直方图知,成绩不低于80分的频率为(0.025+0.01)×10=0.35.∴该校高一年级期中考试数学成绩不低于80分的人数为400×0.35=140.
【例3】
对某校七年级100名学生每周的零用钱(单位:元)进行统计,得到频率分布直方图如图所示,其中第3小组的频率为0.34,第1,2,4,5小组的频率形成了公差为0.03的等差数列,求图中a的值.
【错解】 由于各小组的频率之和为1,且第3小组频率为0.34,则第1,2,4,5小组频率之和为0.66.这4个小组的频率形成了公差为0.03的等差数列,设首项为a1,则由等差数列前4项之和为0.66,可得a1=0.12,则第2小组的频率为0.15,故a=0.15.
【正解】 第2小组频率的计算过程完全正确,第2小组的频率等于0.15,但并不意味着a=0.15.因为第2小组的矩形的面积才是第2小组的频率,故矩形的高为=0.03,即a=0.03.
【易错总结】 频率分布直方图中,关键要理解图中数据的意义,特别是图中每个小矩形的面积才是这一组距内个体的频率.最高矩形的中点是众数,将直方图的面积一分为二的垂直横轴的直线所对应的数值是中位数.
总之,我们要明确对频率分布直方图的绘制及结构认识.事实上频率分布直方图中的每个小矩形的面积表示该组的频率,纵轴表示“”.