- 693.50 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
重点列表:
重点 名称 重要指数
重点 1 频率分布直方图 ★★★★
重点 2 茎叶图 ★★★
重点 3 抛物线 ★★★★
重点详解:
用样本的频率分布估计总体分布
(1)通常我们对总体作出的估计一般分成两种:一种是用样本的__________估计总体的
__________;另一种是用样本的________估计总体的__________.
(2)在频率分布直方图中,纵轴表示________,数据落在各小组内的频率用________________
表示.各小长方形的面积总和等于________.
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布________.随着样本容量
的增加,作图时所分的________增加,组距减小,相应的频率折线图会越来越接近于一条光
滑 曲 线 , 统 计 中 称 之 为 ______________________ , 它 能 够 更 加 精 细 地 反 映 出
____________________________________.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以____________________,
而且可以______________,给数据的记录和表示都带来方便.
【参考答案】
(1)频率分布 分布 数字特征 数字特征
(2)频率
组距
各小长方形的面积 1
(3)折线图 组数 总体密度曲线
总体在各个范围内取值的百分比
(4)保留所有信息 随时记录
重点 1:频率分布表、频率分布直方图及其应用
【要点解读】
用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率
分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一
定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作
出估计.
频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的
频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
【考向 1】根据数据画出频率分布直方图
【例题】某市 2013 年 4 月 1 日—4 月 30 日对空气污染指数的监测数据如下(主要污染物为可
吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,
82,82,64,79,86,85,75,71,49,45.
(1)完成下列频率分布表、频率分布直方图;
频率分布表
分组 频数 频率
41,51)
51,61)
61,71)
71,81)
81,91)
91,101)
101,111)
频率分布直方图
(2)根据国家标准,污染指数在 0~50 之间时,空气质量为优;在 51~100 之间时,为良;在
101~150 之间时,为轻微污染;在 151~200 之间时,为轻度污染.请你依据所给数据和上述
标准,对该市的空气质量给出一个简短评价.
解:(1)如图所示:
频率分布表
分组 频数 频率
41,51) 2 2
30
51,61) 1 1
30
61,71) 4 4
30
71,81) 6 6
30
81,91) 10 10
30
91,101) 5 5
30
101,111) 2 2
30
频率分布直方图
(2)答对下述两条中的一条即可:
①该市一个月中空气污染指数有 2 天处于优的水平,占当月天数的 1
15
,有 26 天处于良的水平,
占当月天数的13
15
,处于优或良的天数共有 28 天,占当月天数的14
15
.说明该市空气质量基本良
好.
②轻微污染有 2 天,占当月天数的 1
15
,污染指数在 80 以上的接近轻微污染的天数有 15 天,
加上处于轻微污染的天数,共有 17 天,占当月天数的17
30
,超过 50%,说明该市空气质量有待
进一步改善.
【评析】首先根据题目中的数据完成频率分布表,作出频率分布直方图,根据污染指数,确
定空气质量为优、良、轻微污染、轻度污染的天数;对于开放性问题的解答,要选择适当的
数据特征进行考察,根据数据特征分析得出实际问题的结论.本题主要考查运用统计知识解
决简单实际问题的能力、数据处理能力和应用意识.
【考向 2】频率分布直方图的逆用
【例题】某校 100 名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间
是:[50,60), [60,70),[70,80),[80,90),[90,100].
(1)求图中 a 的值;
(2)根据频率分布直方图,估计这 100 名学生语文成绩的平均分;
(3)若这 100 名学生的语文成绩在某些分数段的人数(x)与数学成绩在相应分数段的人数(y)之
比如下表所示,求数学成绩在[50,90)之外的人数.
分数段 [50,60) [60,70) [70,80) [80,90)
x∶y 1∶1 2∶1 3∶4 4∶5
解:(1)由(2a+0.02+0.03+0.04)×10=1,
解得 a=0.005.
(2)=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.
(3)由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:
分数段 50,60) 60,70) 70,80) 80,90)
x 5 40 30 20
x∶y 1∶1 2∶1 3∶4 4∶5
y 5 20 40 25
于是数学成绩在 50,90)之外的人数为 100-(5+20+40+25)=10.
重点 2:茎叶图
【要点解读】
茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有
样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则
损失了样本的一些信息,必须在完成抽样后才能制作.
【考向 1】根据茎叶图求方差
【例题】以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,
无法确认,在图中以 X 表示.
如果 X=8,求乙组同学植树棵数的平均数和方差;
注:方差 s2=1
n
(x1-)2+(x2-)2+…+(xn-)2],其中 x 为 x1,x2,…,xn 的平均数.
解:当 X=8 时,由茎叶图可知,乙组同学的植树棵数是 8,8,9,10,
所以平均数为=8+8+9+10
4
=35
4
;
方差为 s2=1
4
8-35
4 2+
8-35
4
2
+
9-35
4 2+
10-35
4 2]=11
16
.
【考向 2】根据茎叶图求平均数
【例题】某车间共有 12 名工人,随机抽取 6 名,他们某日加工零件个数的茎叶图如图所示,
其中茎为十位数,叶为个位数.
1 7 9
2 0 1 5
3 0
(1)根据茎叶图计算样本平均值;
(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间 12 名工人中有
几名优秀工人?
难点列表:
难点 名称 难度指数
难点 1 用样本的数字特征估计总体的数字
特征
★★★★
难点 2 导数与函数的极值、最值 ★★★
难点详解:
用样本的数字特征估计总体的数字特征
(1)众数,中位数,平均数
众数:在一组数据中,出现次数________的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的
________)叫做这组数据的中位数.
平均数:样本数据的算术平均数,即=_______.
在频率分布直方图中,中位数左边和右边的直方图的面积应该________.
(2)样本方差,样本标准差
标准差
s= ])()()[(1 22
2
2
1 xxxxxxn n ,其中 xn 是__________________,n 是________,
是________.标准差是反映总体__________的特征数,________是样本标准差的平方.通常
用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
【答案】 (1)最多 平均数 1
n
(x1+x2+…+xn) 相等
(2)样本数据的第 n 项 样本容量 平均数
波动大小 样本方差
难点 1:用样本的数字特征估计总体的数字特征
【要点解读】
能从一组数据中求出中位数、平均数和众数
【考向 1】平均数、中位数
【例题】某汽车制造厂分别从 A,B 两种轮胎中各随机抽取了 8 个进行测试,列出了每一个轮
胎行驶的最远里程数(单位:1000 km):
轮胎 A 96 112 97 108 100
103 86 98
轮胎 B 108 101 94 105 96
93 97 106
(1)分别计算 A,B 两种轮胎行驶的最远里程的平均数、中位数;
(2)分别计算 A,B 两种轮胎行驶的最远里程的极差、标准差;
(3)根据以上数据,你认为哪种型号轮胎的性能更加稳定?
(2)A 轮胎行驶的最远里程的极差为:112-86=26,
标准差为:
s=
8
)2()14(308)3(12)4( 22222222
= 221
2
≈7.43;
B 轮胎行驶的最远里程的极差为:108-93=15,
标准差为:
s=
8
6)3()7()4(5)6(18 22222222
= 118
2
≈5.43.
(3)虽然 A 轮胎和 B 轮胎的最远行驶里程的平均数相同,但 B 轮胎行驶的最远里程的极差和标
准差相对于 A 轮胎较小,所以 B 轮胎性能更加稳定.
【评析】在理解平均数、中位数、众数、极差、标准差、方差的统计意义和数学表达式的情
况下,不难作出解答.
【考向 2】平均数、标准差
【例题】某学员在一次射击测试中射靶 10 次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
则(1)平均命中环数为____________;
(2)命中环数的标准差为____________.
难点 2:根据频率分布直方图计算样本的数字特征
【要点解读】
会从频率分布直方图中求出中位数、平均数和众数
【考向 1】中位数
【例题】如图所示是一容量为 100 的样本的频率分布直方图,则由图形中的数据,可知其中
位数为( )
A.12.5 B.13
C.13.5 D.14
【答案】 B
【考向 2】平均数
【例题】某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值 a.若
某住户某月用电量不超过 a 度,则按平价计费;若某月用电量超过 a 度,则超出部分按议价
计费,未超出部分按平价计费.为确定 a 的值,随机调查了该市 100 户的月用电量,工作人
员已将 90 户的月用电量填在了下面的频率分布表中,最后 10 户的月用电量(单位:度)为:
18,63,43,119,65,77,29,97,52,100.
组别 月用电量 频数统计 频数 频率
① 0,20)
② 20,40) 正正
③ 40,60) 正正正正
④ 60,80) 正正正正正
⑤ 80,100) 正正正正
⑥ 100,120]
(1)完成频率分布表并绘制频率分布直方图;
(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);
(3)若该市计划让全市 75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值 a.
解] (1)
组别 月用电量 频数统计 频数 频率
① 0,20) 4 0.04
② 20,40) 正正 12 0.12
③ 40,60) 正正正正 24 0.24
④ 60,80) 正正正正正正 30 0.30
⑤ 80,100) 正正正正正 25 0.25
⑥ 100,120] 正 5 0.05
(2)由题意,用每小组的中点值代表该小组的平均月用电量,则 100 户住户组成的样本的平均
月用电量为 10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).
用样本估计总体,可知全市居民的平均月用电量约为 65 度.
(3)计算累计频率,可得下表:
分组 0,20) 20,40) 40,60) 60,80) 80,100) 100,120]
频率 0.04 0.12 0.24 0.30 0.25 0.05
累计
频率
0.04 0.16 0.40 0.70 0.95 1.00
由此可知临界值 a 应在区间 80,100)内,且频率分布直方图中,在临界值 a 左侧小矩形的总
面积(频率)为 0.75,故有 0.7+(a-80)×0.012 5=0.75,解得 a=84,由样本估计总体,可
得临界值 a 为 84.
【趁热打铁】
1.容量为 20 的样本数据,分组后的频数如下表:
分
组
10,
20)
20,30) 30,40) 40,50) 50,60) 60,70)
频
数
2 3 4 5 4 2
则样本数据落在区间 10,40)的频率为( )
A.0.35 B.0.45
C.0.55 D.0.65
2.为了普及环保知识,增强环保意识,某大学随机抽取 30 名学生参加环保知识测试,得分(十
分制)如图所示,假设得分的中位数为 me,众数为 mo,平均值为,则( )
A.me=mo= B.me=mo<
C.me<mo< D.mo<me<
3.某班级有 50 名学生,其中有 30 名男生和 20 名女生,随机询问了该班五名男生和五名女
生在某次数学测验中的成绩,五名男生的成绩分别为 86,94,88,92,90,五名女生的成绩
分别为 88,93,93,88,93.下列说法一定正确的是( )
A.这种抽样方法是一种分层抽样
B.这种抽样方法是一种系统抽样
C.这五名男生成绩的方差大于这五名女生成绩的方差
D.该班男生成绩的平均数小于该班女生成绩的平均数
4.小波一星期的总开支分布如图 1 所示,一星期的食品开支如图 2 所示,则小波一星期的鸡
蛋开支占总开支的百分比为( )
图 1
图 2
A.30% B.10%
C.3% D.不能确定
5.从甲乙两个城市分别随机抽取 16 台自动售货机,对其销售额进行统计,统计数据用茎叶
图表示(如图所示),设甲乙两组数据的平均数分别为甲,乙,中位数分别为 m 甲,m 乙,则( )
甲 乙
8 6 5 0
8 8 4 0 0 1 0 2 8
7 5 2 2 0 2 3 3 7
8 0 0 3 1 2 4 4 8
3 1 4 2 3 8
A.甲<乙,m 甲>m 乙 B.甲<乙,m 甲乙,m 甲>m 乙 D.甲>乙,m 甲m
C.n=m D.不能确定
7.甲、乙两人在 10 天中每天加工零件的个数用茎叶图表示如下.中间一列的数字表示零件
个数的十位数,两边的数字表示零件个数的个位数,则这 10 天中甲、乙两人日加工零件的平
均数分别为________和________.
甲 乙
9 8 1 9 7 1
0 1 3 2 0 2 1 4 2 4
1 1 5 3 0 2 0
8.如图是根据部分城市某年 6 月份的平均气温(单位:℃)数据得到的样本频率分布直方图,
其中平均气温的范围是 20.5,26.5],样本数据的分组为 20.5,21.5),21.5,22.5),22.5,
23.5),23.5,24.5),24.5,25.5),25.5,26.5].已知样本中平均气温低于 22.5℃的城市
个数为 11,则样本中平均气温不低于 25.5℃的城市个数为________.
9.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据
整 理 后 , 画 出 频 率 分 布 直 方 图 ( 如 图 所 示 ) , 图 中 从 左 到 右 各 小 长 方 形 面 积 之 比 为
2∶4∶17∶15∶9∶3,第二小组频数为 12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在 110 以上(含 110 次)为达标,试估计该学校全体高一学生的达标率是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.
10.为了比较两种治疗失眠症的药(分别称为 A 药,B 药)的疗效,随机地选取 20 位患者服用
A 药,20 位患者服用 B 药,这 40 位患者在服用一段时间后,记录他们日平均增加的睡眠时间
(单位:h),试验的观测结果如下:
服用 A 药的 20 位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2
3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1
2.3 2.4
服用 B 药的 20 位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3
1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2
2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?
A 药 B 药
0.
1.
2.
3.
第三章
1 解:由频率分布表可知:样本数据落在区间 10,40)内的频数为 2+3+4=9,样本总数为
20,故样本数据落在区间 10,40)的频率为 9
20
=0.45.故选 B.
2 解:中位数为 5.5,众数为 5,平均值为179
30
.
故选 D.
3 解:这种抽样方法为简单随机抽样,该班这五名男生成绩的平均数为86+94+88+92+90
5
=
90,方差为1
5
(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8;
该班这五名女生成绩的平均数为
88+93+93+88+93
5
=91,
方差为1
5
(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6.故选 C.
5 解:易知甲=21.5625,乙=28.5625,m 甲=20,m 乙=29,∴甲<乙,m 甲<m 乙.故选 B.
6 解:∵x1+x2+…+xn=n,
y1+y2+…+ym=m y ,
∴x1+x2+…+xn+y1+y2+…+ym=(m+n)
=(m+n)α+(1-α) y ]
=(m+n)α+(m+n)(1-α) y ,
∴n+m y =(m+n)α+(m+n)(1-α) y .
∴
n=(m+n)α,
m=(m+n)(1-α).
故 n-m=(m+n)α-(1-α)]=(m+n)(2α-1).
∵0<α<1
2
,∴2α-1<0.
∴n-m<0,即 n<m.故选 A.
7 解:设甲、乙在这 10 天中日加工零件的平均数分别为 a,b,则
a=20+-1-2+0+1+3+2+0+11+11+15
10
=24,
b=20+-1-3-9+1+4+2+4+10+12+10
10
=23.
故填 24;23.
8 解:平均气温低于 22.5℃的城市所占频率为最左边两个矩形面积之和,即 0.10×1+0.12×1
=0.22,又其频数为 11,故总城市数为 11
0.22
=50,故样本中平均气温不低于 25.5℃的城市共
有 50×0.18=9(个).
故填 9.
9 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二
小组的频率为 4
2+4+17+15+9+3
=0.08.又因为第二小组频率=第二小组频数
样本容量
,所以样本容
量=第二小组频数
第二小组频率
= 12
0.08
=150.
(2)由图可估计该学校高一学生的达标率约为
17+15+9+3
2+4+17+15+9+3
×100%=88%.
(3)由已知可得各小组的频数依次为 6,12,51,45,27,9,所以前三组的频数之和为 69,
前四组的频数之和为 114,所以跳绳次数的中位数落在第四小组内.
10 解:(1)计算得 A=2.3, B=1.6,从计算结果来看,A 药的疗效更好.
(2)
A 药 B 药
6 0. 5 5 6 8 9
8 5 5 2 2 1.
1 2 2 3 4 6 7 8
9
9 8 7 7 6 5 4 3 3
2
2. 1 4 5 6 7
5 2 1 0 3. 2
从以上茎叶图可以看出,A 药疗效的试验结果有 7
10
的叶集中在茎 2,3 上,而 B 药疗效的试验
结果有 7
10
的叶集中在茎 0,1 上,由此可看出 A 药的疗效更好.
相关文档
- 【数学】2019届理科一轮复习北师大2021-06-168页
- 2020-2021学年数学新教材人教B版必2021-06-1613页
- 人教A版高中数学2-3幂函数教案新人2021-06-165页
- 【数学】2020届一轮复习人教A版第52021-06-165页
- 2018-2019学年山东省济南市历城区2021-06-166页
- 【数学】河南省天一大联考2020-2022021-06-167页
- 高考卷 06湖南高考试卷 数学(文史类2021-06-1613页
- 【数学】2021届一轮复习人教A版函2021-06-169页
- 【数学】2018届一轮复习人教A版分2021-06-168页
- 2018届二轮复习第二部分板块(二)(2021-06-1612页