- 3.46 MB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第一部分
专题强化突破
专题七 概率与统计
知识网络构建
第一讲
统计与统计案例
1
高考考点聚焦
2
核心知识整合
3
高考真题体验
4
命题热点突破
5
课后强化训练
高考考点聚焦
高考考点
考点解读
抽样方法
1.
分层抽样中利用抽样比确定样本容量、各层抽样的个体数等
2
.考查系统抽样的有关计算
样本频率分布、数字特征
1.
频率分布直方图、茎叶图的绘制及识图,并利用图解决实际问题
2
.茎叶图与数字特征相结合考查
3
.平均数和方差的计算
线性回归分析与独立性检验在实际问题中的应用
1.
线性回归方程的求解及应用
2
.独立性检验的应用以及独立性检验与统计、概率的综合问题
备考策略
本部分内容在备考时应注意以下几个方面:
(1)
掌握三种抽样的特点及相互联系,特别是系统抽样和分层抽样的应用.
(2)
会用样本的频率分布估计总体分布,会用样本的数字特征估计总体的数字特征.
(3)
了解回归分析及独立性检验的基本思想,认识其统计方法在决策中的应用.
预测
2018
年命题热点为:
(1)
频率分布直方图、茎叶图的绘制及应用.
(2)
数字特征的求解及应用.
(3)
线性回归方程的求解及应用.
核心知识整合
1
.
抽样方法
三种抽样方法包括:
________________
、
__________
、
__________
.
2
.
统计图表
(1)
在频率分布直方图中:
①
各小矩形的面积表示相应各组的频率,各小矩形的高=
_________
;
②
各小矩形面积之和等于
_______
;
③
中位数左右两侧的直方图面积
________
,因此可以估计其近似值.
(2)
茎叶图
简单随机抽样
系统抽样
分层抽样
1
相等
4
.
变量间的相关关系
(1)
利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中的点从整体上看大致分布在一条直线的附近,我们说变量
x
和
y
具有线性相关关系.
1
.混淆简单随机抽样、系统抽样、分层抽样,不能正确地选择抽样方法.
2
.不能正确地从频率分布直方图中提取相关的信息,忽略了频数与频率的差异.
3
.混淆条形图与直方图,条形图是离散随机变量,纵坐标刻度为频数与频率,直方图是连续随机变量,纵坐标刻度为频率
/
组距,这是密度,连续随机变量在某一点上是没有频率的.
4
.回归分析是对具有相关关系的两个变量进行统计分析的方法.只有在散点图大致呈线性时,求出的回归直线方程才有实际意义.
高考真题体验
A
[
解析
]
对于选项
A
,由图易知月接待游客量每年
7,8
月份明显高于
12
月份,故
A
错;
对于选项
B
,观察折线图的变化趋势可知年接待游客逐年增加,故
B
正确;
对于选项
C
,
D
,由图可知显然正确.故选
A
.
B
[
解析
]
(1
+
i)(2
+
i)
=
2
+
i
+
2i
-
1
=
1
+
3i
.
故选
B
.
甲组
乙组
6
5
9
2 5
6
1 7
y
x
4
7
8
A
D
[
解析
]
根据雷达图可知全年最低气温都在
0
℃
以上,故
A
正确;一月平均最高气温是
6
℃
左右,平均最低气温
2
℃
左右,七月平均最高气温
22
℃
左右,平均最低气温
13
℃
左右,所以七月的平均温差比一月的平均温差大,
B
正确;三月和十一月的平均最高气温都是
10
℃
,三月和十一月的平均最高气温基本相同,
C
正确;平均最高气温高于
20
℃
的有七月和八月,故
D
错误.
D
[
解析
]
由频率分布直方图可知,每周自习时间不少于
22.5
小时的学生所占频率为
2.5
×
(0.16
+
0.08
+
0.04)
=
0.7
,所以每周自习时间不少于
22.5
小时的学生人数为
200
×
0.7
=
140
.
18
命题热点突破
命题方向
1
抽样方法
C
[
解析
]
因为男女生视力情况差异不大,而学段的视力情况有鹿大差异,所以应按学段分层抽样.
A
A
.
200,20
B
.
100,20
C
.
200,10
D
.
100,10
[
解析
]
由题图可知,样本容量等于
(3 500
+
4 500
+
2 000)
×
2%
=
200
;抽取的高中生近视人数为
2 000
×
2%
×
50%
=
20
,故选
A
.
『
规律总结
』
系统抽样与分层抽样的求解方法
(1)
系统抽样的最基本特征是
“
等距性
”
,每组内所抽取的号码需要依据第一组抽取的号码和组距唯一确定.每组抽取样本的号码依次构成一个以第一组抽取的号码
m
为首项,组距
d
为公差的等差数列
{
a
n
}
,第
k
组抽取样本的号码
a
k
=
m
+
(
k
-
1)
d
.
(2)
分层抽样的关键是根据样本特征差异进行分层,实质是等比例抽样,求解此类问题需先求出抽样比
——
样本容量与总体容量的比,则各层所抽取的样本容量等于该层个体总数与抽样比的乘积.在每层抽样时,应采用简单随机抽样或系统抽样进行.
A
2 720
[
解析
]
根据频率分布直方图得:
一天使用零花钱在
6
元~
14
元的学生频率是
1
-
(0.02
+
0.03
+
0.03)
×
4
=
1
-
0.32
=
0.68
.
∴
对应的频数是
4000
×
0.68
=
2 720
,
∴
估计全校学生中,一天使用零钱在
6
元~
14
元的大约有
2 720
人.
命题方向
2
样本的数字特征
(1)
若某组成功研发一种新产品,则给该组记
1
分,否则记
0
分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;
(2)
若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.
(1)
求直方图中
x
的值;
(2)
求月平均用电量的众数和中位数;
(3)
在月平均用电量为
[220,240)
,
[240,260)
,
[260,280)
,
[280,300]
的四组用户中,用分层抽样的方法抽取
11
户居民,则月平均用电量在
[220,240)
的用户中应抽取多少户?
[
解析
]
(1)
由已知得,
20
×
(0.002
+
0.0095
+
0.011
+
0.0125
+
x
+
0.005
+
0.0025)
=
1
,解得
x
=
0.0075
.
(2)
由题图可知,面积最大的矩形对应的月平均用电量区间为
[220,240)
,所以月平均用电量的众数的估计值为
230
;
因为
20
×
(0.002
+
0.0095
+
0.011)
=
0.45<0.5
,
20
×
(0.002
+
0.0095
+
0.011
+
0.0215)
=
0.7>0.5
,所以中位数在区间
[220,240)
内,设中位数为
m
,则
20
×
(0.002
+
0.0095
+
0.011)
+
0.0125
×
(
m
-
220)
=
0.5
,解得
m
=
224
.
所以月平均用电量的中位数为
224
.
『
规律总结
』
1
.
用样本估计总体的两种方法
(1)
用样本的频率分布
(
频率分布表、频率分布直方图、茎叶图等
)
估计总体的频率分布.
(2)
用样本的数字特征
(
众数、中位数、平均数、方差、标准差
)
估计总体的数字特征.
2
.
方差的计算与含义
计算方差首先要计算平均数,然后再按照方差的计算公式进行计算,方差和标准差是描述一个样本和总体的波动大小的特征数,方差、标准差大说明波动大.
3
.
众数、中位数、平均数与频率分布直方图的关系
(1)
众数为频率分布直方图中最高矩形的底边中点的横坐标.
(2)
中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.
(3)
平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
[
解析
]
(1)
作出茎叶图如下:
甲
乙
9
8
7
5
8
4
2
1
8
0
0
3
5
5
3
9
0
2
5
命题方向
3
回归分析及其应用
命题方向
4
独立性检验
(1)
根据以上数据,能否有
60%
的把握认为
“
微信控
”
与
“
性别
”
有关?
(2)
现从调查的女性用户中按分层抽样的方法选出
5
人赠送营养面膜
1
份,求所抽取
5
人中
“
微信控
”
和
“
非微信控
”
的人数;
微信控
非微信控
总计
男性
26
24
50
女性
30
20
50
总计
56
44
100
(1)
若规定
60
分以上
(
包括
60
分
)
为合格,计算高一年级这次知识竞赛的合格率;
(2)
统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计高一年级参加这次知识竞赛的学生的平均成绩;
(3)
若高二年级这次知识竞赛的合格率为
60%
,由以上统计数据填写下面
2
×
2
列联表,并问是否有
99%
的把握认为
“
这次知识竞赛的成绩与年级有关系
”
.
课后强化训练