- 1.39 MB
- 2021-06-30 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
6.2
统计与概率大题
-
2
-
-
3
-
-
4
-
-
5
-
-
6
-
-
7
-
1
.
样本的数字特征
(1)
众数
:
是指出现次数最多的数
,
体现在频率分布直方图中
,
是指高度最高的小矩形的宽的中点的横坐标
;
(2)
中位数是指从左往右小矩形的面积之和为
0
.
5
处的横坐标
;
-
8
-
-
9
-
3
.
独立性检验
对于取值分别是
{
x
1
,
x
2
}
和
{
y
1
,
y
2
}
的分类变量
X
和
Y
,
其样本频数列联表是
:
4
.
概率的三个基本性质
(1)
随机事件的概率
:0
≤
P
(
A
)
≤
1;
必然事件的概率是
1;
不可能事件的概率是
0
.
(2)
若事件
A
,
B
互斥
,
则
P
(
A
∪
B
)
=P
(
A
)
+P
(
B
)
.
(3)
若事件
A
,
B
对立
,
则
P
(
A
∪
B
)
=P
(
A
)
+P
(
B
)
=
1
.
6.2.1
统计与统计案例
-
11
-
考向一
考向二
考向三
样本的数字特征的应用
例
1
为迎接即将举行的集体跳绳比赛
,
高一年级对甲、乙两个代表队各进行了
6
轮测试
,
测试成绩
(
单位
:
次
/
分钟
)
如下表
:
(1)
补全茎叶图
,
并指出乙队测试成绩的中位数和众数
;
(
2)
试用统计学中的平均数、方差知识对甲、乙两个代表队的测试成绩进行分析
.
考
向四
-
12
-
考向一
考向二
考向三
考
向四
-
13
-
考向一
考向二
考向三
解题心得
(1)
在预测总体数据的平均值时
,
常用样本数据的平均值估计
,
从而做出合理的判断
.
(2)
平均数反映了数据取值的平均水平
,
标准差、方差描述了一组数据围绕平均数波动的大小
.
标准差、方差越大
,
数据的离散程度越大
,
越不稳定
.
考
向四
-
14
-
考向一
考向二
考向三
对点训练
1
学校为了了解
A,B
两个班级学生在本学期前两个月内观看电视节目的时长
,
分别从这两个班级中随机抽取
10
名学生进行调查
,
得到他们观看电视节目的时长
(
单位
:
小时
)
如下
.
A
班
:5,5,7,8,9,11,14,20,22,31;B
班
:3,9,11,12,21,25,26,30,31,35
.
将上述数据作为样本
.
(1)
绘制茎叶图
,
并从所绘制的茎叶图中提取样本数据信息
(
至少写出
2
条
);
(2)
分别求样本中
A,B
两个班级学生的平均观看时长
,
并估计哪个班级的学生平均观看的时间较长
;
(3)
从
A
班的样本数据中随机抽取一个不超过
11
的数据记为
a
,
从
B
班的样本数据中随机抽取一个不超过
11
的数据记为
b
,
求
a>b
的概率
.
考
向四
-
15
-
考向一
考向二
考向三
考
向四
解
:
(1)
茎叶图如下
(
图中的茎表示十位数字
,
叶表示个位数字
):
从茎叶图中可看出
(
答案不唯一
):
①
A
班数据
有
集中
在茎
0,1,2
上
,B
班数据
有
集中
在茎
1,2,3
上
;
②
A
班叶的分布是单峰的
,B
班叶的分布基本上是对称的
;
③
A
班数据的中位数是
10,B
班数据的中位数是
23
.
-
16
-
考向一
考向二
考向三
考
向四
(2)A
班样本数据的平均值为
(
3)A
班的样本数据中不超过
11
的数据
a
有
6
个
,
分别为
5,5,7,8,9,11;B
班的样本数据中不超过
11
的数据
b
有
3
个
,
分别为
3,9,11
.
从上述
A
班和
B
班的数据中各随机抽取一个
,
记为
(
a
,
b
),
分别为
(5,3),(5,9),(5,11),(5,3),(5,9),(5,11),(7,3),(7,9),(7,11),(8,3),(8,9),(8,11),(9,3),(9,9),(9,11),(11,3),(11,9),(11,11),
共
18
种
,
其中
a>b
的有
(5,3),(5,3),(7,3),(8,3),(9,3),(11,3),(11,9),
共
7
种
.
故
a>b
的概率为
P
= .
-
17
-
考向一
考向二
考向三
考
向四
样本的相关系数的应用
例
2
为了监控某种零件的一条生产线的生产过程
,
检验员每隔
30 min
从该生产线上随机抽取一个零件
,
并测量其尺寸
(
单位
:cm)
.
下面是检验员在一天内依次抽取的
16
个零件的尺寸
:
-
18
-
考向一
考向二
考向三
考
向四
(1)
求
(
x
i
,
i
)(
i=
1,2,
…
,16)
的相关系数
r
,
并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小
(
若
|r|<
0
.
25,
则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小
)
.
-
19
-
考向一
考向二
考向三
考
向四
-
20
-
考向一
考向二
考向三
考
向四
-
21
-
考向一
考向二
考向三
考
向四
-
22
-
考向一
考向二
考向三
考
向四
解题心得
对于样本的相关系数的应用的题目
,
题目一般都给出样本
(
x
i
,
y
i
)(
i=
1,2,
…
,
n
)
的相关系数
r
的表达式
,
以及有关的数据
,
解决这类题的关键是在有关的数据中选择题目需要的数据代入公式即可
.
-
23
-
考向一
考向二
考向三
考
向四
对点训练
2
下图是我国
2008
年至
2014
年生活垃圾无害化处理量
(
单位
:
亿吨
)
的折线图
.
注
:
年份代码
1—7
分别对应年份
2008—2014
.
(1)
由折线图看出
,
可用线性回归模型拟合
y
与
t
的关系
,
请用相关系数加以说明
;
(2)
建立
y
关于
t
的回归方程
(
系数精确到
0
.
01),
预测
2018
年我国生活垃圾无害化处理量
.
-
24
-
考向一
考向二
考向三
考
向四
-
25
-
考向一
考向二
考向三
考
向四
-
26
-
考向一
考向二
考向三
考
向四
-
27
-
考向一
考向二
考
向
三
考
向四
利用回归方程进行回归分析
例
3
(2018
河北衡水中学考前仿真
,
文
19)
某地区
2008
年至
2016
年粮食产量的部分数据如下表
:
(1)
求该地区
2008
年至
2016
年粮食年产量
y
与年份
x
之间的线性回归方程
;
(2)
利用
(1)
中的回归方程
,
分析
2008
年到
2016
年该地区粮食年产量的变化情况
,
并预测该地区
2018
年的粮食年产量
.
-
28
-
考向一
考向二
考
向
三
考
向四
-
29
-
考向一
考向二
考
向
三
考
向四
-
30
-
考向一
考向二
考
向
三
考
向四
解题心得
在求两变量的回归方程时
,
由于
的
公式比较复杂
,
求它的值计算量比较大
,
为了计算准确
,
可将这个量分成几个部分分别计算
,
最后再合成
,
这样等同于分散难点
,
各个攻破
,
提高了计算的准确度
.
-
31
-
考向一
考向二
考
向
三
考
向四
对点训练
3
据某市地产数据研究显示
,2016
年该市新建住宅销售均价走势如下图所示
,3
月至
7
月房价上涨过快
,
为抑制房价过快上涨
,
政府从
8
月开始采用宏观调控措施
,10
月份开始房价得到很好的抑制
.
(1)
地产数据研究院发现
,3
月至
7
月的各月均价
y
(
单位
:
万元
/
平方米
)
与月份
x
之间具有较强的线性相关关系
,
试建立
y
关于
x
的回归方程
;
(2)
若政府不调控
,
依此相关关系预测第
12
月份该市新建住宅销售均价
.
-
32
-
考向一
考向二
考
向
三
考
向四
-
33
-
考向一
考向二
考
向
三
考
向四
-
34
-
考向一
考向二
考向三
考向四
统计图表与独立性检验的
综合
例
4
(2018
山西吕梁一模
,
文
18)
某学校研究性学习小组对该校高三学生视力情况进行调查
,
在高三的全体
1 000
名学生中随机抽取了
100
名学生的体检表
,
得到如图的频率分布直方图
.
-
35
-
考向一
考向二
考向三
考向四
(1)
若直方图中后四组的频数成等差数列
,
试估计全年级视力在
5
.
0
以下的人数
;
(2)
学习小组成员发现
,
学习成绩突出的学生
,
近视的比较多
,
为了研究学生的视力与学习成绩是否有关系
,
对年级名次在
1
~
50
名和
951
~
1 000
名的学生进行了调查
,
得到上表中数据
,
根据表中的数据
,
能否在犯错误的概率不超过
0
.
05
的前提下认为视力与学习成绩有关系
?
附
:
-
36
-
考向一
考向二
考向三
考向四
解
(1)
由题图可知
,
第一组有
3
人
,
第二组有
7
人
,
第三组有
27
人
,
设后四组的频数构成的等差数列的公差为
d
,
则
(27
-d
)
+
(27
-
2
d
)
+
(27
-
3
d
)
=
63,
解得
d=
3,
所以后四组频数依次为
27,24,21,18,
所以视力在
5
.
0
以下的频数为
3
+
7
+
27
+
24
+
21
=
82
人
,
因此
在犯错误的概率不超过
0
.
05
的前提下认为视力与学习成绩有关系
.
-
37
-
考向一
考向二
考向三
考向四
解题心得
有关独立性检验的问题解题步骤
:(1)
作出
2
×
2
列联表
;(2)
计算随机变量
K
2
的值
;(3)
查临界值
,
检验作答
.
-
38
-
考向一
考向二
考向三
考向四
对
点训练
4
(2018
全国卷
3,
文
18)
某工厂为提高生产效率
,
开展技术创新活动
,
提出了完成某项生产任务的两种新的生产方式
.
为比较两种生产方式的效率
,
选取
40
名工人
,
将他们随机分成两组
,
每组
20
人
,
第一组工人用第一种生产方式
,
第二组工人用第二种生产方式
.
根据工人完成生产任务的工作时间
(
单位
:min)
绘制了如下茎叶图
:
-
39
-
考向一
考向二
考向三
考向四
(1)
根据茎叶图判断哪种生产方式的效率更高
?
并说明理由
;
(2)
求
40
名工人完成生产任务所需时间的中位数
m
,
并将完成生产任务所需时间超过
m
和不超过
m
的工人数填入下面的列联表
:
(3)
根据
(2)
中的列联表
,
能否有
99%
的把握认为两种生产方式的效率有差异
?
-
40
-
考向一
考向二
考向三
考向四
解
:
(1)
第二种生产方式的效率更高
.
理由如下
:
①
由茎叶图可知
:
用第一种生产方式的工人中
,
有
75%
的工人完成生产任务所需时间至少
80
分钟
,
用第二种生产方式的工人中
,
有
75%
的工人完成生产任务所需时间至多
79
分钟
.
因此第二种生产方式的效率更高
.
②
由茎叶图可知
:
用第一种生产方式的工人完成生产任务所需时间的中位数为
85
.
5
分钟
,
用第二种生产方式的工人完成生产任务所需时间的中位数为
73
.
5
分钟
.
因此第二种生产方式的效率更高
.
③
由茎叶图可知
:
用第一种生产方式的工人完成生产任务平均所需时间高于
80
分钟
;
用第二种生产方式的工人完成生产任务平均所需时间低于
80
分钟
.
因此第二种生产方式的效率更高
.
-
41
-
考向一
考向二
考向三
考向四
④
由茎叶图可知
:
用第一种生产方式的工人完成生产任务所需时间分布在茎
8
上的最多
,
关于茎
8
大致呈对称分布
;
用第二种生产方式的工人完成生产任务所需时间分布在茎
7
上的最多
,
关于茎
7
大致呈对称分布
.
又用两种生产方式的工人完成生产任务所需时间分布的区间相同
,
故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少
.
因此第二种生产方式的效率更高
.
以上给出了
4
种理由
,
学生答出其中任意一种或其他合理理由均可得分
.
-
42
-
考向一
考向二
考向三
考向四
-
43
-
考向一
考向二
考向三
考向四
解题心得
有关独立性检验的问题解题步骤
:(1)
作出
2
×
2
列联表
;(2)
计算随机变量
K
2
的值
;(3)
查临界值
,
检验作答
.