- 2.56 MB
- 2021-07-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第
2
讲
统计与统计案例
高考定位
以选择题、填空题考查的内容有样本数字特征的计算、频率分布直方图、条形图、茎叶图、线性回归方程、独立性检验等;以解答题考查线性回归直线方程、独立性检验以及概率与统计的交汇,都属于中、低档题,也是必得分的题目
.
真 题 感 悟
1.
(2015·
湖北卷
)
我国古代数学名著《数书九章》有
“
米谷粒分
”
题:粮仓开仓收粮,有人送来米
1 534
石,验得米内夹谷,抽样取米一把,数得
254
粒内夹谷
28
粒,则这批米内夹谷约为
(
)
A.134
石
B.169
石
C.338
石
D.1 365
石
B
2.
(2015·
全国
Ⅱ
卷
)
根据下面给出的
2004
年至
2013
年我国二氧化硫年排放量
(
单位:万吨
)
柱形图,以下结论中不正确的是
(
)
A.
逐年比较,
2008
年减少二氧化硫排放量的效果最显著
B.2007
年我国治理二氧化硫排放显现成效
C.2006
年以来我国二氧化硫年排放量呈减少趋势
D.2006
年以来我国二氧化硫年排放量与年份正相关
解析
从
2006
年起,将每年的二氧化硫排放量与前一年作差比较,得到
2008
年二氧化硫排放量与
2007
年排放量的差最大,
A
选项正确;
2007
年二氧化硫排放量较
2006
年降低了很多,
B
选项正确;虽然
2011
年二氧化硫排放量较
2010
年多一些,但自
2006
年以来,整体呈递减趋势,即
C
选项正确;自
2006
年以来我国二氧化硫年排放量与年份负相关,
D
选项错误
.
故选
D.
答案
D
3.
(2015·
湖南卷
)
在一次马拉松比赛中,
35
名运动员的成绩
(
单位:分钟
)
的茎叶图如图所示
若将运动员按成绩由好到差编为
1
~
35
号,再用系统抽样方法从中抽取
7
人,则其中成绩在区间
[139
,
151]
上的运动员人数是
(
)
A.3
B.4 C.5 D.6
解析
由题意知,将
1
~
35
号分成
7
组,每组
5
名运动员,成绩落在区间
[139
,
151]
的运动员共有
4
组,故由系统抽样法知,共抽取
4
名
.
选
B.
答案
B
答案
11
考
点
整
合
5.
独立性检验
对于取值分别是
{
x
1
,
x
2
}
和
{
y
1
,
y
2
}
的分类变量
X
和
Y
,其样本频数列联表是:
y
1
y
2
总计
x
1
a
b
a
+
b
x
2
c
d
c
+
d
总计
a
+
c
b
+
d
n
热点一 统计中的热点
[
微题型
1]
对抽样方法的考查
类别
人数
老年教师
900
中年教师
1 800
青年教师
1 600
合计
4 300
A.90 B.100 C.180 D.300
答案
C
探究提高
系统抽样又称
“
等距
”
抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例
.
[
微题型
2]
对茎叶图与数字特征的考查
①
甲地该月
14
时的平均气温低于乙地该月
14
时的平均气温;
②
甲地该月
14
时的平均气温高于乙地该月
14
时的平均气温;
③
甲地该月
14
时的气温的标准差小于乙地该月
14
时的气温的标准差;
④
甲地该月
14
时的气温的标准差大于乙地该月
14
时的气温的标准差
.
其中根据茎叶图能得到的统计结论的编号为
(
)
A.
①③
B.
①④
C.
②③
D.
②④
答案
B
探究提高
(1)
平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质
.
(2)
众数考查各数据出现的频率,当一组数据中有不少数据多次出现时,众数往往更能反映问题
.
(3)
中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势
.
[
微题型
3]
对频率分布直方图的考查
(1)
求直方图中
x
的值;
(2)
求月平均用电量的众数和中位数;
(3)
在月平均用电量为
[220
,
240)
,
[240
,
260)
,
[260
,
280)
,
[280
,
300]
的四组用户中,用分层抽样的方法抽取
11
户居民,则月平均用电量在
[220
,
240)
的用户中应抽取多少户?
探究提高
利用频率分布直方图估计样本的数字特征
(1)
中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值
.
(2)
平均数:平均数为频率分布直方图的
“
重心
”
,等于图中每个小矩形的面积乘以小矩形底边中点的横坐标之和
.
(3)
众数:在频率分布直方图中,众数是最高的矩形底边的中点的横坐标
.
A.31.6
岁
B.32.6
岁
C.33.6
岁
D.36.6
岁
答案
(1)6
(2)C
热点二 统计案例
[
微题型
1]
对线性回归直线方程的考查
(3)
已知这种产品的年利润
z
与
x
,
y
的关系为
z
=
0.2
y
-
x
.
根据
(2)
的结果回答下列问题:
①
年宣传费
x
=
49
时,年销售量及年利润的预报值是多少?
②
年宣传费
x
为何值时,年利润的预报值最大?
附:对于一组数据
(
u
1
,
v
1
)
,
(
u
2
,
v
2
)
,
…
,
(
u
n
,
v
n
)
,其回归直线
v
=
α
+
βu
的斜率和截距的最小二乘估计分别为
探究提高
线性回归方程求解的关键在于准确求出样本点中心
.
回归系数的求解可直接把相应数据代入公式中求解,回归常数的确定则需要利用中心点在回归直线上建立方程求解
.
[
微题型
2]
对独立性检验的考查
女
男
总计
喜爱
40
20
60
不喜爱
20
30
50
总计
60
50
110
试根据样本估计总体的思想,估计约有
________
的把握认为
“
喜爱该节目与否和性别有关
”.
参考附表:
P
(
K
2
≥
k
0
)
0.050
0.010
0.001
k
0
3.841
6.635
10.828
答案
99%
x
16
17
18
19
y
50
34
41
31
A.48 B.49 C.50 D.51
答案
49
热点三 概率与统计的交汇
B
地区用户满意度评分的频数分布表
满意度评分分组
[50
,
60)
[60
,
70)
[70
,
80)
[80
,
90)
[90
,
100]
频数
2
8
14
10
6
(1)
在图中作出
B
地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度
(
不要求计算出具体值,给出结论即可
)
;
B
地区用户满意度评分的频率分布直方图
(2)
根据用户满意度评分,将用户的满意度分为三个等级:
满意度评分
低于
70
分
70
分到
89
分
不低于
90
分
满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由
.
解
(1)
如图所示
.
通过两地区用户满意度评分的频率分布直方图可以看出,
B
地区用户满意度评分的平均值高于
A
地区用户满意度评分的平均值;
B
地区用户满意度评分比较集中,而
A
地区用户满意度评分比较分散
.
(2)
A
地区用户的满意度等级为不满意的概率大
.
记
C
A
表示事件:
“
A
地区用户的满意度等级为不满意
”
;
C
B
表示事件:
“
B
地区用户的满意度等级为不满意
”
.
由直方图得
P
(
C
A
)
的估计值为
(0.01
+
0.02
+
0.03)
×
10
=
0.6
,
P
(
C
B
)
的估计值为
(0.005
+
0.02)
×
10
=
0.25.
所以
A
地区用户的满意度等级为不满意的概率大
.
探究提高
概率试题的核心是概率计算,统计试题的核心是样本数据的分布;概率与统计综合解答题的主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键,因此在复习该部分时,要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本的数字特征的计算方法和各类概率的计算方法
.
解答此类试题时要做到:
(1)
读取图表的数据要准确;
(2)
在计算古典概型概率时,基本事件的总数要计算准确
.
(1)
求频率分布直方图中
a
的值;
(2)
估计该企业的职工对该部门评分不低于
80
的概率;
(3)
从评分在
[40
,
60)
的受访职工中,随机抽取
2
人,求此
2
人的评分都在
[40
,
50)
的概率
.
解
(1)
因为
(0.004
+
a
+
0.018
+
0.022
×
2
+
0.028)
×
10
=
1
,所以
a
=
0.006.
(2)
由所给频率分布直方图知,
50
名受访职工评分不低于
80
的频率为
(0.022
+
0.018)
×
10
=
0.4.
所以该企业职工对该部门评分不低于
80
的概率的估计值为
0.4.
1.
随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量明显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样
.
系统抽样最重要的特征是
“
等距
”
,分层抽样最重要的是各层的
“
比例
”.
2.
用样本估计总体
(1)
在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为
1.
(2)
众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量
.