- 1.85 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
2.2
分层随机抽样
必备知识
·
自主学习
分层随机抽样
(1)
概念
分层
随机
抽样
在抽样时
,
将总体按其属性特征分成
_________
的若干类型
(
有时称作层
),
然后在每个类型中按照
_________
随机抽取
一定的个体
,
这种抽样方法通常叫作分层随机抽样
.
适用
范围
当总体是由
_________
的几类个体构成
,
并且知道每一类个体
在总体中
_____________
时往往采用分层随机抽样
.
互不交叉
所占比例
差异明显
所占的百分比
(2)
本质
:
对于含有明显几个层的总体随机抽样的一种有效方法
,
就是按照一定的比例进行抽样
.
(3)
应用
:
抽取样本
.
【
思考
】
分层随机抽样中的总体有什么特征
?
提示
:
分层随机抽样中的总体是由差异明显的几类个体构成
.
【
基础小测
】
1.
辨析记忆
(
对的打“√”
,
错的打“
×”)
(1)
分层随机抽样中每层抽样的可能性是不相等的
. (
)
(2)
分层随机抽样中
,
个体数量较少的层抽取的样本量较少
,
这是不公平
的
. (
)
(3)
在统计实践中选择哪种抽样方法关键是看总体容量的大小
. (
)
提示
:
(1)×.
分层随机抽样中每层抽样的可能性相等
.
(2)×.
分层随机抽样中
,
各层抽取的样本量是按其所占比例随机抽取的
,
是公平的
.
(3)×.
在统计实践中选择哪种抽样方法除了看总体容量的大小外
,
还要依据总体的构成情况
.
2.
某学校为了解三年级、六年级、九年级这三个年级之间的学生的课业负担情况
,
拟从这三个年级中按人数比例抽取部分学生进行调查
,
则最合理的抽样方法是
(
)
A.
抽签法
B.
简单随机抽样
C.
分层随机抽样
D.
随机数法
【
解析
】
选
C.
根据年级不同产生差异及按人数比例抽取易知应为分层随机抽样
.
3.(
教材二次开发
:
例题改编
)
为了调查城市
PM2.5
的情况
,
按地域把
48
个城市分
成大型、中型、小型三组
,
相应的城市数分别为
8,16,24.
若用分层随机抽样的
方法抽取
12
个城市
,
则应抽取的中型城市数为
.
【
解析
】
根据分层抽样的特点可知
,
抽样比例为
,
则应抽取的中型城
市数为
16× =4.
答案
:
4
关键能力
·
合作学习
类型一 分层随机抽样的概念
(
数学抽象
)
【
题组训练
】
1.
简单随机抽样和分层随机抽样之间的共同点是
(
)
A.
都是从总体中逐个抽取的
B.
抽样过程中每个个体被抽到的机会是相等的
C.
将总体分成几层
,
然后各层按照比例抽取
D.
两者之间没有共同点
2.2020
年
2
月
15
日
,2020
年东京奥运会火炬传递彩排在羽村市进行
.
包括演员石原里美在内的
10
名火炬手参加了彩排活动
,
每人举着火炬跑了
200
米
.
为了迎接
3
月
26
日火炬在全国境内的传递
,
该市还组织了“迎奥运全民健身”活动
,
活动按参加者年龄分老年组、青年组和少年组
.
活动后市电视台拟从参加比赛的人群中抽取部分人员进行采访
,
在下面的抽样方法中
,
最合理的抽样方法是
(
)
A.
抽签法抽样
B.
按性别分层随机抽样
C.
按年龄段分层随机抽样
D.
随机数法抽样
3.
为了保证分层随机抽样时每个个体被等可能地抽取
,
必须要求
(
)
A.
每层等可能抽取
B.
每层抽取的个体数相等
C.
每层抽取的个体数可以不一样多
,
但必须满足抽取
n
i
=n· (i=1,2,…,k)
个个体
(
其中
i
是层的序号
,k
是总层数
,n
为抽取的样本容量
,N
i
是第
i
层中的个体数
,N
是总体容量
)
D.
只要抽取的样本容量一定
,
每层抽取的个体数没有限制
【
解析
】
1.
选
B.
由两种抽样方法的定义可知
,
在抽样过程中每个个体被抽到的机会相等
.
2.
选
C.
该活动按老、青、少三个年龄段人员分组
,
所以按年龄段分层随机抽样具有代表性
,
比较合理
.
3.
选
C.
分层随机抽样时
,
在各层中按层中所含个体在总体中所占的比例进行抽样
.
A
中
,
虽然每层等可能地抽样
,
但是没有指明各层中应抽取几个个体
,
故
A
不正确
;
B
中
,
若每层的个体数不相等
,
每层抽取同样多的个体数
,
显然从总体来看
,
各层的个体被抽取的可能性就不相等了
,
因此
B
也不正确
;
C
中
,
对于第
i
层的每个个体
,
它被抽到的可能性与层数
i
无关
,
即对于每个个体来说
,
被抽取为样本的可能性是相同的
,
故
C
正确
;D
显然不正确
.
【
解题策略
】
分层随机抽样的两个条件
(1)
必备条件
:
构成总体的几类个体差异明显
,
每类个体之间差异不大
;
(2)
辅助条件
:
知道每一类个体在总体中所占的百分比
.
【
补偿训练
】
下列问题中
,
适合用分层随机抽样抽取样本的是
(
)
A.
从
50
名同学中抽取
5
人参加校服务小组
B.
某小区有
500
个家庭
,
其中高收入的家庭
125
户
,
中等收入的家庭
280
户
,
低收入的家庭
95
户
,
为了了解生活购买力的某项指标
,
要从中抽取一个容量为
100
的样本
C.
某学校有男学生
500
名
,
女学生
450
名
,
为了解老师布置作业量是否适中
,
拟从全体学生中抽取
50
名学生进行调查
D.
青岛啤酒厂质检员从生产流水线上
,
抽取样本检查产品质量
【
解析
】
选
B.A
中总体所含个体无差异且个数较少
,
适合用简单随机抽样
;C
中对老师布置作业量的认识
,
男生与女生差距不明显
,D
中总体所含个体无差异
,
不适合用分层随机抽样
;B
中总体所含个体差异明显
,
并且知道每一类个体在总体中所占的百分比
,
适合用分层随机抽样
.
类型二 分层随机抽样的应用
(
数学建模、数据分析
)
角度
1
分层随机抽样中的计算
【
典例
】
分层随机抽样是将总体分成互不交叉的层
,
然后按照一定的比例
,
从各层独立地抽取一定数量的个体
,
组成一个样本的抽样方法
;
在
《
九章算术
》
第三章“衰分”中有如下问题
:“
今有甲持钱五百六十
,
乙持钱三百五十
,
丙持钱一百八十
,
凡三人俱出关
,
关税百钱
.
欲以钱多少衰出之
,
问各几何
?”
其译文为
:
今有甲持
560
钱
,
乙持
350
钱
,
丙持
180
钱
,
甲、乙、丙三人一起出关
,
关税共
100
钱
,
要按照各人带钱多少的比例进行交税
,
问三人各应付多少税
?
则下列说法错误的是
(
)
A.
甲应付
51
钱
B.
乙应付
32
钱
C.
丙应付
16
钱
D.
三者中甲付的钱最多
,
丙付的钱最少
【
思路导引
】
按照每人的交税比例相等进行计算即可
.
【
解析
】
选
B.
依题意
,
由分层随机抽样知识可知
,100÷(560+350+180)= ,
则甲应付
×560=51
钱
;
乙应付
×350=32
钱
;
丙应付
×180
=16
钱
.
【
变式探究
】
本例若改为
:
今有甲持
500
钱
,
乙持
300
钱
,
丙持若干钱
,
甲、乙、丙三人一起出关
,
要按照各人带钱多少的比例进行交税
,
甲交税
50
钱
,
三人共交税
100
钱
,
问乙、丙
应各付多少税
?
丙持多少钱
?
【
解析
】
由题意
,
故乙应付税
300× =30
钱
,
丙应付税
100-50-30=20
钱
,
丙持
=200
钱
.
角度
2
分层随机抽样的应用
【
典例
】
一个地区共有
5
个乡镇
,
人口
3
万人
,
其人口比例为
3∶2∶5∶2∶3,
从
3
万人中抽取一个
300
人的样本
,
分析某种疾病的发病率
,
已知这种疾病与不同的地理位置及水土有关
,
问应采取什么样的方法
?
并写出具体过程
.
【
思路导引
】
利用分层随机抽样的步骤解答
【
解析
】
因为疾病与地理位置和水土均有关系
,
所以不同乡镇的发病情况差异明显
,
因而采用分层随机抽样的方法
.
具体过程如下
:
①
将
3
万人分为
5
层
,
其中一个乡镇为一层
.
②
按照样本容量的比例求得各乡镇应抽取的人数分别为
60
人、
40
人、
100
人、
40
人、
60
人
.
③
按照各层抽取的人数随机在各乡镇抽取样本
.
④
将
300
人合到一起
,
即得到一个样本
.
【
解题策略
】
1.
进行分层随机抽样的相关计算时
,
常用到的两个关系
(1)
(2)
总体中某两层的个体数之比等于样本中这两层抽取的个体数之比
.
2.
分层随机抽样的步骤
【
题组训练
】
1.
某电视台在因特网上就观众对其某一节目的喜爱程度进行调查
,
参与调查的一共有
20 000
人
,
其中各种态度对应的人数如表所示
:
最喜爱
喜爱
一般
不喜欢
4 800
7 200
6 400
1 600
电视台为了了解观众的具体想法和意见
,
打算从中抽取
100
人进行详细的调查
,
为此要进行分层随机抽样
,
那么在分层随机抽样时
,
每类人中应抽取的人数分别为
(
)
A.25,25,25,25
B.48,72,64,16
C.20,40,30,10 D.24,36,32,8
【
解析
】
选
D.
方法一
:
因为抽样比为
,
所以每类人中应抽取的人
数分别为
4 800× =24,7 200× =36,6 400× =32,1 600× =8.
方法二
:
最喜爱、喜爱、一般、不喜欢的比例为
4 800∶7 200∶6 400∶
1 600=6∶9∶8∶2,
所以每类人中应抽取的人数分别为
×100=24,
×100=36, ×100=32, ×100=8.
2.
某机构对某镇的学生的身体素质状况按年级段进行分层随机抽样调查
,
得到了如表所示的数据
,
则
=
.
年级段
小学
初中
高中
总人数
800
x
y
样本中人数
16
15
z
【
解析
】
由分层抽样的特点
,
得
,
即
x=750, =50,
则
=37 500.
答案
:
37 500
3.
一个单位有职工
500
人
,
其中不到
35
岁的有
125
人
,35
岁至
49
岁的有
280
人
,50
岁及
50
岁以上的有
95
人
.
为了解这个单位职工与身体状态有关的某项指标
,
要从中抽取
100
名职工作为样本
,
职工年龄与这项指标有关
,
应该怎样抽取
?
【
解析
】
用分层随机抽样来抽取样本
,
步骤如下
:
(1)
分层
.
按年龄将
500
名职工分成三层
:
不到
35
岁的职工
;35
岁至
49
岁的职工
;
50
岁及
50
岁以上的职工
.
(2)
确定每层抽取个体的个数
.
抽样比为
,
则在不到
35
岁的职工中抽取
125× =25(
人
);
在
35
岁至
49
岁的职工中抽取
280× =56(
人
);
在
50
岁及
50
岁以上的职工中抽取
95× =19(
人
).
(3)
在各层分别用随机数法抽取样本
.
(4)
汇总每层所抽取的个体
,
组成样本
.
【
补偿训练
】
交通管理部门为了解机动车驾驶员
(
简称驾驶员
)
对某新法规的知晓情况
,
对甲、乙、丙、丁四个社区做分层随机抽样调查
,
假设四个社区驾驶员的总人数为
N,
其中甲社区有驾驶员
96
人
.
若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为
12,21,25,43,
则这四个社区驾驶员的总人数
N
为
(
)
A.101
B.808
C.1 212
D.2 012
【
解析
】
选
B.
因为甲社区有驾驶员
96
人
,
并且在甲社区抽取的驾驶员的人数
为
12,
所以抽取驾驶员的抽样比为
,
所以驾驶员的总人数为
(12+21+25+43)÷ =808.
类型三 抽样方法的综合应用
(
数学建模、数据分析
)
【
典例
】
某政府机关在编人员
100
人
,
其中副处级以上干部
10
人
,
一般干部
70
人
,
工人
20
人
.
(1)
若上级机关为了了解政府机构改革的意见
,
要从中抽取
20
人了解情况
,
应用何种方法抽取
,
请具体实施操作
;
(2)
若要从工人中抽取
2
人作为工人代表
,
应用何种方法抽取
.
【
解题策略
】
抽样方法的选取
(1)
若总体由差异明显的几个层次组成
,
则选用分层随机抽样
.
(2)
若总体没有差异明显的层次
,
则考虑采用简单随机抽样
.
【
跟踪训练
】
①
教育局督学组到校检查工作
,
临时需在高三
20
个班抽两个班听课
;②
某班数学期中考试有
14
人在
120
分以上
,35
人在
90
~
119
分
,7
人不及格
,
现从中抽出
8
人研讨进一步改进教与学
;③
某班春节聚会
,
要产生两位“幸运者”
.
就这三件事
,
合适的抽样方法分别为
(
)
A.
分层随机抽样
,
分层随机抽样
,
简单随机抽样
B.
分层随机抽样
,
简单随机抽样
,
简单随机抽样
C.
分层随机抽样
,
简单随机抽样
,
分层随机抽样
D.
简单随机抽样
,
分层随机抽样
,
简单随机抽样
【
解析
】
选
D.①20
个班抽两个班用简单随机抽样
.②
由于学生分成了差异比较大的几层
,
应用分层随机抽样
.③
由于总体与样本容量较小
,
应用简单随机抽样
.
课堂检测
·
素养达标
1.
某校高三年级有男生
500
人
,
女生
400
人
,
为了解该年级学生的健康状况
,
从男生中任意抽取
25
人
,
从女生中任意抽取
20
人进行调查
.
这种抽样方法是
(
)
A.
简单随机抽样
B.
抽签法
C.
随机数法
D.
分层随机抽样
【
解析
】
选
D.
从男生
500
人中抽取
25
人
,
从女生
400
人中抽取
20
人
,
抽取的比例相同
,
因此用的是分层随机抽样
.
2.
某林场有树苗
30 000
棵
,
其中松树苗
4 000
棵
.
为调查树苗的生长情况
,
采用分
层随机抽样的方法抽取一个容量为
150
的样本
,
则样本中松树苗的数量为
(
)
A.30
B.25
C.20
D.15
【
解析
】
选
C.
样本中松树苗为
4 000× =4 000× =20(
棵
).
3.
对一个容量为
N
的总体抽取容量为
n
的样本
,
当选取简单随机抽样和分层随
机抽样两种不同方法抽取样本时
,
总体中每个个体被抽中的概率分别为
p
1
,p
2
,
则
(
)
A.p
1
p 2 C.p 1 =p 2 D.p 1 ,p 2 没有关系 【 解析 】 选 C. 不管是简单随机抽样还是分层随机抽样 , 它们都是等概率抽样 , 每个个体被抽中的概率均为 . 4.( 教材二次开发 : 练习改编 ) 古代科举制度始于隋而成于唐 , 完善于宋、元 . 明 代则处于其发展的鼎盛阶段 . 其中表现之一为会试分南卷、北卷、中卷 , 按比例 录取 , 其录取比例为 11∶7∶2. 若明宣德五年会试录取人数为 100, 则中卷录取人 数为 . 【 解析 】 由题意知 , 明宣德五年会试录取人数为 100, 则中卷录取人数为 100× =10. 答案 : 10 5. 从总体容量为 N 的一批零件中用分层随机抽样抽取一个容量为 30 的样本 , 若每个零件被抽取的可能性为 0.25, 则 N 等于 . 【 解析 】 分层随机抽样是等可能抽样 , 故总体容量为 30÷0.25=120. 答案 : 120