- 127.56 KB
- 2021-07-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第 1 讲 随机抽样
[最新考纲]
1.理解随机抽样的必要性和重要性.
2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.
知 识 梳 理
1.简单随机抽样
(1)定义:设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本
(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样
方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:抽签法和随机数法.
2.系统抽样的步骤
假设要从容量为 N 的总体中抽取容量为 n 的样本.
(1)编号:先将总体的 N 个个体编号;
(2)分段:确定分段间隔 k,对编号进行分段,当N
n(n 是样本容量)是整数时,取 k
=N
n
;
(3)确定首个个体:在第 1 段用简单随机抽样确定第一个个体编号 l(l≤k);
(4)获取样本:按照一定的规则抽取样本,通常是将 l 加上间隔 k 得到第 2 个个体
编号(l+k),再加 k 得到第 3 个个体编号(l+2k),依次进行下去,直到获取整个
样本.
3.分层抽样
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层
独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方
法叫做分层抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
辨 析 感 悟
1.对简单随机抽样的认识
(1)(教材思考问题改编)在简单随机抽样中,某一个个体被抽到的可能性与第几次
抽取有关,第一次抽到的可能性最大.(×)
(2)从 100 件玩具中随机拿出一件,放回后再拿出一件,连续拿 5 次,是简单随
机抽样.(×)
2.对系统抽样的理解
(3)系统抽样适用于元素个数较多且分布均衡的总体.(√)
(4)要从 1 002 个学生中用系统抽样的方法选取一个容量为 20 的样本,需要剔除
2 个学生,这样对被剔除者不公平.(×)
3.对分层抽样的理解
(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(×)
(6)(2018·郑州模拟改编)某校即将召开学生代表大会,现从高一、高二、高三共
抽取 60 名代表,则可用分层抽样方法抽取.(√)
(7)(2018·湖南卷改编)某学校有男、女学生各 500 名.为了解男、女学生在学习
兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取 100 名学生进行调
查,则宜采用的抽样方法是分层抽样.(√)
[感悟·提升]
两点提醒 一是简单随机抽样(抽签法和随机数法)都是从总体中逐个地进行抽
取,都是不放回抽样,如(2).
二是三种抽样方法在抽样过程中每个个体被抽到的可能性都相等,如(1)、(4)、
(5).
考点一 简单随机抽样
【例 1】 下列抽取样本的方式是否属于简单随机抽样?
(1)从无限多个个体中抽取 100 个个体作为样本.
(2)盒子里共有 80 个零件,从中选出 5 个零件进行质量检验.在抽样操作时,从
中任意拿出一个零件进行质量检验后再把它放回盒子里.
(3)从 20 件玩具中一次性抽取 3 件进行质量检验.
(4)某班有 56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛.
解 (1)不是简单随机抽样.由于被抽取的样本总体的个体数是无限的,而不是
有限的.
(2)不是简单随机抽样.由于它是放回抽样.
(3)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.
(4)不是简单随机抽样.因为指定个子最高的 5 名同学是 56 名中特指的,不存在
随机性,不是等可能抽样.
规律方法 (1)简单随机抽样需满足;①抽取的个体数有限;②逐个抽取;③是不
放回抽取;④是等可能抽取.
(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数表法(适用
于个体数较多的情况).
【训练 1】 下列抽样试验中,适合用抽签法的有( ).
A.从某厂生产的 5 000 件产品中抽取 600 件进行质量检验
B.从某厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验
C.从甲、乙两厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验
D.从某厂生产的 5 000 件产品中抽取 10 件进行质量检验
答案 B
考点二 系统抽样
【例 2】 采用系统抽样方法从 960 人中抽取 32 人做问卷调查.为此将他们随机
编号为 1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9.
抽到的 32 人中,编号落入区间[1,450]的人做问卷 A,编号落入区间[451,750]的
人做问卷 B,其余的人做问卷 C.则抽到的人中,做问卷 B 的人数为( ).
A.7 B.9 C.10 D.15
解析 从 960 人中用系统抽样方法抽取 32 人,则每 30 人抽取一人,因为第一组
抽到的号码为 9,则第二组抽到的号码为 39,第 n 组抽到的号码为 an=9+30(n
-1)=30n-21,由 451≤30n-21≤750,得236
15
≤n≤257
10
,所以 n=16,17,…,
25,共有 25-16+1=10 人,选 C.
答案 C
规律方法 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.
(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地
剔除几个个体,从而确定分段间隔.
(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便
随之确定.
【训练 2】 (1)从编号为 1~50 的 50 枚最新研制的某种型号的导弹中随机抽取 5
枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选
取 5 枚导弹的编号可能是( ).
A.5,10,15,20,25 B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,6,16,32
(2)(2018·临沂模拟)某班共有 52 人,现根据学生的学号,用系统抽样的方法,抽
取一个容量为 4 的样本,已知 3 号、29 号、42 号同学在样本中,那么样本中还
有一个同学的学号是( ).
A.10 B.11 C.12 D.16
解析 (1)间隔距离为 10,故可能编号是 3,13,23,33,43.
(2)因为 29 号、42 号的号码差为 13,所以 3+13=16,即另外一个同学的学号是
16.
答案 (1)B (2)D
考点三 分层抽样
【例 3】 (2018·兰州模拟)某学校三个兴趣小组的学生人数分布如下表(每名同学
只参加一个小组)(单位:人)
篮球组 书画组 乐器组
高一 45 30 a
高二 15 10 20
学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加
这三个兴趣小组的学生中抽取 30 人,结果篮球组被抽出 12 人,则 a 的值为
________.
解析 因为 30
45+15+30+10+a+20
= 12
45+15
,所以解得 a=30.
答案 30
规律方法 进行分层抽样的相关计算时,常利用以下关系式巧解:
(1)
样本容量 n
总体的个数 N
=该层抽取的个体数
该层的个体数
;
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
【训练 3】 (1)(2018·江苏卷)某学校高一、高二、高三年级的学生人数之比为 3∶
3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为 50 的样本,
则应从高二年级抽取________名学生.
(2)某单位有职工 750 人,其中青年职工 350 人,中年职工 250 人,老年职工 150
人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本
中的青年职工为 7 人,则样本容量为________.
解析 (1)高二年级学生人数占总数的 3
3+3+4
= 3
10.样本容量为 50,则高二年级
抽取:50× 3
10
=15(名)学生.
(2)由题意知,青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=
7∶5∶3.由样本中青年职工为 7 人得样本容量为 15.
答案 (1)15 (2)15
1.三种抽样方法的联系
三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相
等,体现了这三种抽样方法的客观性和公平性.若样本容量为 n,总体的个体数
为 N,则用这三种方法抽样时,每个个体被抽到的概率都是n
N.
2.各种抽样方法的特点
(1)简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,
尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性,个体间无固定
间距.
(2)系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机
会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.
(3)分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在
每一层抽样时可采用简单随机抽样或系统抽样.
创新突破 8——抽样方法与概率的交汇问题
【典例】 (2018·天津卷)某地区有小学 21 所,中学 14 所,大学 7 所,现采用分
层抽样的方法从这些学校中抽取 6 所学校对学生进行视力调查.
(1)求应从小学、中学、大学中分别抽取的学校数目;
(2)若从抽取的 6 所学校中随机抽取 2 所学校做进一步数据分析,
①列出所有可能的抽取结果;
②求抽取的 2 所学校均为小学的概率.
突破 1:确定分层抽样中的每层所占的比例.
突破 2:用列举法列出所有可能抽取的结果.
突破 3:利用古典概型的计算公式计算.
解 (1)由分层抽样的定义知,从小学中抽取的学校数目为 6× 21
21+14+7
=3;从
中学中抽取的学校数目为 6× 14
21+14+7
=2;从大学中抽取的学校数目为
6× 7
21+14+7
=1.
则从小学、中学、大学分别抽取的学校数目为 3,2,1.
(2)①在抽取到的 6 所学校中,3 所小学分别记为 A1,A2,A3,2 所中学分别记为
A4,A5,大学记为 A6,则抽取 2 所学校的所有可能结果为(A1,A2),(A1,A3),(A1,
A4),(A1,A5),(A1,A6),(A2,A3),(A2,A4),(A2,A5),(A2,A6),(A3,A4),(A3,
A5),(A3,A6),(A4,A5),(A4,A6),(A5,A6),共 15 种.
②从 6 所学校中抽取的 2 所学校均为小学(记为事件 B)的所有可能结果为(A1,A2),
(A1,A3),(A2,A3),共 3 种.
所以 P(B)= 3
15
=1
5.
[反思感悟] 分层抽样与概率结合的题目多与实际问题紧密联系,计算量和阅读
量都比较大,且一般会有图表,求解时容易造成失误,平时需注意多训练此类型
的题目.
【自主体验】
(2018·潮州模拟)某公司有一批专业技术人员,对他们进行年龄状况和接受教育程
度(学历)的调查,其结果(人数分布)如下表:
学历 35 岁以下 35~50 岁 50 岁以上
本科 80 30 20
研究生 x 20 y
(1)用分层抽样的方法在 35~50 岁年龄段的专业技术人员中抽取一个容量为 5 的
样本,将该样本看成一个总体,从中任取 2 人,求至少有 1 人学历为研究生的概
率;
(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取 N 个人,其
中 35 岁以下 48 人,50 岁以上 10 人,再从这 N 个人中随机抽取出 1 人,此人的
年龄为 50 岁以上的概率为 5
39
,求 x,y 的值.
解 (1)用分层抽样的方法在 35~50 岁中抽取一个容量为 5 的样本,设抽取学历
为本科的人数为 m,∴30
50
=m
5
,解得 m=3.
抽取的样本中有研究生 2 人,本科生 3 人,分别记作 S1,S2;B1,B2,B3.
从中任取 2 人的所有等可能基本事件共有 10 个:(S1,B1),(S1,B2),(S1,B3),
(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3),
其中至少有 1 人的学历为研究生的基本事件有 7 个:(S1,B1),(S1,B2),(S1,
B3),(S2,B1)(S2,B2),(S2,B3),(S1,S2).
∴从中任取 2 人,至少有 1 人学历为研究生的概率为 7
10.
(2)由题意,得10
N
= 5
39
,解得 N=78.
∴35~50 岁中被抽取的人数为 78-48-10=20,
∴ 48
80+x
=20
50
= 10
20+y
,
解得 x=40,y=5.
即 x,y 的值分别为 40,5.
能力提升题组
(建议用时:25 分钟)
一、选择题
1.某工厂在 12 月份共生产了 3 600 双皮靴,在出厂前要检查这批产品的质量,
决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为 a,
b,c,且 a,b,c 构成等差数列,则第二车间生产的产品数为( ).
A.800 B.1 000
C.1 200 D.1 500
解析 因为 a,b,c 成等差数列,所以 2b=a+c,即第二车间抽取的产品数占
抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占
总数的三分之一,即为 1 200 双皮靴.
答案 C
2.将参加夏令营的 600 名学生编号为:001,002,…,600,采用系统抽样方法
抽取一个容量为 50 的样本,且随机抽得的号码为 003.这 600 名学生分住在三个
营区,从 001 到 300 在第Ⅰ营区,从 301 到 495 在第Ⅱ营区,从 496 到 600 在第
Ⅲ营区,三个营区被抽中的人数依次为( ).
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
解析 由题意知间隔为600
50
=12,故抽到的号码为 12k+3(k=0,1,…,49),列出
不等式可解得:第Ⅰ营区抽 25 人,第Ⅱ营区抽 17 人,第Ⅲ营区抽 8 人.
答案 B
二、填空题
3.200 名职工年龄分布如图所示,从中随机抽 40 名职工作样本,采用系统抽样方
法,按 1~200 编号为 40 组,
分别为 1~5,6~10,…,196~200,第 5 组抽取号码为 22,第 8 组抽取号码为
______.若采用分层抽样,
40 岁以下年龄段应抽取________人.
解析 将 1~200 编号分为 40 组,则每组的间隔为 5,其中第 5 组抽取号码为 22,
则第 8 组抽取的号码应为 22+3×5=37;由已知条件 200 名职工中 40 岁以下的
职工人数为 200×50%=100,设在 40 岁以下年龄段中抽取 x 人,则 40
200
= x
100
,
解得 x=20.
答案 37 20
三、解答题
4.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了
100 名电视观众,相关的数据如下表所示:
文艺节目 新闻节目 总计
20 至 40 岁 40 18 58
大于 40 岁 15 27 42
总计 55 45 100
(1)用分层抽样方法在收看新闻节目的观众中随机抽取 5 名,大于 40 岁的观众应
该抽取几名?
(2)在上述抽取的 5 名观众中任取 2 名,求恰有 1 名观众的年龄为 20 至 40 岁的
概率.
解 (1)应抽取大于 40 岁的观众人数为27
45
×5=3
5
×5=3(名).
(2)用分层抽样方法抽取的 5 名观众中,20 至 40 岁有 2 名(记为 Y1,Y2),大于 40
岁有 3 名(记为 A1,A2,A3).5 名观众中任取 2 名,共有 10 种不同取法:Y1Y2,Y1A1,
Y1A2,Y1A3,Y2A1,Y2A2,Y2A3,A1A2,A1A3,A2A3.
设 A 表示随机事件“5 名观众中任取 2 名,恰有 1 名观众年龄为 20 至 40 岁”,
则 A 中的基本事件有 6 种:
Y1A1,Y1A2,Y1A3,Y2A1,Y2A2,Y2A3,
故所求概率为 P(A)= 6
10
=3
5.