- 99.96 KB
- 2021-05-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
高考数学考点归纳之 随机抽样
一、基础知识
1.简单随机抽样
(1)定义:一般地,设一个总体含有 N个个体,从中逐个不放回地抽取 n个个体作为样
本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做
简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)常用方法:抽签法和随机数法.
2.分层抽样
(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一
定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
3.系统抽样
(1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制
定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.
(2)系统抽样的步骤
假设要从容量为 N的总体中抽取容量为 n的样本.
①先将总体的 N个个体编号;
②确定分段间隔 k,对编号进行分段.当
N
n
(n是样本容量)是整数时,取 k=N
n
;
当总体中的个体数不能被样本容量整除时,可先用简单随机抽样的方法从总体中剔除几个个
体,使剩下的个体数能被样本容量整除,然后再按系统抽样进行.这时在整个抽样过程中每
个个体被抽取的可能性仍然相等.
③在第 1段用简单随机抽样确定第一个个体编号 l(l≤k);
④按照一定的规则抽取样本.通常是将 l加上间隔 k得到第 2个个体编号 l+k,再加 k
得到第 3个个体编号 l+2k,依次进行下去,直到获取整个样本.
二、常用结论
(1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
(2)系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔 k的整数倍.
(3)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
(4)三种抽样方法的特点、联系及适用范围
类别 共同点 各自特点 联系 适用范围
简单随
机抽样
①抽样过程中每
个个体被抽到的
可能性相等;
②每次抽出个体
后不再将它放回,
即不放回抽样
从总体中逐个抽取
总体个数
较少
系统
抽样
将总体均分成几部分,按
预先定出的规则在各部
分中抽取
在起始部分取样
时,采用简单随
机抽样
总 体 个 数
较多
分层
抽样
将总体分成几层,分层进
行抽取
各层抽样时,采
用简单随机抽样
或系统抽样
总 体 由 差
异 明 显 的
几 部 分 组
成
考点一 简单随机抽样
[典例] 下列抽取样本的方式属于简单随机抽样的个数有( )
①从无限多个个体中抽取 100个个体作为样本;
②盒子里共有 80个零件,从中选出 5个零件进行质量检验.在抽样操作时,从中任意
拿出一个零件进行质量检验后再把它放回盒子里;
③用抽签方法从 10件产品中选取 3件进行质量检验;
④某班有 56名同学,指定个子最高的 5名同学参加学校组织的篮球赛.
A.0个 B.1个
C.2个 D.3个
[解析] ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;
②不是简单随机抽样,因为它是有放回抽样;③明显为简单随机抽样;④不是简单随机抽样,
因为不是等可能抽样.
[答案] B
[解题技法] 应用简单随机抽样应注意的问题
(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅
匀.一般地,当总体容量和样本容量都较小时可用抽签法.
(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的
数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的
数字舍去.
[题组训练]
1.总体由编号为 01,02,…,19,20的 20个个体组成,利用下面的随机数表选取 5个个
体,选取方法是从随机数表第 1行的第 5列和第 6列数字开始由左到右依次选取两个数字,
则选出来的第 5个个体的编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.07
C.02 D.01
解析:选 D 由随机数法的随机抽样的过程可知选出的 5 个个体是 08,02,14,07,01,所
以第 5个个体的编号是 01.
2.利用简单随机抽样,从 n个个体中抽取一个容量为 10的样本.若第二次抽取时,余
下的每个个体被抽到的概率为
1
3
,则在整个抽样过程中,每个个体被抽到的概率为( )
A.1
4
B.1
3
C. 5
14
D.10
27
解析:选 C 根据题意,
9
n-1
=
1
3
,
解得 n=28.
故在整个抽样过程中每个个体被抽到的概率为
10
28
=
5
14
.
考点二 系统抽样
[典例] (1)某校为了解 1 000名高一新生的身体生长状况,用系统抽样法(按等距的规
则)抽取 40名同学进行检查,将学生从 1~1 000进行编号,现已知第 18组抽取的号码为 443,
则第一组用简单随机抽样抽取的号码为( )
A.16 B.17
C.18 D.19
(2)中央电视台为了解观众对某综艺节目的意见,准备从 502名现场观众中抽取 10%进
行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽
样间隔为________.
[解析] (1)因为从 1 000名学生中抽取一个容量为 40的样本,所以系统抽样的分段间隔
为
1 000
40
=25,
设第一组随机抽取的号码为 x,
则抽取的第 18组编号为 x+17×25=443,所以 x=18.
(2)把 502名观众平均分成 50组,由于 502除以 50的商是 10,余数是 2,所以每组有
10名观众,还剩 2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从 502
名观众中抽取 2名观众,这 2名观众不参加座谈;再将剩下的 500名观众编号为 1,2,3,…,
500,并均匀分成 50段,每段含
500
50
=10个个体.所以需剔除 2个个体,抽样间隔为 10.
[答案] (1)C (2)2 10
[变透练清]
1.变结论若本例(1)的条件不变,则编号落入区间[501,750]的人数为________.
解析:从 1 000名学生中抽取一个容量为 40的样本,系统抽样分 40组,每组
1 000
40
=25
个号码,每组抽取一个,从 501到 750恰好是第 21组到第 30组,共抽取 10人.
答案:10
2.(2018·南昌摸底调研)某校高三(2)班现有 64名学生,随机编号为 0,1,2,…,63,依
编号顺序平均分成 8组,组号依次为 1,2,3,…,8.现用系统抽样方法抽取一个容量为 8的样
本,若在第 1组中随机抽取的号码为 5,则在第 6组中抽取的号码为________.
解析:由题知分组间隔为
64
8
=8,又第 1 组中抽取的号码为 5,所以第 6组中抽取的号
码为 5×8+5=45.
答案:45
[解题技法] 系统抽样中所抽取编号的特点
系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是
第 1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所
要抽取的样本号码.
[提醒] 系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽
样从总体中剔除几个个体,然后再按系统抽样进行.
考点三 分层抽样
[典例] 某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共
有 20 000人,其中各种态度对应的人数如下表所示:
最喜爱 喜爱 一般 不喜欢
4 800 7 200 6 400 1 600
电视台为了了解观众的具体想法和意见,打算从中抽取 100人进行详细的调查,为此要
进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( )
A.25,25,25,25 B.48,72,64,16
C.20,40,30,10 D.24,36,32,8
[解析 ] 法一:因为抽样比为
100
20 000
=
1
200
,所以每类人中应抽取的人数分别为
4 800× 1
200
=24,7 200× 1
200
=36,6 400× 1
200
=32,1 600× 1
200
=8.
法二:最喜爱、喜爱、一般、不喜欢的比例为 4 800∶7 200∶6 400∶1 600=6∶9∶8∶
2,
所以每类人中应抽取的人数分别为
6
6+9+8+2
×100=24, 9
6+9+8+2
×100=36,
8
6+9+8+2
×100=32, 2
6+9+8+2
×100=8.
[答案] D
[解题技法] 分层抽样问题的类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比
例式进行计算.
(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=
样本容量
总体容量
=
各层样本数量
各层个体数量
”.
[题组训练]
1.(2019·山西五校联考)某校为了解学生的学习情况,采用分层抽样的方法从高一 1 000
人、高二 1 200人、高三 n人中抽取 81人进行问卷调查,若高二被抽取的人数为 30,则 n
=( )
A.860 B.720
C.1 020 D.1 040
解析:选 D 由已知条件知抽样比为
30
1 200
=
1
40
,从而
81
1 000+1 200+n
=
1
40
,解得 n=
1 040,故选 D.
2.(2018·广州高中综合测试)已知某地区中小学学生人数如图所示.为
了解该区学生参加某项社会实践活动的意向,拟采用分层抽样的方法来进
行调查.若高中需抽取 20名学生,则小学与初中共需抽取的学生人数为
________.
解析:设小学与初中共需抽取的学生人数为 x,依题意可得
1 200
2 700+2 400+1 200
=
20
x+20
,
解得 x=85.
答案:85
[课时跟踪检测]
1.从 2 019名学生中选取 50名学生参加全国数学联赛,若采用以下方法选取:先用简
单随机抽样法从 2 019名学生中剔除 19名学生,剩下的 2 000名学生再按系统抽样的方法抽
取,则每名学生入选的概率( )
A.不全相等 B.均不相等
C.都相等,且为
50
2 019
D.都相等,且为
1
40
解析:选 C 从 N个个体中抽取 M个个体,则每个个体被抽到的概率都等于
M
N
,故每
名学生入选的概率都相等,且为
50
2 019
.
2.福利彩票“双色球”中红球的号码可以从 01,02,03,…,32,33这 33 个两位号码中
选取,小明利用如下所示的随机数表选取红色球的 6个号码,选取方法是从第 1行第 9列的
数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )
81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 85
06 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49
A.12 B.33
C.06 D.16
解析:选 C 被选中的红色球的号码依次为 17,12,33,06,32,22,所以第四个被选中的红
色球的号码为 06.
3.某班共有学生 52人,现根据座号,用系统抽样的方法,抽取一个容量为 4的样本.已
知 5号、18号、44号同学在样本中,那么样本中还有一个同学的座号是( )
A.23 B.27
C.31 D.33
解析:选 C 分段间隔为
52
4
=13,故样本中还有一个同学的座号为 18+13=31.
4.某工厂在 12月份共生产了 3 600双皮靴,在出厂前要检查这批产品的质量,决定采
用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为 a,b,c,且 a,b,
c构成等差数列,则第二车间生产的产品数为( )
A.800双 B.1 000双
C.1 200双 D.1 500双
解析:选 C 因为 a,b,c成等差数列,所以 2b=a+c,即第二车间抽取的产品数占抽
样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占 12月份生产
总数的三分之一,即为 1 200双皮靴.
5.(2018·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为
了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样
本容量和抽取的高中生近视人数分别为( )
A.100,20 B.200,20
C.200,10 D.100,10
解析:选 B 由题图甲可知学生总人数是 10 000,样本容量为 10 000×2%=200,抽取
的高中生人数是 2 000×2%=40,由题图乙可知高中生的近视率为 50%,所以抽取高中生的
近视人数为 40×50%=20,故选 B.
6.一个总体中有 100个个体,随机编号为 0,1,2,…,99.依编号顺序平均分成 10个小
组,组号依次为 1,2,3,…,10.现用系统抽样方法抽取一个容量为 10的样本,如果在第一组
随机抽取的号码为 m,那么在第 k组中抽取的号码个位数字与 m+k的个位数字相同.若 m
=6,则在第 7组中抽取的号码是( )
A.63 B.64
C.65 D.66
解析:选 A 若 m=6,则在第 7组中抽取的号码个位数字与 13的个位数字相同,而第
7组中的编号依次为 60,61,62,63,…,69,故在第 7组中抽取的号码是 63.
7.采用系统抽样方法从 960人中抽取 32人做问卷调查,为此将他们随机编号为 1,2,…,
960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9.抽到的 32人中,编号落入区
间[1,450]的人做问卷 A,编号落入区间(450,750]的人做问卷 B,其余的人做问卷 C.则抽到的
人中,做问卷 B的人数为( )
A.7 B.9
C.10 D.15
解析:选 C 960÷32=30,故由题意可得抽到的号码构成以 9为首项,以 30为公差的
等差数列,其通项公式为 an=9+30(n-1)=30n-21.由 450<30n-21≤750,解得 15.7<
n≤25.7.又 n为正整数,所以 16≤n≤25,故做问卷 B的人数为 25-16+1=10.故选 C.
8.某企业三月中旬生产 A,B,C三种产品共 3 000件,根据分层抽样的结果,企业统
计员制作了如下的统计表格:
产品类别 A B C
产品数量(件) 1 300
样本容量(件) 130
由于不小心,表格中 A,C产品的有关数据已被污染看不清楚,统计员记得 A产品的样
本容量比 C产品的样本容量多 10,根据以上信息,可得 C的产品数量是________件.
解析:设样本容量为 x,则
x
3 000
×1 300=130,∴x=300.
∴A产品和 C产品在样本中共有 300-130=170(件).
设 C产品的样本容量为 y,则 y+y+10=170,∴y=80.
∴C产品的数量为
3 000
300
×80=800(件).
答案:800
9.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽
样方法从三个分厂生产的该产品中共抽取 100件做使用寿命的测试,则第一分厂应抽取的件
数为________;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值
分别为 1 020小时、980小时、1 030小时,估计这个企业所生产的该产品的平均使用寿命为
________小时.
解析:第一分厂应抽取的件数为 100×50%=50;该产品的平均使用寿命为 1 020×0.5
+980×0.2+1 030×0.3=1 015.
答案:50 1 015
10.将参加冬季越野跑的 600名选手编号为:001,002,…,600,采用系统抽样方法抽
取一个容量为 50的样本,把编号分为 50组后,在第一组的 001到 012这 12个编号中随机
抽得的号码为 004,这 600名选手穿着三种颜色的衣服,从 001到 301穿红色衣服,从 302
到 496穿白色衣服,从 497到 600穿黄色衣服,则抽到穿白色衣服的选手人数为________.
解析:由题意及系统抽样的定义可知,将这 600名学生按编号依次分成 50组,每一组
各有 12 名学生,第 k(k∈N*)组抽中的号码是 4+12(k-1).令 302≤4+12(k-1)≤496,得
255
6
≤k≤42,因此抽到穿白色衣服的选手人数为 42-25=17(人).
答案:17
11.某初级中学共有学生 2 000名,各年级男、女生人数如下表:
初一年级 初二年级 初三年级
女生 373 x y
男生 377 370 z
已知在全校学生中随机抽取 1名,抽到初二年级女生的概率是 0.19.
(1)求 x的值;
(2)现用分层抽样的方法在全校抽取 48名学生,问应在初三年级抽取多少名?
解:(1)∵ x
2 000
=0.19,∴x=380.
(2)初三年级人数为 y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在
全校抽取 48名学生,应在初三年级抽取的人数为
48
2 000
×500=12(名).