- 804.00 KB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第1讲 随机抽样
一、知识梳理
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),且每次抽取时总体内的各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.
(2)常用方法:抽签法和随机数法.
2.系统抽样
(1)步骤:①先将总体的N个个体编号;
②根据样本容量n,当是整数时,取分段间隔k=;
③在第1段用简单随机抽样确定第一个个体编号l(l≤k);
④按照一定的规则抽取样本.
(2)适用范围:适用于总体中的个体数较多时.
3.分层抽样
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)适用范围:适用于总体由差异比较明显的几个部分组成时.
常用结论
1.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.
2.系统抽样是等距抽样,入样个体的编号相差的整数倍.
3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
二、习题改编
1.(必修3P100A组T1改编)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )
A.总体
B.个体
C.样本的容量
D.从总体中抽取的一个样本
答案:A
2.(必修3P64A组T5改编)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.
答案:18
一、思考辨析
判断正误(正确的打“√”,错误的打“×”)
(1)简单随机抽样是一种不放回抽样.( )
(2)在抽签法中,先抽的人抽中的可能性大.( )
(3)系统抽样在起始部分抽样时采用简单随机抽样.( )
(4)用系统抽样从102个学生中抽取20人,需用简单随机抽样方法剔除2人,这样对被剔除者不公平.( )
(5)在分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )
答案:(1)√ (2)× (3)√ (4)× (5)×
二、易错纠偏
(1)随机数表法的规则不熟出错;
(2)系统抽样中先剔除部分个体,再分段;
(3)分层抽样每层抽取的抽样比是相同的.
1.假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随机数法从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001,…,499进行编号,若从随机数表第7行第8列的数开始向右读,则抽取的第3支疫苗的编号为 .(下面摘取了随机数表的第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67
21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75
12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38
15 51 00 13 42 99 66 02 79 54
解析:由题意得,从随机数表第7行第8列的数开始向右读,符合条件的前三个编号依次是331,455,068,故抽取的第3支疫苗的编号是068.
答案:068
2.某学校为了解高一年级1 203名学生对某项教改试验的意见,打算从中抽取一个容量为40的样本,若采用系统抽样,则分段间隔为 .
解析:因为1 203除以40不是整数,所以需随机剔除3个个体,从而每一段有30个个体,则分段间隔为30.
答案:30
3.某校为了解学生学习的情况,采用分层抽样的方法从高一2 400人、高二2 000人、高三n人中,抽取90人进行问卷调查.已知高一被抽取的人数为36,那么高三被抽取的人数为 .
解析:由分层抽样可得×90=36,则n=1 600,所以高三被抽取的人数为×90=24.
答案:24
简单随机抽样(师生共研)
(2020·武汉市武昌区调研考试)已知某射击运动员每次射击击中目标的概率都为80%.现采用随机模拟的方法估计该运动员4次射击至少3次击中目标的概率:先由计算器产生0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标;再以每4个随机数为一组,代表4次射击的结果.经随机模拟产生了如下20组随机数:
7527 0293 7140 9857 0347 4373 8636 6947 1417 4698 0371 6233 2616 8045 6011 3661 9597 7424 7610 4281
据此估计,该射击运动员4次射击至少3次击中目标的概率为 .
【解析】 4次射击中有1次或2次击中目标的有:0371,6011,7610,1417,7140,所以所求概率P=1-==0.75.
【答案】 0.75
抽签法与随机数法的适用情况
(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
(2)一个抽样试验能否用抽签法,关键看两点:
一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
1.下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的5 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
D.从某厂生产的5 000件产品中抽取10件进行质量检验
解析:选B.因为A,D中总体的个体数较大,不适合用抽签法;C中甲、乙两厂生产的产品质量可能差别较大,因此未达到搅拌均匀的条件,也不适合用抽签法;B中总体容量和样本容量都较小,且同厂生产的产品可视为搅拌均匀了.
2.大、中、小三个盒子中分别装有同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为 .
解析:因为三个盒子中装的是同一种产品,且按比例抽取每盒中抽取的不是整数,所以将三盒中的产品放在一起搅匀按简单随机抽样法抽样较为适合.
答案:简单随机抽样
系统抽样(典例迁移)
采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为( )
A.7 B.9
C.10 D.15
【解析】 从960人中用系统抽样方法抽取32人,则将整体分成32组,每组30人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为an=9+30·(n-1)=30n-21,由451≤30n-21≤750,得≤n≤,所以n=16,17,…,25,共有25-16+1=10(人).
【答案】 C
【迁移探究】 (变条件)若本例中条件变为“若第5组抽到的号码为129”,求第1组抽到的号码.
解:设第1组抽到的号码为x,则第5组抽到的号码为x+(5-1)×30,由x+(5-1)×30=129,解得x=9,因此第1组抽到的号码为9.
系统抽样的特点
(1)适用于元素个数很多且均衡的总体.
(2)各个个体被抽到的机会均等.
(3)总体分组后,在起始部分抽样时采用的是简单随机抽样.
(4)如果总体容量N能被样本容量n整除,则抽样间隔为k=.
[提醒] 如果总体容量N不能被样本容量n整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样.
1.某单位有840名职工,现采用系统抽样的方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12
C.13 D.14
解析:选B.由题意得,抽样间隔为=20.所以在区间[481,720]抽取=12(人).
2.(2020·内蒙古呼和浩特第一次质量普查)某班共有学生60名,座位号分别为01,02,…,60.现根据坐位号,用系统抽样的方法,抽取一个容量为4的样本,已知03号、18号、48号同学在样本中,则样本中另外一位同学的座位号为 号.
解析:由题意知抽样间隔f==15,
因为03号、18号、48号同学在样本中,
所以样本中另外一位同学的座位号为18+15=33号.
答案:33
分层抽样(师生共研)
(1)(一题多解)某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:
最喜爱
喜爱
一般
不喜欢
4 800
7 200
6 400
1 600
电视台为了了解观众的具体想法和意见,打算从中抽选出100人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽选出的人数分别为( )
A.25,25,25,25 B.48,72,64,16
C.20,40,30,10 D.24,36,32,8
(2)一支田径队有男运动员56人,女运动员m人,用分层抽样抽出一个容量为n的样本,在这个样本中随机取一个当队长的概率为,且样本中的男队员比女队员多4人,则m= .
【解析】 (1)法一:因为抽样比为=,
所以每类人中应抽选出的人数分别为
4 800×=24,7 200×=36,6 400×=32,1 600×=8.故选D.
法二:最喜爱、喜爱、一般、不喜欢的比例为4 800∶7 200∶6 400∶1 600=6∶9∶8∶2,
所以每类人中应抽选出的人数分别为×100=24,×100=36,×100=32,×100=8,故选D.
(2)由题意知n=28,设其中有男队员x人,女队员有y人.
则解得x=16,y=12,m=42.
【答案】 (1)D (2)42
(1)分层抽样中的两个等量关系
①=
②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
(2)分层抽样问题类型及解题思路
①求某层应抽个体数量,根据该层所占总体的比例计算.
②已知某层个体数量,求总体容量,根据分层抽样即按比例抽样,列比例式进行计算.
③确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.
1.(2020·重庆中山外国语学校模拟)如饼图,某学校共有教师120人,从中选出一个30人的样本,其中被选出的青年女教师的人数为( )
A.12 B.6
C.4 D.3
解析:选D.青年教师的人数为120×30%=36,
所以青年女教师为12人,故青年女教师被选出的人数为12×=3.故选D.
2.某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:
产品类别
A
B
C
产品数量(件)
1 300
样本容量(件)
130
由于不小心,表格中A、C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是 .
解析:设样本容量为x,则×1 300=130,所以x=300.所以A产品和C产品在样本中共有300-130=170(件).设C产品的样本容量为y,则y+y+10=170,所以y=80.所以C产品的数量为×80=800.
答案:800
[基础题组练]
1.(2020·桂林期末)完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是( )
A.①简单随机抽样,②系统抽样
B.①分层抽样,②简单随机抽样
C.①系统抽样,②分层抽样
D.①②都用分层抽样
解析:选B.因为社会购买能力的某项指标受到家庭收入的影响,而社区中各个家庭收入差别明显,所以①用分层抽样法;从某中学的15名艺术特长生中选出3名调查学习负担情况,个体之间差别不大,且总体和样本容量较小,所以②用简单随机抽样法,故选B.
2.某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座号是( )
49 54 43 54 82 17 37 93 23 78 87 35
20 96 43 84 26 34 91 64 57 24 55 06
88 77 04 74 47 67 21 76 33 50 25 83
92 12 06
A.23 B.09
C.02 D.16
解析:选D.从随机数表第一行的第6列数字3开始,由左到右依次选取两个数字,不超过34的依次为21,32,09,16,17,故第4个志愿者的座号为16.
3.(2020·陕西汉中重点中学联考)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:
不喜欢
喜欢
男性青年观众
30
10
女性青年观众
30
50
现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢的男性青年观众”中抽取了6人,则n=( )
A.12 B.16
C.20 D.24
解析:选D.由题意得==,解得n=24.故选D.
4.某学校采用系统抽样的方法,从该校高一年级全体800名学生中抽50名学生做视力检查.现将800名学生从1到800进行编号.已知从33~48这16个数中抽到的数是39,则在第1小组1~16中随机抽到的数是( )
A.5 B.7
C.11 D.13
解析:选B.把800名学生分成50组,每组16人,各小组抽到的数构成一个公差为16的等差数列,39在第3组.所以第1组抽到的数为39-32=7.故选B.
5.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,若用分层抽样方法,则40岁以下年龄段应抽取 人.
解析:由年龄分布情况图可得40岁以下年龄段应抽取40×50%=20(人).
答案:20
6.(2020·惠州市第二次调研)某班共有56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本,已知学号为2,30,44的同学在样本中,则样本中还有一位同学的学号为 .
解析:由题意得,需要将56人按学号从小到大分成4组,每组抽取第2个学号对应的同学,所以还有一位同学的学号为1×14+2=16.
答案:16
7.(2020·开封市定位考试)某工厂生产A,B,C三种不同型号的产品,产品数量之比为k∶5∶3,现用分层抽样的方法抽出一个容量为120的样本,已知A种型号产品共抽取了24件,则C种型号产品抽取的件数为 .
解析:依题意得=,解得k=2,所以C种型号产品抽取的件数为×120=36.
答案:36
8.某初级中学共有学生2 000名,各年级男、女生人数如下表:
初一年级
初二年级
初三年级
女生
373
x
y
男生
377
370
z
已知从全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.
(1)求x的值;
(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?
解:(1)因为=0.19,所以x=380.
(2)初三年级人数为y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为×500=12(名).
[综合题组练]
1.用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
A., B.,
C., D.,
解析:选A.在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为,故选A.
2.某工厂的一、二、三车间在2018年11月份共生产了3 600双皮靴,在出厂前检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a、b、c,且a、b、c成等差数列,则二车间生产的产品数为( )
A.800 B.1 000
C.1 200 D.1 500
解析:选C.因为a、b、c成等差数列,所以2b=a+c,所以从二车间抽取的产品数占抽取产品总数的,根据分层抽样的性质可知,二车间生产的产品数占产品总数的,所以二车间生产的产品数为3 600×=1 200.故选C.
3.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定:如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是 .
解析:由题意知m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.
答案:76
4.(应用型)某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山比赛活动.每人都参与而且只参与其中一项比赛,各年级参与比赛的人数情况如下表:
高一年级
高二年级
高三年级
跑步
a
b
c
登山
x
y
z
其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取 人.
解析:根据题意可知样本中参与跑步的人数为200×=120,所以从高二年级参与跑步的学生中应抽取的人数为120×=36.
答案:36