- 1.25 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
知识点
考纲下载
随机抽样
理解随机抽样的必要性和重要性.
会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样的方法.
用样本
估计总体
了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
理解样本数据标准差的意义和作用,会计算数据标准差.
能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
统计案例
会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.
了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
通过典型案例了解回归分析的思想、方法,并能初步应用回归分析的思想、方法解决一些简单的实际问题.
通过典型案例了解独立性检验(只要求2×2列联表)的思想、方法,并能初步应用独立性检验的思想、方法解决一些简单的实际问题.
第1讲 随机抽样
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),且每次抽取时各个个体被抽到的机会都相等,
就称这样的抽样方法为简单随机抽样.
(2)常用方法:抽签法和随机数法.
2.系统抽样
(1)步骤:①先将总体的N个个体编号;
②根据样本容量n,当是整数时,取分段间隔k=;
③在第1段用简单随机抽样确定第一个个体编号l(l≤k);
④按照一定的规则抽取样本.
(2)适用范围:适用于总体中的个体数较多时.
3.分层抽样
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)适用范围:适用于总体由差异比较明显的几个部分组成时.
判断正误(正确的打“√”,错误的打“×”)
(1)简单随机抽样是一种不放回抽样.( )
(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( )
(3)抽签法中,先抽的人抽中的可能性大.( )
(4)系统抽样在第1段抽样时采用简单随机抽样.( )
(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( )
(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )
答案:(1)√ (2)× (3)× (4)√ (5)× (6)×
(教材习题改编)为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行统计分析.在这个问题中,这200名学生成绩的全体是( )
A.总体 B.个体
C.从总体中抽取的一个样本 D.样本的容量
解析:选C.根据随机抽样的概念可知选C.
某学校有男、女学生各1 000名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取200名学生进行调查,则宜采用的抽样方法是( )
A.抽签法 B.随机数法
C.系统抽样法 D.分层抽样法
解析:选D.由于是调查男、女学生在学习兴趣与业余爱好方面是否存在差异,
因此易采用分层抽样法.
为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )
A.50 B.40
C.25 D.20
解析:选C.根据系统抽样的特点可知分段间隔为=25,故选C.
对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则 ( )
A.p1=p2<p3 B.p2=p3<p1
C.p1=p3<p2 D.p1=p2=p3
解析:选D.由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.
(教材习题改编)一支田径队有男运动员56人,女运动员若干人,用分层抽样的方法抽取容量为28的运动员时,抽取的男运动员是16人,则女运动员的人数是________.
解析:设女运动员的人数为n,由题意得=,解得n=42.
答案:42
简单随机抽样[学生用书P186]
[典例引领]
(1)以下抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见
D.用抽签方法从10件产品中选取3件进行质量检验
(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.07
C.02 D.01
【解析】 (1)选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.
(2)由题意知前5个个体的编号为08,02,14,07,01.
【答案】 (1)D (2)D
抽签法与随机数法的适用情况
(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
(2)一个抽样试验能否用抽签法,关键看两点:
一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
[通关练习]
1.下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的5 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
D.从某厂生产的5 000件产品中抽取10件进行质量检验
解析:选B.因为A,D中总体的个体数较大,不适合用抽签法;C中甲、乙两厂生产的产品质量可能差别较大,因此未达到搅拌均匀的条件,也不适合用抽签法;B中总体容量和样本容量都较小,且同厂生产的产品可视为搅拌均匀了.
2.下列抽取样本的方式不属于简单随机抽样的有________.
①从无限多个个体中抽取100个个体作为样本.
②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
③从20件玩具中一次性抽取3件进行质量检验.
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
解析:①不是简单随机抽样.
②不是简单随机抽样.因为它是有放回抽样.
③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.
④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.
答案:①②③④
系统抽样[学生用书P186]
[典例引领]
(1)某单位有840名职工,现采用系统抽样的方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12
C.13 D.14
(2)(2018·豫晋冀高三模拟)某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法,抽取4个班进行调查,若抽到编号之和为48,则抽到的最小编号为( )
A.2 B.3
C.4 D.5
【解析】 (1)抽样间隔为=20.设在1,2,…,20中抽取号码x0(x0∈[1,20],在[481,720]之间抽取的号码记为20k+x0,则481≤20k+x0≤720,k∈N*.
所以24≤k+≤36.因为∈,
所以k=24,25,26,…,35,
所以k值共有35-24+1=12(个),即所求人数为12.
(2)系统抽样的间隔为=6,设抽到的最小编号为x,则x+(6+x)+(12+x)+(18+x)=48,解得x=3.
【答案】 (1)B (2)B
在本例(1)中,若第三组抽到的号码为44,则在第八组中抽得的号码是什么?
解:在第八组中抽得的号码为(8-3)×20+44=144.
应用系统抽样应注意的问题
(1)系统抽样适用的条件是总体容量较大,样本容量也较大.
(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.
(3)起始编号可用简单随机抽样来确定,一旦起始编号确定,其他编号便随之确定.
[通关练习]
1.(2018·马鞍山月考)高三(1)班有学生52人,现将所有学生随机编号,
用系统抽样方法,抽取一个容量为4的样本,已知5号、31号、44号学生在样本中,则样本中还有一个学生的编号是( )
A.8 B.13
C.15 D.18
解析:选D.分段间隔为=13,故还有一个学生的编号为5+13=18,故选D.
2.从2 007名学生中选取50名学生参加全国数学联赛,若采用以下方法选取:先用简单随机抽样法从2 007名学生中剔除7名学生,剩下的2 000名学生再按系统抽样的方法抽取,则每名学生入选的概率( )
A.不全相等
B.均不相等
C.都相等,且为
D.都相等,且为
解析:选C.从N个个体中抽取M个个体,则每个个体被抽到的概率都等于即.
分层抽样(高频考点)
[学生用书P187]
分层抽样是抽样方法考查的重点,也是高考命题的热点,多以选择题或填空题的形式出现,多为容易题或中档题.主要命题角度有:
(1)已知各层总数,确定某层的样本数;
(2)已知各层总数,某一层的样本数,求另一层样本数或总数;
(3)已知某层总数及某层的样本数,求各层样本数或总数.
[典例引领]
角度一 已知各层总数,确定某层的样本数
某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人.
【解析】 设A、B、C三所学校高三文科学生人数分别为x,y,z,由题知x,y,z成等差数列,所以x+z=2y,又x+y+z=1 500,所以y=500,用分层抽样方法抽取B校学生人数为×500=40.
【答案】 40
角度二 已知各层总数,某一层的样本数,求另一层样本数或总数
(2018·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=( )
A.54 B.90
C.45 D.126
【解析】 依题意得×n=18,解得n=90,
即样本容量为90.
【答案】 B
角度三 已知某层总数及某层的样本数,求各层样本数或总数
某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:
产品类别
A
B
C
产品数量(件)
1 300
样本容量(件)
130
由于不小心,表格中A、C产品的有关数据已被损坏,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是________.
【解析】 设样本的总容量为x,则×1 300=130,所以x=300.所以A产品和C产品在样本中共有300-130=170(件),设C产品的样本容量为y,则y+y+10=170,所以y=80,所以C产品的数量为×80=800.
【答案】 800
分层抽样问题类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.
(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.
[通关练习]
1.(2018·南昌第一次模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么n=( )
A.860 B.720
C.1 020 D.1 040
解析:选D.根据分层抽样方法,得×81=30,解得n=1 040.故选D.
2.(2017·高考江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________ 件.
解析:应从丙种型号的产品中抽取60×=18(件).
答案:18
3.(2018·贵州省七校联考)某高中共有学生1 000名,其中高一年级共有学生380人,高二年级男生有180人.如果在全校学生中抽取1名学生,抽到高二年级女生的概率为0.19,现采用分层抽样(按年级分层)在全校抽取100人,则应在高三年级中抽取的人数为________.
解析:因为某高中共有学生1 000名,在全校学生中抽取1名学生,抽到高二年级女生的概率为0.19,所以高二年级女生有1 000×0.19=190人,则高二年级共有学生180+190=370人,所以高三年级有1 000-370-380=250人,则采用分层抽样(按年级分层)在全校抽取100人,应在高三年级中抽取的人数为×100=25.
答案:25
三种抽样方法的特点
(1)三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性.若样本容量为n,总体容量为N,每个个体被抽到的概率是.
(2)系统抽样抽取的个体编号从小到大成等差数列.
(3)分层抽样适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.
解决抽样问题应关注三点
(1)简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样.
(2)系统抽样中,易忽视抽取的样本数也就是分段的段数,当不是整数时,注意剔除,剔除的个体是随机的.
(3)分层抽样中,易忽视每层抽取的个体的比例是相同的.
[学生用书P333(单独成册)]
1.(2018·西安八校联考)某班对八校联考成绩进行分析,利用随机数表法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体是( )
(注:下表为随机数表的第8行和第9行)
第8行
第9行
A.07 B.25
C.42 D.52
解析:选D.依题意得,依次选出的个体分别是12,34,29,56,07,52,…因此选出的第6个个体是52,选D.
2.为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A,B,C三所中学抽取60名教师进行调查,已知A,B,C三所学校中分别有180,270,90名教师,则从C学校中应抽取的人数为( )
A.10 B.12
C.18 D.24
解析:选A.根据分层抽样的特征,从C学校中应抽取的人数为×60=10.
3.(2018·福州综合质量检测)在检测一批相同规格共500 kg 航空用耐热垫片的品质时,随机抽取了280片,检测到有5片非优质品,则这批航空用耐热垫片中非优质品约为( )
A.2.8 kg B.8.9 kg
C.10 kg D.28 kg
解析:选B.由题意,可知抽到非优质品的概率为,所以这批航空用耐热垫片中非优质品约为500×≈8.9 kg,故选B.
4.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )
A.3 B.4
C.5 D.6
解析:选B.35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,
在区间[139,151]上共有20个数据,分在4个小组中,每组取一人,共取4人.
5.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为( )
A.7 B.9
C.10 D.15
解析:选C.由题意知应将960人分成32组,每组30人.设每组选出的人的号码为30k+9(k=0,1,…,31).由451≤30k+9≤750,解得≤k≤,又k∈N,故k=15,16,…,24,共10人.
6.(2018·贵阳检测)某高校有教授120人,副教授100人,讲师80人,助教60人,现用分层抽样的方法从以上所有老师中抽取一个容量为n的样本.已知从讲师中抽取的人数为16,那么n=________.
解析:依题意得,=,由此解得n=72.
答案:72
7.一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):
轿车A
轿车B
轿车C
舒适型
100
150
z
标准型
300
450
600
按类型用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆,则z的值为________.
解析:设该厂这个月共生产轿车n辆,
由题意得=,所以n=2 000,
则z=2 000-100-300-150-450-600=400.
答案:400
8.网络上流行一种“开心消消乐”游戏 ,为了了解本班学生对此游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号为:01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.
解析:由最小的两个编号为03,09可知,抽取人数的比例为,即抽取10名同学,
其编号构成首项为3,公差为6的等差数列,故最大编号为3+9×6=57.
答案:57
9.某初级中学共有学生2 000名,各年级男、女生人数如下表:
初一年级
初二年级
初三年级
女生
373
x
y
男生
377
370
z
已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.
(1)求x的值;
(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?
解:(1)因为=0.19,所以x=380.
(2)初三年级人数为y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为×500=12(名).
10.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.
解:总体容量为 6+12+18=36.
当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取的工程师人数为×6=,技术员人数为×12=,技工人数为×18=,
所以n应是6的倍数,36的约数,
即n=6,12,18.
当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为,因为必须是整数,所以n只能取6.即样本容量n=6.
1.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A营区,从301到495在B营区,从496到600在C营区,则三个营区被抽中的人数依次为( )
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
解析:选B.依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).令3+12(k-1)≤300,得k≤
,因此A营区被抽中的人数是25;令300<3+12(k-1)≤495,得