- 853.50 KB
- 2021-06-11 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
知识点
考纲下载
随机抽样
1.理解随机抽样的必要性和重要性.
2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.
用样本估计总体
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
变量的相关性
1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
统计案例
1.了解一些常见的统计方法,并能应用这些方法解决一些实际问题.了解回归分析的基本思想、方法及其简单应用.
2.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
第1讲 随机抽样
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.
(2)常用方法:抽签法和随机数法.
2.系统抽样
(1)步骤:①先将总体的N个个体编号;
②根据样本容量n,当是整数时,取分段间隔k=;
③在第1段用简单随机抽样确定第一个个体编号l(l≤k);
④按照一定的规则抽取样本.
(2)适用范围:适用于总体中的个体数较多时.
3.分层抽样
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)适用范围:适用于总体由差异比较明显的几个部分组成时.
1.辨明两个易误点
(1)简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等.
(2)分层抽样中,易忽视每层抽取的个体的比例是相同的,即.
2.三种抽样方法的比较
类别
各自特点
相互联系
适用范围
共同点
简单随
机抽样
从总体中
逐个抽取
最基本的
抽样方法
总体中
的个体
数较少
抽样过
程中每
个个体
被抽到
的可能
性相等
系统
抽样
将总体平均分成几部分,按事先确定的规则分别在各部分中抽取
在起始部
分抽样时,
总体中
的个体
采用简单
随机抽样
数较多
分层
抽样
将总体分成几层,按各层个体数之比抽取
各层抽样
时采用简
单随机抽
样或系统
抽样
总体由差
异明显的
几部分
组成
1.(2015·高考四川卷)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )
A.抽签法 B.系统抽样法
C.分层抽样法 D.随机数法
C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.
2.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )
A.50 B.40
C.25 D.20
C 根据系统抽样的特点可知分段间隔为=25,故选C.
3.某地区高中分三类,A类学校共有学生2 000人,B类学校共有学生3 000人,C类学校共有学生4 000人,若采取分层抽样的方法抽取900人,则A类学校中的学生甲被抽到的概率为( )
A. B.
C. D.
A 利用分层抽样,每个学生被抽到的概率是相同的,故所求的概率为=.
4.假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,
现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________.(下面摘取了随机数表第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
068
简单随机抽样
下面的抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
【解析】 A、B是系统抽样,因为抽取的个体间的间隔是固定的;C是分层抽样,因为总体的个体有明显的层次;D是简单随机抽样.
【答案】 D
抽签法与随机数法的适用情况
(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
(2)一个抽样试验能否用抽签法,关键看两点:
一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
1.下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的5 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
D.从某厂生产的5 000件产品中抽取10件进行质量检验
B 因为A,D中总体的个体数较大,不适合用抽签法;C中甲、乙两厂生产的产品质量可能差别较大,因此未达到搅拌均匀的条件,也不适合用抽签法;B中总体容量和样本容量都较小,且同厂生产的产品可视为搅拌均匀了.
2.(2017·江西新余第一中学期末)某班对八校联考成绩进行分析,利用随机数表法抽取容量为7的样本时,先将70个同学按01,02,03,…,70进行编号,然后从随机数表第9行第9列的数开始向右读,则选出的第7个个体的编号是( )
(注:下面为随机数表的第8行和第9行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
A.07 B.44
C.15 D.51
B 从第9行第9列的数开始,按2位数向右读,大于70和重复的去掉.选出的数依次为29,64,56,07,52,42,44,故第7个个体的编号是44.故选B.
系统抽样
采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间的人做问卷A,编号落入区间的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为( )
A.7 B.9
C.10 D.15
【解析】 从960人中用系统抽样方法抽取32人,则将整体分成32组,每组30人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为an=9+30·(n-1)=30n-21,由451≤30n-21≤750,得≤n≤,所以n=16,17,…,25,
共有25-16+1=10(人).
【答案】 C
若本例中条件变为“若第5组抽到的号码为129”,求第1组抽到的号码.
设第1组抽到的号码为x,则第5组抽到的号码为x+(5-1)×30,由x+(5-1)×30=129,解得x=9,因此第1组抽到的号码为9.
系统抽样的特点
(1)适用于元素个数很多且均衡的总体.
(2)各个个体被抽到的机会均等.
(3)总体分组后,在起始部分抽样时采用的是简单随机抽样.
(4)如果总体容量N能被样本容量n整除,则抽样间隔为k=.
1.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( )
A.13 B.19
C.20 D.51
C 由系统抽样的原理知抽样的间隔为=13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,从而可知选C.
2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间上的运动员人数是________.
35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间上共有20个数据,分在4个小组中,每组取一人,共取4人.
4
分层抽样
(1)(2017·安徽“江南十校”联考)2016年1月1日我国全面二孩政策实施后,某中学的一个学生社团组织了一项关于生育二孩意愿的调查活动.已知该中学所在的城镇符合二孩政策的已婚女性中,30岁以下的约2 400人,30岁至40岁的约3 600人,40岁以上的约6 000人.为了解不同年龄层的女性对生育二孩的意愿是否存在显著差异,该社团用分层抽样的方法从中抽取了一个容量为N的样本进行调查,已知从30岁至40岁的女性中抽取的人数为60,则N=________.
(2)一支田径队有男运动员56人,女运动员m人,用分层抽样抽出一个容量为n的样本,在这个样本中随机取一个当队长的概率为,且样本中的男队员比女队员多4人,则m=________.
【解析】 (1)由题意可得 =,故N=200.
(2)由题意知n=28,设其中有男队员x人,女队员有y人.
则解得x=16,y=12,m=42.
【答案】 (1)200 (2)42
分层抽样问题的解题策略
(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.
(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本数(或总体数).
(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.
某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:
产品类别
A
B
C
产品数量(件)
1 300
样本容量(件)
130
由于不小心,表格中A、C产品的有关数据已被污染看不清楚,统计员记得A
产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是________.
设样本容量为x,则×1 300=130,所以x=300.所以A产品和C产品在样本中共有300-130=170(件).设C产品的样本容量为y,则y+y+10=170,所以y=80.所以C产品的数量为×80=800(件).
800
1.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )
A.p1=p2<p3 B.p2=p3<p1
C.p1=p3<p2 D.p1=p2=p3
D 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.
2.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为( )
A. B.
C . D.
C 根据题意,=,解得n=28.故每个个体被抽到的概率为=.
3.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号是( )
A.10 B.11
C.12 D.16
D 因为29号、42号的号码差为13,所以3+13=16,即另外一个同学的学号是16.
4.某校高一、高二、高三学生共有1 290人,其中高一480人,高二比高三多30人,为了解该校学生健康状况,现采用分层抽样方法进行调查,在抽取的样本中有高一学生96人,则该样本中的高三学生人数为( )
A.84 B.78
C.81 D.96
B 因为高一480人,高二比高三多30人,所以设高三有x人,则x+x+30+480=1 290,解得x=390,故高二420人,高三390人,若在抽取的样本中有高一学生96人,则该样本中的高三学生人数为×390=78人.
5.(2017·广东肇庆三模)一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m,那么在第k组中抽取的号码的个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是( )
A.63 B.64
C.65 D.66
A 由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中数字编号依次为60,61,62,63,…,69,故在第7组中抽取的号码是63.故选A.
6.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A营区,从301到495在B营区,从496到600在C营区,则三个营区被抽中的人数依次为( )
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
B 依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).令3+12(k-1)≤300,得k≤,因此A营区被抽中的人数是25;令300<3+12(k-1)≤495,得