- 1.34 MB
- 2021-07-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
知识点
考纲下载
随机抽样
理解随机抽样的必要性和重要性.
会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.
用样本估计总体
了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
理解样本数据标准差的意义和作用,会计算数据标准差.
能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
变量的相关性
会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.
了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
统计案例
了解一些常见的统计方法,并能应用这些方法解决一些实际问题.了解回归分析的基本思想、方法及其简单应用.
了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
第1讲 随机抽样
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.
(2)常用方法:抽签法和随机数法.
2.系统抽样
(1)步骤:①先将总体的N个个体编号;
②根据样本容量n,当是整数时,取分段间隔k=;
③在第1段用简单随机抽样确定第一个个体编号l(l≤k);
④按照一定的规则抽取样本.
(2)适用范围:适用于总体中的个体数较多时.
3.分层抽样
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)适用范围:适用于总体由差异比较明显的几个部分组成时.
判断正误(正确的打“√”,错误的打“×”)
(1)简单随机抽样是一种不放回抽样.( )
(2)在抽签法中,先抽的人抽中的可能性大.( )
(3)系统抽样在起始部分抽样时采用简单随机抽样.( )
(4)用系统抽样从102个学生中抽取20人,需用简单随机抽样方法剔除2人,这样对被剔除者不公平.( )
(5)在分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )
答案:(1)√ (2)× (3)√ (4)× (5)×
从50份高三学生期中考试试卷中随机抽出15份进行教研分析,则下列说法正确的是( )
A.15名学生是样本 B.50名学生是总体
C.样本容量是15 D.样本容量是50
解析:选C.样本是抽取的15份试卷,总体容量是50,样本容量是15.
(教材习题改编)利用简单随机抽样从含有8个个体的总体中抽取一个容量为4的样本,则总体中每个个体被抽到的概率是( )
A. B.
C. D.
解析:选A.总体个数为N,样本容量为M,则每一个个体被抽到的概率为P===,故选A.
(2017·高考江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,
现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取______ 件.
解析:应从丙种型号的产品中抽取
60×=18(件).
答案:18
某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中抽取的数是39,则在第1小组1~16中随机抽取的数是________.
解析:间隔数k==16,即每16人抽取一个人.由于39=2×16+7,所以第1小组中抽取的数为7.
答案:7
简单随机抽样
[典例引领]
(2018·武汉市武昌区调研考试)已知某射击运动员每次射击击中目标的概率都为80%.现采用随机模拟的方法估计该运动员4次射击至少3次击中目标的概率:先由计算器产生0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标;再以每4个随机数为一组,代表4次射击的结果.经随机模拟产生了如下20组随机数:
7527 0293 7140 9857 0347 4373 8636 6947 1417 4698 0371 6233 2616 8045 6011 3661 9597 7424 7610 4281
据此估计,该射击运动员4次射击至少3次击中目标的概率为________.
【解析】 4次射击中有1次或2次击中目标的有:0371,6011,7610,1417,7140,所以所求概率P=1-==0.75.
【答案】 0.75
抽签法与随机数法的适用情况
(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
(2)一个抽样试验能否用抽签法,关键看两点:
一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
[通关练习]
1.下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的5 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
D.从某厂生产的5 000件产品中抽取10件进行质量检验
解析:选B.因为A,D中总体的个体数较大,不适合用抽签法;C中甲、乙两厂生产的产品质量可能差别较大,因此未达到搅拌均匀的条件,也不适合用抽签法;B中总体容量和样本容量都较小,且同厂生产的产品可视为搅拌均匀了.
2.大、中、小三个盒子中分别装有同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为________.
解析:因为三个盒子中装的是同一种产品,且按比例抽取每盒中抽取的不是整数,所以将三盒中的产品放在一起搅匀按简单随机抽样法抽样较为适合.
答案:简单随机抽样
系统抽样
[典例引领]
采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为( )
A.7 B.9
C.10 D.15
【解析】 从960人中用系统抽样方法抽取32人,则将整体分成32组,每组30人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为an=9+30·(n-1)=30n-21,由451≤30n-21≤750,得≤n≤,所以n=16,17,…,25,共有25-16+1=10(人).
【答案】 C
若本例中条件变为“若第5组抽到的号码为129”,求第1组抽到的号码.
解:设第1组抽到的号码为x,则第5组抽到的号码为x+(5-1)×30,由x+(5-1)×30=129,解得x=9,因此第1组抽到的号码为9.
系统抽样的特点
(1)适用于元素个数很多且均衡的总体.
(2)各个个体被抽到的机会均等.
(3)总体分组后,在起始部分抽样时采用的是简单随机抽样.
(4)如果总体容量N能被样本容量n整除,则抽样间隔为k=.
[提醒] 如果总体容量N不能被样本容量n整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样.
[通关练习]
1.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( )
A.13 B.19
C.20 D.51
解析:选C.由系统抽样的原理知抽样的间隔为=13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,从而可知选C.
2.某单位有840名职工,现采用系统抽样的方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12
C.13 D.14
解析:选B.由题意得,抽样间隔为=20.所以在区间[481,720]抽取=12(人).
分层抽样
[典例引领]
(1)某报社做了一次关于“什么是新时代的雷锋精神”的问卷调查,在A,B,C,D四个单位回收的问卷数依次成等差数列,且共回收1 000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B单位抽取30份,则在D单位抽取的问卷数是( )
A.40 B.50
C.60 D.70
(2)一支田径队有男运动员56人,女运动员m人,用分层抽样抽出一个容量为n的样本,在这个样本中随机取一个当队长的概率为,且样本中的男队员比女队员多4人,则m=________.
【解析】 (1)由题意依次设在A,B,C,D四个单位回收的问卷数分别为a1,a2,a3,a4,在D单位抽取的问卷数为n,则有=,解得a2=200,又a1+a2+a3+a4=1 000,即3
a2+a4=1 000,所以a4=400,所以=,解得n=60.
(2)由题意知n=28,设其中有男队员x人,女队员有y人.
则解得x=16,y=12,m=42.
【答案】 (1)C (2)42
分层抽样问题类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.
(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”.
[提醒] 分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ni=n·(i=1,2,…,k)个个体(其中i是层数,n是抽取的样本容量,Ni是第i层中个体的个数,N是总体容量).
某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:
产品类别
A
B
C
产品数量(件)
1 300
样本容量(件)
130
由于不小心,表格中A、C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是________.
解析:设样本容量为x,则×1 300=130,所以x=300.所以A产品和C产品在样本中共有300-130=170(件).设C产品的样本容量为y,则y+y+10=170,所以y=80.所以C产品的数量为×80=800.
答案:800
分层抽样应注意以下两点
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.
三种抽样比较
类别
共同点
各自特点
联系
适用范围
简单随机抽样
①抽样过程中每个个体被抽到的可能性相等
②每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
系统抽样
将总体均分成几部分,按预先定出的规则在各部分中抽取
在起始部分取样时,采用简单随机抽样
总体个数较多
分层抽样
将总体分成几层,分层进行抽取
各层抽样时,采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
1.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )
A.p1=p2<p3 B.p2=p3<p1
C.p1=p3<p2 D.p1=p2=p3
解析:选D.由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.
2.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.93 B.123
C.137 D.167
解析:选C.初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C.
3.现用系统抽样方法从已编号(1~60)的60枚新型导弹中,随机抽取6枚进行试验,则所选取的6枚导弹的编号可能是( )
A.5,10,15,20,25,30 B.2,4,8,16,32,48
C.5,15,25,35,45,55 D.1,12,34,47,51,60
解析:选C.从60枚新型导弹中随机抽取6枚,采用系统抽样间隔应为=10,只有C选项中导弹的编号间隔为10.
4.某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座号是( )
49 54 43 54 82 17 37 93 23 78 87 35
20 96 43 84 26 34 91 64 57 24 55 06
88 77 04 74 47 67 21 76 33 50 25 83
92 12 06
A.23 B.09
C.02 D.16
解析:选D.从随机数表第一行的第6列数字3开始,由左到右依次选取两个数字,不超过34的依次为21,32,09,16,17,故第4个志愿者的座号为16.
5.某工厂的一、二、三车间在2017年11月份共生产了3 600双皮靴,在出厂前检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a、b、c,且a、b、c成等差数列,则二车间生产的产品数为( )
A.800 B.1 000
C.1 200 D.1 500
解析:选C.因为a、b、c成等差数列,所以2b=a+c,所以从二车间抽取的产品数占抽取产品总数的,根据分层抽样的性质可知,二车间生产的产品数占产品总数的,所以二车间生产的产品数为3 600×=1 200.故选C.
6.(2018·贵阳市检测)某高校有教授120人,副教授100人,讲师80人,助教60人,现用分层抽样的方法从以上所有老师中抽取一个容量为n的样本.已知从讲师中抽取的人数为16,那么n=________.
解析:依题意得,=,由此解得n=72.
答案:72
7.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为________.
解析:在系统抽样中,确定分段间隔k,对编号进行分段,k=(N为总体的容量,n为样本的容量),所以k===40.
答案:40
8.一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):
轿车A
轿车B
轿车C
舒适型
100
150
z
标准型
300
450
600
按类型用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆,则z的值为________.
解析:设该厂这个月共生产轿车n辆,
由题意得=,所以n=2 000,
则z=2 000-100-300-150-450-600=400.
答案:400
9.某初级中学共有学生2 000名,各年级男、女生人数如下表:
初一年级
初二年级
初三年级
女生
373
x
y
男生
377
370
z
已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.
(1)求x的值;
(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?
解:(1)因为=0.19,所以x=380.
(2)初三年级人数为y+z=2 000-(373+377+380+370)=500,
现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为×500=12(名).
10.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:
学历
35岁以下
35~50岁
50岁以上
本科
80
30
20
研究生
x
20
y
(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;
(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取1人,此人的年龄为50岁以上的概率为,求x,y的值.
解:(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,设抽取学历为本科的人数为m,所以=,解得m=3.
抽取的样本中有研究生2人,本科生3人,分别记作S1,S2;B1,B2,B3.
从中任取2人的所有等可能基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3).
其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2).
所以从中任取2人,至少有1人学历为研究生的概率为.
(2)由题意,得=,解得N=78.
所以35~50岁中被抽取的人数为78-48-10=20,
所以==,
解得x=40,y=5.
即x,y的值分别为40,5.
1.某学校有体育特长生25人,美术特长生35人,音乐特长生40人.用分层抽样的方法从中抽取40人,则抽取的体育特长生、美术特长生、音乐特长生的人数分别为( )
A.8,14,18 B.9,13,18
C.10,14,16 D.9,14,17
解析:选C.因为25+35+40=100,
用分层抽样的方法从中抽取40人,
所以每个个体被抽到的概率是P===0.4,
所以体育特长生25人应抽25×0.4=10(人),
美术特长生35人应抽35×0.4=14(人),
音乐特长生40人应抽40×0.4=16(人).
2.(2018·广东肇庆模拟)一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m,那么在第k组中抽取的号码的个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是( )
A.63 B.64
C.65 D.66
解析:选A.由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中数字编号依次为60,61,62,63,…,69,故在第7组中抽取的号码是63.故选A.
3.北京某校三个年级共有18个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到18,现用系统抽样方法,抽取6个班进行调查.若抽到的编号之和为57,则抽到的最小编号为________.
解析:系统抽样的间隔为=3.
设抽到最小编号为x,
则x+(3+x)+(6+x)+(9+x)+(12+x)+(15+x)=57.解得x=2.
答案:2
4.某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山比赛活动.每人都参与而且只参与其中一项比赛,各年级参与比赛的人数情况如下表:
高一年级
高二年级
高三年级
跑步
a
b
c
登山
x
y
z
其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取________人.
解析:根据题意可知样本中参与跑步的人数为200×=120,所以从高二年级参与跑步的学生中应抽取的人数为120×=36.
答案:36
5.为了解某市市民晚饭后1小时内的生活方式,调查小组设计了“阅读”“锻炼”“看电视”和“其他”四个选项,用随机抽样的方法调查了该市部分市民,并根据调查结果绘制成统计图如图所示.
根据统计图所提供的信息,解答下列问题:
(1)本次共调查了________名市民;
(2)补全条形统计图;
(3)该市共有480万市民,估计该市市民晚饭后1小时内“锻炼”的人数.
解:(1)本次共调查的市民人数为800÷40%=2 000.故填2 000.
(2)晚饭后选择“其他”的人数为2 000×28%=560,晚饭后选择“锻炼”的人数为2 000-800-240-560=400.
将条形统计图补充完整,如图所示.
(3)晚饭后选择“锻炼”的人数所占的比例为:400÷2 000=20%,该市市民晚饭后1小时内锻炼的人数为:480×20%=96(万).
6.据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改”引起广泛关注.为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3 600人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:
态度调查人群
应该取消
应该保留
无所谓
在校学生
2 100人
120人
y人
社会人士
600人
x人
z人
已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05.
(1)现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?
(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,
再平均分成两组进行深入交流.求第一组中在校学生人数ξ的分布列和数学期望.
解:(1)因为抽到持“应该保留”态度的人的概率为0.05,
所以=0.05,解得x=60.
所以持“无所谓”态度的人数共有3 600-2 100-120-600-60=720,
所以应在持“无所谓”态度的人中抽取720×=72人.
(2)由(1)知持“应该保留”态度的一共有180人,
所以在所抽取的6人中,在校学生为×6=4人,社会人士为×6=2人,于是第一组在校学生人数ξ=1,2,3,
P(ξ=1)==,P(ξ=2)==,P(ξ=3)==,
ξ的分布列为
ξ
1
2
3
P
所以E(ξ)=1×+2×+3×=2.