- 370.50 KB
- 2021-06-24 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
专题10.2 统计与统计案例
【最新考纲解读】
内 容
要 求
备注
A
B
C
统计
抽样方法
√
对知识的考查要求依次分为了解、理解、掌握三个层次(在表中分别用A、B、C表示).
了解:要求对所列知识的含义有最基本的认识,并能解决相关的简单问题.
理解:要求对所列知识有较深刻的认识,并能解决有一定综合性的问题.
掌握:要求系统地掌握知识的内在联系,并能解决综合性较强的或较为困难的问题.
总体分布的估计
√
总体特征数的估计
√
【考点深度剖析】
1. 统计均是以填空题的形式进行考查,题目多为中低档题,着重考查学生运算求解能力、数据处理及分析问题解决问题的能力.统计一般不与其它章节知识结合考查,常单独设置题目.
2.统计是高考中的常考题,统计考查的难度中等偏简单,复习时应以基础题为主.复习中,要在全面掌握的基础上理解相关概念,如分层抽样、频率分布直方图、方差等.要务实统计的基础知识,熟悉统计问题的基本解法,从而提高应用统计知识去分析问题和解决问题的能力.
【课前检测训练】
【判一判】
判断下面结论是否正确(请在括号中打“√”或“×”)
(1)简单随机抽样是一种不放回抽样.( )
(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( )
(3)系统抽样在起始部分抽样时采用简单随机抽样.( )
(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( )
(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )
(6)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(7)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )
(8)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )
(9)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
(10)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( )
(11)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( )
1. √2. ×3. √4.×5. ×6. √7. ×8. √9. ×10. √11. ×
【练一练】
1.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )
A.33人,34人,33人 B.25人,56人,19人
C.20人,40人,30人 D.30人,50人,20人
【答案】B
2.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )
A.抽签法 B.系统抽样法
C.分层抽样法 D.随机数法
【答案】C
【解析】根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.
3.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为( )
A.700 B.669 C.695 D.676
【答案】C
4.某公司共有1 000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________.
【答案】50
【解析】=,x=50.
5.某大学为了了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.
【答案】60
【解析】根据题意,应从一年级本科生中抽取的人数为×300=60.
6.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.93 B.123 C.137 D.167
【答案】C
【解析】由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.故选C.
7.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
【答案】A
【解析】∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为×(91+92)=91.5.
平均数为×(87+89+90+91+92+93+94+96)
=91.5.
8.一个容量为66的样本,数据的分组及各组的频数如下:
[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3
根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是( )
A. B.
C. D.
【答案】B
【解析】由已知,样本容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故所求概率为=.
9.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.
【答案】19,13
10.甲、乙两人在相同条件下各射靶10次,每次命中环数如下:
甲 4 7 10 9 5 6 8 6 8 8
乙 7 8 6 8 6 7 8 7 5 9
试问10次射靶的情况较稳定的是________.
【答案】乙
【题根精选精析】
考点1 简单随机抽样
【1-1】下列抽取样本的方式不属于简单随机抽样的有________.
①从无限多个个体中抽取100个个体作为样本.
②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
③从20件玩具中一次性抽取3件进行质量检验.
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
【答案】①②③④
【1-2】总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为 .
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
【答案】01
【解析】从左到右第1行的第5列和第6列数字是65,依次选取符合条件的数字分别是08,02,14,07,01,故选出来的第5个个体的编号为01.
【基础知识】
1.简单随机抽样定义:设一个总体含有N个个体,从中逐个不放回抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.简单随机抽样方法:抽签法和随机数法.
3.简单随机抽样的特点:(1)被抽取样本的总体个数N是有限的;(2)样本是从总体中逐个抽取的;(3)是一种不放回抽样;(4)是等可能抽取.
【思想方法】
当总体个数较少时,应用此法简便可行;当总体个数较多时,采用其它抽样方法.
【温馨提醒】简单随机抽样是等概率抽样,即抽样过程中,每个个体被抽到的概率相等.若样本容量是,总体个数是,则用这种方法抽样时,每个个体被抽到的概率都是
考点2 系统抽样
【2-1】为了了解名学生的学习情况,采用系统抽样的方法,从中抽取容量为的样本,则分段的间隔为 .
【答案】
【解析】由题意知,分段间隔为,故选C.
【2-2】某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,……,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为________的学生.
【答案】37
【解析】易知组距为5,因为在第三组中抽得号码为12,所以在第八组中抽得号码为12+(8-3)×5=37.
【基础知识】
1. 系统抽样
系统抽样是指当总体中个数较多时,将总体分成均衡的几部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本的抽样方法.
2.假设要从容量为N的总体中抽取容量为n的样本,系统抽样的步骤为:
(1)采用随机的方式将总体中的N个个体编号;
(2)将编号按间隔k分段,当是整数时,取k=;当不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N′能被n整除,这时取k=,并将剩下的总体重新编号;
(3)在第一段中用简单随机抽样确定起始的个体编号l;
(4)按照一定的规则抽取样本,通常将编号为l,l+k,l+2k,…,l+(n-1)k的个体抽出.
【思想方法】
系统抽样:将总体编号按间隔k分段,若在第一段中用简单随机抽样确定起始的个体编号l,那么抽取样本的编号为l,l+k,l+2k,…,l+(n-1)k.
【温馨提醒】(1)系统抽样中各段入样的个体编号成等差数列,公差即分段间隔;(2)系统抽样的最大特点是“等距”,利用此特点可以很方便地判断一种抽样方法是否是系统抽样.
考点3 分层抽样
【2-1】【2015高考数学一轮配套特训】某工厂生产A,B,C三种不同型号的产品,产品的数量之比依次为3∶4∶7,现用分层抽样的方法抽出容量为n的样本,样本中A型产品有15件,那么样本容量n为 .
【答案】70
【解析】,解得.
【3-2】【2014苏州模拟】某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40
名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为 .
【答案】8
【基础知识】
1. 分层抽样
在抽样时,当总体由有明显差别的几部分组成时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
2.三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
均为不放回抽样,且抽样过程中每个个体被抽取的机会相等
从总体中逐个抽取
总体中的个体数较少
系统
抽样
将总体均分成几部分,按事先确定的规则在各部分抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层
抽样
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
【思想方法】
在分层抽样中,各层都要按相同的比例抽取样本,这一比例即为抽样比=
考点4 频率分布直方图
【4-1】某市某年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)作出频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
【答案】见解析.
【解析】(1)频率分布表:
(2)频率分布直方图:
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数共有28天,占当月天数的,说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%.说明该市空气质量有待进一步改善.
【4-2】【2014扬州一模】某校从参加高二年级学业水平测试的学生中抽出100名学生,其数学成绩的频率分布直方图如图所示.其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].则成绩在[80,100]上的人数为_______.
【答案】30
【解析】由题知成绩在[80,100]的人数为(0.025×10+0.005×10)×100=30.
【基础知识】
1.频率分布直方图
(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的特征数估计总体的特征数.
(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图
连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.
(2)总体密度曲线
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.统计中称之为总体分布的密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.
【思想方法】
1. 频率分布条形图的纵轴(矩形的高)表示频率;频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其各小组的频率等于该小组上的矩形的面积.
2. 作频率分布直方图的步骤:
【温馨提醒】.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
.考点5 茎叶图
【5-1】某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412, 414,415,421,423,423,427,430,430,434,443,445,445,451,454
品种B:363,371,374,383,385,386,391,392,394,394,395, 397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)作出茎叶图;
(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
【答案】(1)见解析;(2)品种A的亩产稳定性较差.
【解析】(1)
【5-2】某中学高三年级从甲、乙两个班级各选出8名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的平均分是86,乙班学生成绩的中位数是83,则的值为_______.
【答案】13
【解析】观察茎叶图,甲班学生成绩的平均分是,故,乙班学生成绩的中位数是,故,∴.
【基础知识】
茎叶图:
定义
是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数
画法
对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.
对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎
优缺点
用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图中得到;(2)便于记录和读取,能够展示数据的分布情况.缺点是:当样本数据较多或数据位数较多时,茎叶图就显得不太方便
【思想方法】
1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.
2.茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.
3.当样本数据较少时,用茎叶图表示数据的效果较好,而样本数据较多时,则不方便记录
【温馨提醒】
1.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
2.由茎叶图由小到大排列可以找到中间一个数或中间两个数,由此得到中位数,由其数据可以得到众数.
3.由数据集中情况可以估计平均数大小,再根据其分散程度可以估测方差大小.
考点6 用样本的数字特征估计总体的数字特征
【6-1】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是_______.
【答案】46,45,56
【6-2】【2014年全国普通高等学校招生统一考试(新课标Ⅰ)文科】.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
频数
6
26
38
22
8
(I)在答题卡上作出这些数据的频率分布直方图:
(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
【答案】(1)
(2)质量指标值的样本平均数为100,质量指标值的样本方差为104
(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
【解析】
(1)
,
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
【基础知识】
1.用样本的特征数估计总体的特征数
(1)众数、中位数、平均数
众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
平均数:样本数据的算术平均数,即.
在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(2)样本方差、标准差
样本方差
标准差.
其中xn是样本数据的第n项,n是样本容量,是平均数.
2.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
【思想方法】
1. 在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.
2.
平均数与方差都是重要的特征数,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,掌握公式不难求出,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
【温馨提示】
数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.
【易错问题大揭秘】
[失误与防范]
1.进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.
2.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
3.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
4.若取值x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均值为x1p1+x2p2+…+xnpn;若x1,x2,…,xn的平均数为,方差为s2,则ax1+b,ax2+b,…,axn+b的平均数为a+b,方差为a2s2.