- 95.50 KB
- 2021-05-14 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第十三章 统计案例
高考导航
考试要求
重难点击
命题展望
1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.
2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、茎叶图,理解它们各自的特点,理解样本数据标准差的意义和作用,会计算数据标准差,能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
3.会作两个有关联变量的散点图,会利用散点图认识变量间的相关关系,了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解回归的基本思想、方法及其简单应用.
4.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
本章重点:1.三种抽样方法的区别、联系及操作步骤.2.样本频率分布直方图和茎叶图.3.用样本估计总体的思想.
本章难点:回归直线方程与独立性检验.
统计多数以选择题和填空题形式考查,大题只在个别省的考题中出现过.难度属于基础题和中档题.考点往往集中体现在抽样方法、频率分布图表这两个方面.另外,应注意统计题反映出来的综合性与应用性,如与数列、概率等的综合,用统计方法提供决策、制定方案等,以此考查学生搜集处理信息及分析解决问题的能力.
知识网络
13.1 抽样方法与用样本估计总体
典例精析
题型一 抽样方法
【例1】某校有教师200人,男学生1 200人,女学生1 000人,用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知女学生抽取的人数为80人,则n的值为 .
【解析】根据分层抽样的意义,
=,解得n=192.
【点拨】现实中正确的分层抽样一般有三个步骤:首先,辨明突出的统计特征和分类.其次,确定每个分层在总体上的比例.利用这个比例,可计算出样本中每组(层)应抽取的人数.最后,必须从每层中抽取独立简单随机样本.
【变式训练1】从某厂生产的802辆轿车中随机抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.
【解析】第一步,将802辆轿车用随机方式编号.
第二步,从总体中剔除2辆(剔除方法可用随机数表法),将剩余的800辆轿车重新编号(分别为001,002,003,…,800),并分成80段.
第三步,在第一段001,002,…,010这十个编号中用简单随机抽样抽出一个(如005)作为起始号码.
第四步,将编号为005,015,025,…,795的个体抽出,组成样本.
题型二 频率分布直方图
【例2】(2010湖南)如图是某城市通过抽样得到的居民某年的月均用水量(单位:吨)的频率分布直方图.
(1)求直方图中x的值;
(2)若将频率视为概率,从这个城市随机抽取3位居民(看作有放回的抽样),求月均用水量在3至4吨的居民数X的分布列和数学期望.
【解析】(1)依题意及频率分布直方图知0.02+0.1+x+0.37+0.39=1,解得x=0.12.
(2)由题意知X~B(3,0.1),因此
P(X=0)=C×0.93=0.729,
P(X=1)=C×0.1×0.92=0.243,
P(X=2)=C×0.12×0.9=0.027,
P(X=3)=C×0.13=0.001,
故随机变量X的分布列为
X
0
1
2
3
P
0.729
0.243
0.027
0.001
X的数学期望为E(X)=3×0.1=0.3.
(或E(X)=1×0.243+2×0.027+3×0.001=0.3)
【点拨】从频率分布直方图读取数据时,要特别重视组距,纵坐标是频率除以组距,故长方形的面积之和为1.
【变式训练2】如图是容量为100的样本的频率分布直方图,试根据数据填空:
(1)样本数据落在[10,14)内的频数为 ;
(2)样本数据落在[6,10)内的频率为 ;
(3)总体落在[2,6)内的频率为 .
【解析】(1)样本落在[10,14)内的频数为0.09×4×100=36.
(2)样本落在[6,10)内的频率为0.08×4=0.32.
(3)样本落在[2,6)内的频率为0.02×4=0.08,所以总体落在[2,6)内的频率约为0.08.
题型三 平均数、方差的计算
【例3】甲、乙两人在相同条件下各射靶10次,每次命中环数如下:
甲 4 7 10 9 5 6 8 6 8 8
乙 7 8 6 8 6 7 8 7 5 9
试问谁10次射靶的情况较稳定?
【解析】本题要计算两样本的方差,当样本平均数不是整数,且样本数据不大时,可用简化公式计算方差.
=(4+7+…+8)=7.1,
=(7+8+…+9)=7.1,
s=(42+72+…+82-10×7.12)=3.09,
s=(72+82+…+92-10×7.12)=1.29,
因为s>s,所以乙10次射靶比甲10次射靶情况稳定.
【点拨】平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据的离散程度就越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
【变式训练3】(2010北京市东城区)在一次数学统考后,某班随机抽取10名同学的成绩进行样本分析,获得成绩数据的茎叶图如右图.
(1)计算此样本的平均成绩及方差;
(2)现从此样本中随机抽出2名学生的成绩,设抽出分数为90分以上的人数为X,求随机变量X的分布列和均值.
【解析】(1)样本的平均成绩=80;
方差为s2=[(92-80)2+(98-80)2+(98-80)2+(85-80)2+(85-80)2+(74-80)2+(74-80)2+(74-80)2+(60-80)2+(60-80)2]=175.
(2)由题意,随机变量X=0,1,2.
P(X=0)==,P(X=1)==,P(X=2)=.
随机变量X的分布列为
X
0
1
2
P
E(X)=0×+1×+2×=.
总结提高
1.统计的基本思想是用样本估计总体.这就要求样本具有很好的代表性,而样本良好客观的代表性,则完全依赖抽样方法.
2.三种抽样方法中简单随机抽样是最基本的抽样方法,是其他两种方法的基础,它们的共同点都是等概率抽样.适用范围不同,要根据总体的具体情况选用不同的方法.
3.对于总体分布,总是用样本的频率分布对它进行估计.
4.用样本估计总体,一般分成以下几个步骤:
先求样本数据中的最大值和最小值(称为极值),再确定合适的组数和组距,确定分点(每个分点只属于一组,故一般采用半开半闭区间),然后列出频率分布表(准确,查数据容易),画频率分布直方图.
13.2 两变量间的相关性、回归分析和独立性检验
典例精析
题型一 求回归直线方程
【例1】下表是关于某设备的使用年限(年)和所需要的维修费用(万元)的几组统计数据:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
(1)若y对x呈线性相关关系,求出y关于x的线性回归方程y=x+;
(2)估计使用年限为10年时,维修费用为多少?
【解析】(1)因为xiyi=112.3,x=4+9+16+25+36=90,且=4,=5,n=5,
所以===1.23,=5-1.23×4=0.08,
所以回归直线方程为y=1.23x+0.08.
(2)当x=10时,y=1.23×10+0.08=12.38,
所以估计当使用10年时,维修费用约为12.38万元.
【点拨】当x与y呈线性相关关系时,可直接求出回归直线方程,再利用回归直线方程进行计算和预测.
【变式训练1】某工厂经过技术改造后,生产某种产品的产量(吨)与相应的生产能耗(吨标准煤)有如下几组样本数据.
x
3
4
5
6
y
2.5
3
4
4.5
据相关性检验,y与x具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7,那么y关于x的回归直线方程是 .
【解析】先求得=4.5,=3.5,由=0.7x+a过点(,),则a=0.35,所以回归直线方程是=0.7x+0.35.
题型二 独立性检验
【例2】研究小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示:
种子灭菌
种子未灭菌
合计
黑穗病
26
184
210
无黑穗病
50
200
250
合计
76
384
460
试按照原试验目的作统计分析推断.
【解析】由列联表得:
a=26,b=184,c=50,d=200,a+b=210,c+d=250,a+c=76,b+d=384,n=460.
所以K2==≈4.804,
由于K2≈4.804>3.841,
所以有95%的把握认为种子灭菌与否与小麦发生黑穗病是有关系的.
【变式训练2】(2010东北三省三校模拟)某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,可以有 %的把握认为该学校15至16周岁的男生的身高和体重之间有关系.
超重
不超重
合计
偏高
4
1
5
不偏高
3
12
15
合计
7
13
20
附:独立性检验临界值表
P(K2≥k0)
0.025
0.010
0.005
0.001
k0
5.024
6.635
7.879
10.828
(独立性检验随机变量K2值的计算公式:K2=)
【解析】由表可得a+b=5,c+d=15,a+c=7,b+d=13,ad=48,bc=3,n=20,运用独立性检验随机变量K2值的计算公式得K2==≈5.934,
由于K2≈5.934>5.024,所以有97.5%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.
总结提高
1.在研究两个变量之间是否存在某种关系时,必须从散点图入手.
2.样本的随机性导致由线性回归方程所作出的预报也具有随机性.