- 626.50 KB
- 2021-05-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
专题11.2 统计与统计案例
【三年高考】
1. 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 ▲ 件.
【答案】18
【解析】应从丙种型号的产品中抽取件,故答案为18.
【考点】分层抽样
【名师点睛】在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N.
2.【2016江苏】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 .
【答案】0.1
【考点】方差
【名师点睛】本题考查的是总体特征数的估计,重点考查了方差的计算,本题有一定的计算量,属于简单题.认真梳理统计学的基础理论,特别是系统抽样和分层抽样、频率分布直方图、方差等,针对训练近几年的江苏高考类似考题,直观了解本考点的考查方式,强化相关计算能力.
3.【2015江苏高考,2】已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.
【答案】6
【解析】
【考点定位】平均数
4. 【2017课标3,理3】
某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳
【答案】A
【解析】
【考点】 折线图
【名师点睛】将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.
5. 【2017山东,理5】为了研究某班学生的脚长(单位:厘米)和身高(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为.已知,,.该班某学生的脚长为24,据此估计其身高为
(A) (B) (C) (D)
【答案】C
【解析】试题分析:由已知 ,选C.
【考点】线性相关与线性回归方程的求法与应用.
【名师点睛】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.
6. 【2017课标1,文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
【答案】B
【解析】
试题分析:刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B
【考点】样本特征数
【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;
中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;
平均数:反应一组数据的平均水平;
方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
7. 【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为
A. 3,5 B. 5,5 C. 3,7 D. 5,7
【答案】A
【解析】
【考点】茎叶图、样本的数字特征
【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐. 利用茎叶图对样本进行估计是,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.
8.【2016高考新课标3理数改编】某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中点表示十月的平均最高气温约为,点表示四月的平均最低气温约为.下面叙述不正确的是 .
①各月的平均最低气温都在以上 ②七月的平均温差比一月的平均温差大
③三月和十一月的平均最高气温基本相同 ④平均气温高于的月份有5个
【答案】④
【解析】
试题分析:由图可知均在虚线框内,所以各月的平均最低气温都在0℃以上,①
正确;由图可在七月的平均温差大于,而一月的平均温差小于,所以七月的平均温差比一月的平均温差大,②正确;由图可知三月和十一月的平均最高气温都大约在,基本相同,③正确;由图可知平均最高气温高于20℃的月份有3个或2个,所以④不正确.
考点:1、平均数;2、统计图.
【易错警示】解答本题时易错可能有两种:(1)对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;(2)估计平均温差时易出现错误,错选②.
9.【2016高考上海理数】某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77则这组数据的中位数是_________(米).
【答案】1.76
【解析】试题分析:
将这6位同学的身高按照从矮到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中位数是1.75与1.77的平均数,显然为1.76.
考点:中位数的概念.
【名师点睛】本题主要考查中位数的概念,是一道基础题目.从历年高考题目看,涉及统计的题目,往往不难,主要考查考生的视图、用图能力,以及应用数学解决实际问题的能力.
10.2016高考北京文数】某网店统计了连续三天售出商品的种类情况:第一天售出19种商品,第二天售出13种商品,第三天售出18种商品;前两天都售出的商品有3种,后两天都售出的商品有4种,则该网店
①第一天售出但第二天未售出的商品有______种;
②这三天售出的商品最少有_______种.
【答案】①16;②29
考点: 统计分析
【名师点睛】本题将统计与实际情况结合,创新味十足,是能力立意的好题,关键在于分析商品出售的所有可能的情况,分类讨论做到不重复不遗漏,另外,注意数形结合思想的运用.
11.【2015高考重庆,文4改编】重庆市2013年各月的平均气温(°C)数据的茎叶图如下
0
8
9
1
2
5
8
2
0
0
3
3
8
3
1
2
则这组数据中的中位数是 .
【答案】20
【解析】由茎叶图可知总共12个数据,处在正中间的两个数是第六和第七个数,它们都是20,由中位数的定义可知:其中位数就是20.
12.【2015高考陕西,文2改编】某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 .
【答案】137
【解析】由图可知该校女教师的人数为.
13.【2015高考湖北,文2改编】
我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 石.
【答案】169
【解析】设这批米内夹谷的个数为,则由题意并结合简单随机抽样可知,,即.
14.【2015高考广东,文12】已知样本数据,,,的均值,则样本数据,,,的均值为 .
【答案】
【解析】因为样本数据,,,的均值,所以样本数据,,,的均值为,所以答案应填:.
15.【2015高考北京,文14】高三年级位学生参加期末考试,某班位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.
从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;
②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .
【答案】乙;数学
【解析】①由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.②由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学.
16.【2015高考北京,文17】某超市随机选取位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.
商
品
顾
客
人
数
甲
乙
丙
丁
√
×
√
√
×
√
×
√
√
√
√
×
√
×
√
×
√
×
×
×
×
√
×
×
(I)估计顾客同时购买乙和丙的概率;
(II)估计顾客在甲、乙、丙、丁中同时购买中商品的概率;
(III)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中那种商品的可能性最大?
(Ⅲ)与(Ⅰ)同理,可得:顾客同时购买甲和乙的概率可以估计为,顾客同时购买甲和丙的概率可以估计为,顾客同时购买甲和丁的概率可以估计为,所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大.
16.【2015高考广东,文17】某城市户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.
(1)求直方图中的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为,,,的四组用户中,用分层抽样的
方法抽取户居民,则月平均用电量在的用户中应抽取多少户?
【解析】(1)由得:,所以直方图中的值是
(2)月平均用电量的众数是,因为,所以月平均用电量的中位数在内,设中位数为,由得:,所以月平均用电量的中位数是
(3)月平均用电量为的用户有户,月平均用电量为的用户有户,月平均用电量为的用户有户,月平均用电量为的用户有户,抽取比例,所以月平均用电量在的用户中应抽取户
【2018年高考命题预测】
概率统计试题在试卷中的题型仍是填空题型,纵观近几年高考数学试卷中,概率与统计是必考题,而且是基础题,有时以直方图或茎叶图提供问题的背景信息,预测2018年仍会出现此类题,因此掌握概率与统计的基础知识是学习的关键.
【2018年高考考点定位】
本知识点主要是:随机抽样常以选择、填空题考查分层抽样,难度较低.在用样本估计总体中,会读图、识图,会从频率分布直方图中分析样本的数字特征(众数、中位数、平均数等);重视茎叶图;要重视线性回归方程,不仅会利用公式求,还要能分析其特点(正相关、负相关、回归方程过样本点中心);重视独立性检验( 2×2列联表).
【考点1】抽样方法、总体分布的估计
【备考知识梳理】1.简单随机抽样:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.
2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 3.总体:在数理统计中,通常把被研究的对象的全体叫做总体.
4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.
【规律方法技巧】分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.
解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=);(3)画出频率分布直方图,并作出相应的估计.
【考点针对训练】
1.某小区共有1000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为 ,平均数为 .
【答案】;
【解析】根据中位数的定义知中位数由,解得,所以中位数为:;平均数为:,所以答案为:;.
2.某城市户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.
(1)求直方图中的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为,,,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?
【解析】(1)由得:,所以直方图中的值是.
(2)月平均用电量的众数是;因为,所以月平均用电量的中位数在内,设中位数为,由得:,所以月平均用电量的中位数是.
【考点2】相关性、最小二乘估计与统计案例
【备考知识梳理】1.相关性
(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.
(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.
(3)若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关.
如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.
2.回归方程
(1)最小二乘法
如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用表达式[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2来刻画这些点与直线y=a+bx的接近程度,使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.
(2)回归方程
方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a,b是待定参数.
,
3.回归分析
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘法估计分别为:
,).其中=i,=i,(,)称为样本点的中心.
(3)相关系数
①,②当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.
4.独立性检验
(1)设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=1;变量B:B1,B2=1.
2×2列联表
B
A
B1
B2
总计
A1
a
b
a+b
A2
c
d
c+d
总计
a+c
b+d
a+b+c+d
构造一个随机变量其中为样本容量.
(2)独立性检验:利用随机变量来判断“两个变量有关联”的方法称为独立性检验.
(3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断
①当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;
②当χ2>2.706时,有90%的把握判定变量A,B有关联;
③当χ2>3.841时,有95%的把握判定变量A,B有关联;
④当χ2>6.635时,有99%的把握判定变量A,B有关联.
【规律方法技巧】1.“相关关系与函数关系”的区别:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.
2.三点提醒: 一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.
3.正确理解计算b,a的公式和准确的计算是求线性回归方程的关键.回归直线方程y=bx+a必过样本点中心(,).在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.
4.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式,计算值,值越大,说明“两个变量有关系”的可能性越大.
【考点针对训练】
1.已知x、y的取值如下表所示,若y与x线性相关,且=0.95x+,则=____________.
x
0
1
3
4
y
2.2
4.3
4.8
6.7
【答案】
【解析】,,样本中心点,在回归直线上,所以代入,所以
2.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
做不到“光盘”
能做到“光盘”
男
45
10
女
30
15
附:
P(K2k)
0.10
0.05
0.025
k
2.706
3.841
5.024
参照附表,
在如下结论:
A.在犯错误的概率不超过l%的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过l%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”
D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”
中正确的是 .
【答案】C
【解析】由表计算得:,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,填C.
【两年模拟详解析】
1. 【苏北三市(连云港、徐州、宿迁)2017届高三年级第三次调研考试】已知一组数据3,6,9,8,4,则该组数据的方差是__________.
【答案】 (或5.2)
【解析】
2. 【2016-2017学年度苏锡常镇四市高三教学情况调研(二)】下表是一个容量为10的样本数据分组后的频数分布.若利用组中值近似计算本组数据的平均数,则的值为 .
【答案】19.7
【解析】
3. 【南京市、盐城市2017届高三年级第一次模拟】已知样本数据的方差,则样本数据的方差为 ▲ .
【答案】12
【解析】由题意得方差为
4. 【2017年第三次全国大联考江苏卷】已知样本的平均数为,且,则此样本的方差为_____________.
【答案】
【解析】因为,所以,而,所以或,从而样本的方差为.
5. 【2017年高考原创押题预测卷02(江苏卷)】某人次上班途中所花的时间(单位:分钟)分别为,则这组数据的标准差为
【答案】
【解析】因为这组数据的平均数是,所以其方差,故所求这组数据的标准差.
6. 【淮安、宿迁、连云港、徐州苏北四市2016届高三第二次调研】交通部门对某路段公路上行驶的汽车速度实施监控,从速度在的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在以下的汽车有 辆.
【答案】75
【解析】由频率分布直方图得,速度在以下的汽车所占频率为,则速度在以下的汽车有辆
7.【江苏省清江中学数学模拟试卷】某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间中,其频率分布直方图如图所示,则其抽样的100根中,有 根在棉花纤维的长度大于25mm.
【答案】40
【解析】.
8.【扬州市2015—2016学年度第一学期期末检测试题】某学校从高三年级共800名男生中随机抽取50名测量身高. 据测量被测学生身高全部介于155cm和195cm之间,将测量结果按如下方式分成八组:第一组、第二组、……、第八组. 按上述分组方式得到的频率分布直方图的一部分如图所示,估计这所学校高三年级全体男生身高180cm以上(含180cm)的人数为 .
【答案】144
【解析】由图得,身高180cm以上(含180cm)的频率为,则人数为
9.【南京市、盐城市2016届高三年级第一次模拟考试数学】某校高一年级有学生人,高二年级有学生人,现采用分层抽样的方法从全校学生中抽出人,其中从高一年级学生中抽出人,则从高三年级学生中抽取的人数为 .
【答案】17
【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人
10.【苏州市2016届高三年级第一次模拟考试】若一组样本数据9,8,x,10,11的平均数为10,则该组样本数据的方差为 .
【答案】2
【解析】由题意得,因此方差为
11.【江苏省扬州中学2015—2016学年第二学期质量检测】在一段时间内有2000辆车通过高速公路上的某处,现随机抽取其中的200辆进行车速统计,统计结果如下面的频率分布直方图所示.若该处高速公路规定正常行驶速度为90km/h~120km/h,试估计2000辆车中,在这段时间内以正常速度通过该处的汽车约有________辆.
【答案】1700
【解析】
12.【南京市、盐城市2016届高三年级第二次模拟考试】如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图.若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为 .
【答案】
【解析】
13.【江苏省南京市2016届高三年级第三次学情调研适应性测试】一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则月收入在[2500,3000)范围内的应抽出 人.
(第6题)
【答案】
【解析】由题意得:
14.【南京市2016届高三年级第三次模拟考试】甲、乙两位选手参加射击选拔赛,其中连续5轮比赛的成绩(单位:环)如下表:
选手
第1轮
第2轮
第3轮
第4轮
第5轮
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
则甲、乙两位选手中成绩最稳定的选手的方差是 .
【答案】0.02
【一年原创真预测】
1. 以下四个命题中:
①在回归分析中,可用相关指数的值判断模型的拟合效果, 越大,模型的拟合效果越好;
②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;
③若数据的方差为1,则的方差为2;
④对分类变量与的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.
其中真命题的个数为 .
【答案】2
【入选理由】本题考查特称命题真假的判断,回归分析,相关系数,独立性检验等基础知识,意在考查考生转化能力,分析问题解决问题的能力,运算求解能力.此类知识属于高考冷门问题,近年高考有所重视,应多注意,故选此题.
2.某单位为了了解某办公楼用电量 (度)与气温(oC)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:
气温(oC)
18
13
10
-1
用电量(度)
24
34
38
64
得到的回归方程为,则 0, 0.
【答案】>,<
【解析】依题意,画散点图知,两个变量负相关,所以,.
【入选理由】本题考查考查散点图、线性回归方程等基础知识,意在考查考生分析问题解决问题的能力,运算求解能力.近年高考加强了对线性回归方程的考查,应多注意,故选此题.
3.2015国际滑联世界花样滑冰锦标赛于3月23日至29日在上海举行,为调查市民喜欢这项赛事是否与年龄有关,随机抽取了55名市民,得到如下数据表:
喜 欢
不 喜 欢
合 计
大于40岁
20
5
25
20岁至40岁
10
20
30
合 计
30
25
55
(I)判断是否有
的把握认为喜欢这项赛事与年龄有关?
(II)用分层抽样的方法从喜欢这项赛事的市民中随机抽取6人作进一步调查,将这6位市民作为一个样本,从中任选2人,求恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民的概率.
下面的临界值表供参考:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:,其中)
【解析】(I)由公式得,所以有的把握认为喜欢这项赛事与年龄有关.
(II)设所抽样本中有个“大于40岁”市民,则,解得,所以样本中有4个“大于40岁”市民,同理可得样本中有2个“20岁至40岁”的市民,他们分别记作从中任选2人的基本事件有
共15个,其中恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民含基本事件共8个,所以从中任选2人,恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民的概率为.
【入选理由】本题主要考查独立性检验,分层抽样,随机事件的概率等基础知识,意在考查学生分析数据的能力、分析问题解决问题的能力和运算求解能力.2015年高考加强了对线性回归方程的考查,下年高考很有可能考查立性检验,故选此题.