- 1.13 MB
- 2021-06-24 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
透析高考数 23题对对碰【 精品】第二篇
副题4 统计
【副题考法】本副题考题形式为选择题或填空题,以实际问题为背景、与概率、框图等结合主要考查抽样方法、样本频率分布估计总体频率分布、样本数字特征估计总体数字特征、回归分析、独立性检验等统计知识与方法,考查应用意识、阅读理解能力、数据处理能力、运算求解能力,难度为基础题或中档题,分值为5至10分.
【主题考前回扣】
1.抽样方法
简单随机抽样、分层抽样、系统抽样.
①从容量为N的总体中抽取容量为n的样本,则每个个体被抽到的概率都为;
②分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量.
2.统计中四个数据特征
①众数 在样本数据中,出现次数最多的那个数据;
②中位数 在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数; =
③平均数 样本数据的算术平均数,
即=(x1+x2+…xn);
④方差与标准差
方差 s2=[(x1-)2+(x2-)2+…+(xn-)2].
标准差
s=.
3.直方图的三个结论
①小长方形的面积=组距×=频率;
②各小长方形的面积之和等于1;
③小长方形的高=,所有小长方形高的和为.
4.回归分析(1)回归直线=x+经过样本点的中心点(,),若x取某一个值代入回归直线方程=x+中,可求出y的估计值.
5.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
n
则 2=(其中n=a+b+c+d为样本容量).
利用随机变量 2 判断“两个分类变量有关系”的方法称为独立性检验.如果 2的观测值 越大,说明“两个分类变量有关系”的可能性越大.
【易错点提醒】
1.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
2.利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3.在独立性检验中, 2=(其中n=a+b+c+d)所给出的检验随机变量 2的观测值 ,并且 的值越大,说明“X与Y有关系”成立的可能性越大,可以利用数据 确定“X与Y有关系”的可信程度.
4.混淆直线方程y=ax+b与回归直线=x+系数的含义,导致回归分析中致误.
【副题考向】
考向一 抽样方法
【解决法宝】 解决抽样问题的策略
1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量较多且差别不大时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样.
2.系统抽样
(1)若从容量为N的总体中抽取容量为n的样本,用系统抽样时,应先将总体中的各个个体编号,再确定分段间隔 ,以便对总体进行分段.
(2)当是整数时,取 =作为分段间隔即可,当不是整数时,应先从总体中随机剔除一些个体,使剩余个体数N′能被n整除,这时分段间隔 =.
(3) 利用简单随机抽样确定在第一组中抽取的个体的号码数,譬如第一组号码为,则第n组号码为.
3.分层抽样 若总体有差异的几部分组成,用分层抽样方法,按同比例比例抽样.
例1【广东省中山市 上 期期末】某班运动队由足球队员18人、篮球队员12人、乒乓球队员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为的样本,若分别采用系统抽样和分层抽样法,则都不用剔除个体;当样本容量为时,若采用系统抽样法,则需要剔除1个个体,那么样本容量为__________.
【分析】根据分层抽样和系统抽样的意义,即可得出n值.
【解析】n为18+12+6=36的正约数,因为18 12 6=3 2 1,所以n为6的倍数,因此 ,因为当样本容量为时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此
考向二 总体估计
【解决法宝】1.频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距×.
2.频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. =
4.茎叶图图中的中位数 数据从小到大排成一排,中间为一个数或两个数的平均值.
5.样本数据的算术平均数,即=.
6.标准差的平方就是方差,方差的计算
基本公式
例2【河南安阳 二模】在某校连续次考试成绩中,统计甲,乙两名同 的数 成绩得到如图所示的茎叶图.已知甲同 次成绩的平均数为,乙同 次成绩的中位数为,则的值为( )
A. B. C. D.
【分析】由甲同 乘积的均值即可求出x,由乙同 成绩的中无数即可求出y,即可求出x+y的值.
例3【山东省聊城市 一模】某工厂从生产的一批产品中随机抽出一部分,对这些产品的一项质量指标进行了检测,整理检测结果得到如下频率分布表
质量指标分组
频率
0.1
0.6
0.3
据此可估计这批产品的此项质量指标的方差为__________.
【分析】每组数据的中点值乘以对应概率的和就是频率分布直方表的均值,各组的中间值与均值差的平方和就是方差.
【解析】由题意得这批产品的此项质量指标的平均数为,
故方差为.
考向三 回归分析
【解决法宝】1.散点图 表示具有相关关系的两个变量的一组数据的图形叫散点图.
2.①正相关 如果散点图中的点分布在从左下到右上的区域内,称为正相关.
②负相关 若散点图中的点分布在从左上角到右下角的区域内,称为负相关.
3.求回归直线方程的关键
(1)正确理解和合理选择回归方程系数的计算公式并能准确地进行运算,若样本数据较小,选第二个公式,若样本数据较大但与样本均值差较小用第1个公式.
(2)根据样本数据作出散点图 确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.
(3)计算线性回归方程公式 ,其中
.
4.回归直线一定过样本中心点(,).
例4【河北邢台市一中 二模】某产品的广告费用x与销售额y的统计数据如下表
广告费用x/万元
4
2
3
5
销售额y/万元
49
26
39
54
根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额约为____元.
【分析】先计算出,将代入回归直线方程即可求出,再将x=6代入回归直线方程即可求出销售额.
考向四 独立性检验
【解决法宝】独立性检验的基本方法
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表如表
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
①根据实际问题需要的可信度确定临界值;
②利用公式=,由观测数据计算得到随机变量的观测值;
③如果>,就以的把握认为“与有关系”;否则就说样本观测值没有提供“与有关系”的充分证据.
例5【湖南师大附中 月考(三)】在西非肆虐的“埃博拉病毒”的传播速度很快,
这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表
参照附表,在犯错误的概率最多不超过______(填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.
参考公式 2=
【分析】由题中数据计算出 2的观测值,对照开方分布表即可求出结果.
【副题集训】
1.【湖南省郴州市一高 二练】从名 生中选取名 生参加全国诗词大会,若采用下面的方法选取;先用简单随机抽样从人中剔除人,剩下的人再用系统抽样的方法抽取,则每人入选的概率( ).
A. 都相等, 且为 B. 都相等, 且为 C. 不全相等 D. 均不相等
【答案】B
【解析】由题意,由于研究对象的总数较大,所以先用简单随机抽样剔除极少部分,再用系统抽样选出样本,操作过程符合抽样抽样原则,即每人入选的概率相等,且为.故选B.
2. 【山东省实验中 2017届高三第一次诊,4】高三 生体检,某班级随机抽取5名女 生的身高(厘米)和体重(公斤)的数据如下表
165
160
175
155
170
58
52
62
43
60
根据上表可得回归直线方程为,则( )
A. B. C. D.
【答案】A
【解析】回归直线方程过点,而,所以
,选A.
3.【湖南省怀化市 上 期期末】总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从第1行的第5列和第6列数字开始由左往右依次选取两个数字,则选出 的第5个个体的编号为( )
A. 01 B. 02 C. 14 D. 19
【答案】A
4.【山东肥城市2017届高三上 期升级统测,3】如图是某居民小区年龄在岁到岁的居民上 情况的频率分布直方图,现已知年龄在的上 人数呈现递减的等差数列, 则年龄在的频率是( )
A. B. C. D.
【答案】C
【解析】的概率和为,又的概率依次成等差数列,所以的频率为选C.
5.【甘肃省兰州市西北师范大 附中2017届二诊】近日,一种牛奶被查出含有致癌物质,国家质监局调查了这种牛奶的100个相关数据,绘制成如图所示的频率分布直方图,再对落在[6,11),[21,26]两组内的数据按分层抽样方法抽取8个数据,然后从这8个数据中抽取2个,则最后得到的2个数据分别 自两组的取法种数是( )
A. 10 B. 13 C. 15 D. 18
【答案】C
6.【河北省唐山一中2017届高三上 期12月调研考试】右图是一容量为的样本的重量的频率分布直方图,则由图可估计样本的重量的中位数为( )
A.11 B.11.5 C.12 D.12.5
【答案】C
【解析】设中位数为., ,解得.故C正确.
7.【四川省内江市高中 一模】下列说法中正确的是
A. 先把高三年级的2000名 生编号 1到2000,再从编号为1到50的50名 生中随机抽取1名 生,其编号为,然后抽取编号为的 生,这样的抽样方法是分层抽样法
B. 线性回归直线不一定过样本中心点
C. 若两个随机变量的线性相关性越强,则相关系数的值越接近于1
D. 若一组数据1、、3的平均数是2,则该组数据的方差是
【答案】D
【解析】对于,先把高三年级的2000名 生编号 1到2000,再从编号为1到50的50名 生中随机抽取1名 生,其编号为,然后抽取编号为的
生,这样的抽样方法是系统抽样,故错误;对于,线性回归直线一定过样本中心点,故错误;对于,若两个随机变量的线性相关性越强,则相关系数r的绝对值越接近于1,故错误;对于,若一组数据1、、3的平均数是2,则,则该组数据的方差是,故正确,故选
8.【广东珠海市2017届上 期调研测试(1),4】已知甲、乙两组数据如图茎叶图所示,若它们的中位数相同,平均数也相同,则图中的的比值( )
A. B. C. D.1
【答案】A
【解析】因为乙的中位数是,所以,可求得甲的平均数是,因此乙的平均数也是,进而得,,故选A.
9.【云南省昆明市 第二次统考】“搜索指数”是 民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.“搜索指数”越大,表示 民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高.下图是2017年9月到2018年2月这半年中,某个关键词的搜索指数变化的走势图.
根据该走势图,下列结论正确的是( )
A. 这半年中, 民对该关键词相关的信息关注度呈周期性变化
B. 这半年中, 民对该关键词相关的信息关注度不断减弱
C. 从 民对该关键词的搜索指数 看,去年10月份的方差小于11月份的方差
D. 从 民对该关键词的搜索指数 看,去年12月份的平均值大于今年1月份的平均值
【答案】D
10.【云南省、四川省、贵州省2017届高三上 期百校大联考数 ,4】从某项综合能力测试中抽取100人的成绩,统计如下,则这100个成绩的平均数为( )
A.3 B.2.5 C.3.5 D.2.75
【答案】A
【解析】设这100个成绩的平均数即为,则.
11.【山西省平遥中 3月考】某 校、两个班的数 兴趣小组在一次数 对抗赛中的成绩绘制茎叶图如下,通过茎叶图比较两班数 兴趣小组成绩的平均值及方差
①班数 兴趣小组的平均成绩高于班的平均成绩
②班数 兴趣小组的平均成绩高于班的平均成绩
③班数 兴趣小组成绩的标准差大于班成绩的标准差
④班数 兴趣小组成绩的标准差大于班成绩的标准差
其中正确结论的编号为( )
A. ①③ B. ①④ C. ②③ D. ②④
【答案】B
【解析】A班 53,63,64,76,74,78,78,76,81,85,86,88,82,92,95;B班 45,48,51,53,56,62,64,65,73,73,74,70,83,82,91,所以A班平均数为78,B班平均数为66,则A班平均成绩高于B班平均成绩;由茎叶图可知,A班成绩相对集中,B班成绩相对分散,所以B班的标准差大于A班的标准差,所以①④正确,故选B。
12. 【湖南省邵阳市 上 期期末】在某次高中数 竞赛中,随机抽取90名考生,其分数如图所示,若所得分数的平均数,众数,中位数分别为,,,则,,的大小关系为( )
A. B. C. D.
【答案】D
【解析】经计算得平均值,众数为,中位数为,故,选.
13.【河南省八市 评 第一次测评】某校对高二一班的数 期末考试成绩进行了统计,发现该班 生的分数都在90到140分之间,其频率分布直方图如图所示,若130~140分数段的人数为2,则100~120分数段的人数为( ) -
A. 12 B. 28 C. 32 D. 40
【答案】B
【解析】130~140分数段的纵坐标为1-(0.045+0.025+0.015+0.01)×10=0.05 ,所以高二一班人数为2/0.05=40,所以100~120分数段的人数为(0.025+0.045)×10×40=28,故选B.
14.【广东省茂名市五大联盟 校 3月联考】下列茎叶图中的甲,乙的平均数,方差,极差及中位数,相同的为( )
A. 极差 B. 方差 C. 平均数 D. 中位数
【答案】C
15.【广东省茂名市五大联盟 校 3月联考】下列茎叶图中的甲,乙的平均数,方差,极差及中位数,相同的为( )
A. 极差 B. 方差 C. 平均数 D. 中位数
【答案】C
16.【重庆市 上 期期末】根据如下样本数据
3
5
7
9
6
3
2
得到回归方程,则
A. B. 变量与线性正相关
C. 当=11时,可以确定=3 D. 变量与之间是函数关系
【答案】A
【解析】由题意可得 ,,回归方程过样本中心点,则 ,求解关于实数的方程可得 ,
由可知变量与线性负相关;当=11时,无法确定y的值;变量与之间是相关关系,不是函数关系,故选A.
17. 【四川省 高三春季诊断性测试】我国古代数 名著《九章算术》有一抽样问题 “今有北乡若干人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而北乡需遣一百零八人,问北乡人数几何?“其意思为 “今有某地北面若干人,西面有7488人,南面有6912人,这三面要征调300人,而北面共征调108人(用分层抽样的方法),则北面共有__________人.”
【答案】8100
【解析】因为共抽调300人,北面抽掉了108人,所以西面和南面共14400人中抽出了192人,所以抽样比为,所以北面共有人,故填8100.
18.【山东省淄博市 3月模拟】某校高三年级3个 部共有600名 生,编号为 001,002,…,600,从001到300在第一 部,从301到495在第二 部,496到600在第三 部.采用系统抽样的方法从中抽取50名 生进行成绩调查,且随机抽取的号码为003,则第二 部被抽取的人数为__________.
【答案】17
19.【江苏省南通、徐州、扬州等六市 二模】某班40名 生参加普法知识竞赛,成绩都在区间上,其频率分布直方图如图所示,则成绩不低于60分的人数为____.
【答案】30
【解析】根据频率分布直方图可得成绩不低于60分的 生的频率为,∴成绩不低于60分的 生的人数为为.
20.【江苏省常州 高三上 期期末】若一组样本数据, , , , 的平均数为,则该组样本数据的方差为( )
【答案】
【解析】因为该组样本数据的平均数为2017,所以,解得,则该组样本数据的方差为 .
21.【安徽省马鞍山市 一模】已知样本容量为200,在样本的频率分布直方图中,共有个小矩形,若中间一个小矩形的面积等于其余个小矩形面积和的,则该组的频数为________.
【答案】50
【解析】设个小矩形面积和为,则中间小矩形面积的,根据直方图的性质可得,中间一个小矩形的面积等于,即该组的频数为 ,故答案为.
22.【安徽省池州市 上 期期末】某种产品的广告费支出与销售额之间有如下对应数据(单位 百万元),根据下表求出关于的线性回归方程为,
则表中的值为__________.
【答案】54
【解析】 ,代入回归方程可得 ,所以,故答案为.
23.【甘肃省武威市一高 一模】某大 餐饮中心为了解新生的饮食习惯,在全校一年级 生中进行了抽样调查,调查结果如表所示
根据表中数据,问是否有的把握认为“南方 生和北方 生在选用甜品的饮食习惯方面有差异”__________.(填有或没有)
附
【答案】有