- 947.23 KB
- 2021-07-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
考查角度2 随机抽样、总体估计、统计案例
分类透析一 统计数据分析
例1 PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,一般情况下PM2.5浓度越大,大气环境质量越差,某市甲、乙两个监测站测得某10日内每天该市的PM2.5浓度读数(单位:μg/m3),从小到大排列如下:
甲:43,63,65,72,73,75,78,81,86,98.
乙:37,58,61,65,68,68,71,77,82,94.
则下列说法正确的是( ).
A.这10日内甲、乙两个监测站读数的极差相等
B.这10日内甲、乙两个监测站读数的中位数中乙的较大
C.这10日内乙监测站读数的中位数与众数相等
D.这10日内甲、乙两个监测站读数的平均数相等
解析 甲监测站读数的极差为98-43=55,乙监测站读数的极差为94-37=57,所以A错;甲监测站读数的中位数为74,乙监测站读数的中位数为68,所以B错;乙监测站读数的中位数与众数都是68,所以C正确;甲监测站读数的平均数为73.4,乙监测站读数的平均数为68.1,所以D错.故选C.
答案 C
方法技巧 1.一组数据的极差就是这组数据最大值与最小值的差;
2.把一组数据从小到大或从大到小排列,若这组数据是奇数个,则排列在中间的数是这组数据的中位数,若这组数据是偶数个,则排列在中间的两个数的平均数是这组数据的中位数;
3.一组数据的众数为出现的次数最多的数;
4.一组数据x1,x2,…,xn的平均数为x-=x1+x2+…+xnn.
分类透析二 线性回归的综合应用
例2 某研究机构在对具有线性相关的两个变量x和y进行统计分析时,得到如下数据:
x
4
6
8
10
12
y
1
2
3
5
6
由表中数据求得y关于x的回归直线方程为y^=0.65x+a^,则在这些样本点中任取一点,该点落在回归直线下方的概率为( ).
A.25 B.35 C.34 D.12
解析 因为x-=8,y-=3.4,所以3.4=0.65×8+a^,解得a^=-1.8,则y^=0.65x-1.8,可知5个点中落在回归直线下方的有(6,2),(8,3),共2个,所以所求概率为25.故选A.
答案 A
方法技巧 1.回归直线过样本数据中心点(x-,y-).
2.判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数r公式求出r,然后根据r的大小进行判断.在严格按照公式求解线性回归方程时,一定要注意计算的准确性.
分类透析三 统计案例
例3 在研究色盲与性别的关系调查中,调查了男性480人,其中有60人患色盲,调查的520名女性中,有6人患色盲.若认为“性别与患色盲有关系”,则这个结论是错误的概率不超过 .
下面临界值表供参考:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).
解析 列出2×2列联表:
患色盲
不患色盲
总计
男
60
420
480
女
6
514
520
总计
66
934
1000
根据上面2×2列联表中的数据,可求得k=1000×(60×514-6×420)266×934×480×520≈52.13.
又P(K2≥10.828)=0.001,所以“性别与患色盲有关系”这个结论是错误的概率不超过0.001.
答案 0.001
方法技巧 利用独立性检验的计算公式,求解出K2的观测值,再根据附表,即可得出结论.
1.(2018年全国Ⅲ卷,文14改编)已知某高级中学高一、高二、高三的学生人数分别为880、860、820,现用分层抽样的方法从该校抽调128人,则在高二年级的学生中抽调的人数为 .
解析 由题意可知,在高二年级的学生中抽调的人数为128×860880+860+820=43.
答案 43
2.(2018年全国Ⅰ卷,文3改编)下图是某企业产值在2008年~2017年的年增量(即当年产值比前一年产值增加的量)统计图(单位:万元),下列说法正确的是( ).
A.2009年产值比2008年产值少
B.从2011年到2015年,产值年增量逐年减少
C.产值年增量最大的是2017年
D.2016年的产值年增长率可能比2012年的产值年增长率低
解析 对于A,2009年产值比2008年产值多29565万元,故A错误;
对于B,从2012年到2013年,产值年增量是增加的,故B错误;
对于C,产值年增量最大的不是2017年,故C错误;
对于D,因为增长率等于增长量除以上一年的产值,由于上一年的产值不确定,所以2016年的产值年增长率可能比2012年的产值年增长率低,D正确.故选D.
答案 D
3.(2017年全国Ⅰ卷,文2改编)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,测试成绩(单位:分)如图所示,假设得分值的中位数为me,众数为m0,平均值为x-,则( ).
A.me=m0=x- B.me=m0<x-
C.me6.635.
∴有99%的把握认为看手机与人变冷漠有关系.故选A.
答案 A
12.(2018绵阳南山中学模考)某车间加工零件的数量x与加工时间y的统计数据如下表:
零件数x(个)
10
20
30
加工时间y(分钟)
21
30
39
现已求得上表数据的线性回归方程y^=b^x+a^中的b^值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( ).
A.84分钟 B.94分钟
C.102分钟 D.112分钟
解析 ∵x-=10+20+303=20,y-=21+30+393=30,且回归直线过样本点的中心,∴30=0.9×20+a^,解得a^=12,因此加工100个零件大约需要100×0.9+12=102分钟的加工时间.故选C.
答案 C
13.(2018乌鲁木齐二模)某次考试有64名考生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样的方法抽取一个容量为8的样本,若在第1组中随机抽取的号码为5,则在第6组中抽取的号码为 .
解析 某次考试有64名考生,随机编号为0,1,2,…,63,依据编号顺序平均分成8,组号依次为1,2,3,…,8,故分组间隔为648=8.
因为在第1组中随机抽取的号码为5,所以在第6组中抽取的号码为5+5×8=45.
答案 45
14.(2018云南保山统考)甲同学在“附中好声音”歌唱选拔赛中,5位评委评分情况分别为76,77,88,90,94,则甲同学得分的方差为 .
解析 甲同学得分76,77,88,90,94的平均数为76+77+88+90+945=85,则甲同学得分的方差为s2=(76-85)2+(77-85)2+(88-85)2+(90-85)2+(94-85)25=52.
答案 52
15.(2018天津市南开中学高三模拟考试)随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调査,由此得到样本的频率分布直方图如图所示.从不小于40
岁的人中按年龄段分层抽样的方法随机抽取8人,则在[50,60)年龄段抽取的人数为 .
解析 根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2,
所以不小于40岁的人的频数是100×0.2=20.
从不小于40岁的人中按年龄段分层抽样的方法随机抽取8人,
则在[50,60)年龄段抽取的人数为8×0.005×10×10020=8×14=2.
答案 2
16.(2018西安市长安五中二模)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本.为确定该产品的成本,进行了5次试验,收集到的数据如下表:
产品数x(个)
10
20
30
40
50
产品总成本y(元)
62
a
75
81
89
由最小二乘法得到回归直线方程为y^=0.67x+54.9,则a= .
解析 x-=30,y-=307+a5,又y-=0.67x-+54.9,所以307+a5=0.67×30+54.9,解得a=68.
答案 68