- 660.50 KB
- 2021-06-23 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
【命题热点突破一】抽样方法
某工厂生产的甲、乙、丙、丁四种不同型号的产品分别有150件、120件、180件、150件.为了调查产品的情况,需从这600件产品中抽取一个容量为100的样本,若采用分层抽样法,设甲产品中应抽取的产品件数为x,某件产品A被抽到的概率为y,则x,y的值分别为( )
A.25, B.20,
C. 25, D.25,
【答案】D
【特别提醒】 三种抽样方法均是等概率抽样,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.
【变式探究】
从编号分别为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为________.
【答案】74
【解析】每8件产品抽取一件,编号为58的产品在样本中,则样本中产品的最大编号为58+16=74.
【命题热点突破二】用样本估计总体
【2016高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20), 20,22.5), 22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
(A)56 (B)60 (C)120 (D)140
【答案】D
【变式探究】(1)将某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图183所示),其中茎为十位数,叶为个位数,则这组数据的中位数和平均数分别是( )
图183
A.91,91.5 B.91,92
C.91.5,91.5 D.91.5,92
(2)2014年6月,一篇关于“键盘侠”(“键盘侠”一词描述了部分网民在现实生活中胆小怕事自私自利,却习惯在网络上大放厥词的一种现象)的时评引发了大家对“键盘侠”的热议.某地区新闻栏目对该地区群众对“键盘侠”的认可度做出调查:在随机抽取的50人中,有14人持认可态度,其余持反对态度.若该地区有9600人,则估计该地区对“键盘侠”持反对态度的有________人.
【答案】(1)C (2)6912
【解析】(1)中位数为=91.5,平均数为90+=91.5.
(2)根据样本估计总体的思想,可知该地区群众对“键盘侠”持反对态度的概率约为
,所以该地区9600人中对“键盘侠”持反对态度的大约有9600×=6912(人).
【特别提醒】 统计的基本思想之一就是以样本估计总体.以样本的频率估计总体的概率、以样本的特征数估计总体的特征数.
【变式探究】
(1)某学校随机抽查了本校20个同学,调查他们平均每天在课外进行体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是0,5),5,10),…,35,40],作出的频率分布直方图如图184所示,则原始的茎叶图可能是( )
图184
图185
(2)高三年级上学期期末考试中,某班级数学成绩的频率分布直方图如图186所示,数据分组依次如下:
70,90),90,110),110,130),130,150].
估计该班数学成绩的平均分数为( )
图186
A.112
B.114
C.116
D.120
【答案】(1)B (2)B
【命题热点突破三】统计案例
例3、某高校共有15 000人,其中男生10 500人,女生4500人,为调查该校学生每周平均参加体育运动时间情况,采用分层抽样的方法,收集了300名学生每周平均参加体育运动时间的样本数据(单位:小时).
(1)应收集多少名女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均参加体育运动时间的频率分布直方图(如图187所示),其中样本数据分组区间为0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均参加体育运动时间超过4个小时的概率.
(3)在样本数据中,有60名女生每周平均参加体育运动的时间超过4个小时,请画出每周平均参加体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.
P(K2≥k0)
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
附:K2=
【解析】:(1)300×=90,所以应收集90名女生的样本数据.
(2)由频率分布直方图得每周平均参加体育运动超过4小时的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均参加体育运动时间超过4小时的概率约为0.75.
(3)由(2)知,300名学生中有300×0.75=225(名)学生每周平均参加体育运动的时间超过4小时,其余75名学生每周平均参加体育运动的时间不超过4小时.又因为抽取的300名学生中有210名男生、90名女生,所以每周平均参加体育运动时间与性别的列联表如下:
男生
女生
总计
每周平均参加体育运动
的时间不超过4小时
45
30
75
每周平均参加体育运动
的时间超过4小时
165
60
225
总计
210
90
300
结合列联表可得K2的观测值k==≈4.762>3.841.
所以有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.
【特别提醒】 在计算K2时要注意公式中各个字母的含义,分子上是总量乘2×2列联表中对角线数字乘积之差的平方,分母上是四个分和量的乘积.
【变式探究】
为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y之间的关系.
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
(1)求小李这5天的平均投篮命中率;
(2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率.
设线性回归方程为=x+,则由公式可得==
=0.01,
所以=-=0.5-0.01×3=0.47,
所以=x+=0.01x+0.47.
当x=6时,=0.53,故小李该月6号打6小时篮球的投篮命中率约为0.53.
【特别提醒】 回归直线一定过样本点的中心(x,y),当已知回归直线方程两个系数中的一个时,可以直接代入样本点中心的坐标求得另一个系数.正相关和负相关是根据回归直线方程的斜率判断的:正相关时回归直线方程的斜率为正值;负相关时回归直线方程的斜率为负值.回归直线方程斜率的符号与相关系数的符号是一致的.
【高考真题解读】
1.【2016年高考四川】(本小题满分12分)
我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨)、一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),…,4,4.5)分成9组,制成了如图所示的频率分布直方图.
(I)求直方图中a的值;
(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(III)若该市政府希望使85%的居民每月的用水量不超过标准(吨),估计的值,并说明理由.
【答案】(Ⅰ);(Ⅱ)36000;(Ⅲ)2.9.
【解析】
(Ⅱ)由(Ⅰ),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为
300 000×0.12=36 000.
(Ⅲ)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,
而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,
所以2.5≤x<3.
由0.3×(x–2.5)=0.85–0.73,
解得x=2.9.
所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
2.【2016高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20), 20,22.5), 22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
(A)56 (B)60 (C)120 (D)140
【答案】D
【解析】由频率分布直方图知,自习时间不少于22.5小时为后三组,有(人),选D.
1.(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.167 B.137 C.123 D.93
【答案】 B
【解析】 由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.故选B.
2.(2015·安徽,6)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8 B.15 C.16 D.32
【答案】 C
3.(2015·重庆,3)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:
则这组数据的中位数是( )
0
1
2
2
8 9
2 5 8
0 0 0 3 3 8
1 2
A.19 B.20 C.21.5 D.23
【答案】 B
【解析】 从茎叶图知所有数据为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20,选B.
4.(2015·新课标全国Ⅱ,31)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
【答案】 D
5.(2015·福建,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=y-x.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 B.11. 8万元
C.12.0万元 D.12.2万元
【答案】 B
【解析】 回归直线一定过样本点中心(10,8),∵=0.76,∴=0.4,由=0.76x+0.4得当x=15万元时,=11.8万元.故选B.
6.(2014·山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8 C.12 D.18
【答案】 C
7.(2014·陕西,9)设样本数据x1,x2,…,x10的均值和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为( )
A.1+a,4 B.1+a,4+a
C.1,4 D.1,4+a
【答案】 A
【解析】
8.(2014·湖南,2)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )
A.p1=p2