- 1.10 MB
- 2021-07-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
考点51 随机抽样与样本估计总体
【考纲要求】
1.随机抽样
(1)理解随机抽样的必要性和重要性;
(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.
2.用样本估计总体
(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点;
(2)理解样本数据标准差的意义和作用,会计算数据标准差;
(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释;
(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;
(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
【命题规律】
分析近几年的高考试题不难知本部分在高考中一般为一个小题或者在解答题与其它的概率问题相结合考查;常常考查抽样方式的判断,其中系统抽样与分层抽样是考查重点;利用样本估计商品化中,特别应重视频率分布真方图和茎叶图的应用,另外常见的数字特征的求法也是高考命题点,预计2018年高考对本部分的考查着重考查以下几个方面:(1)分层抽样中各层抽取样本个数的确定;(2)对样本频率分布真方图、茎叶图的理解和应用.
【典型高考试题变式】
(一)简单随机抽样
例1 【2013年江西】总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4934 8200 3623 4869 6938 7481
A.08 B.07 C.02 D.01
【答案】D
【变式1】【改变了总体个数与样本个数及随机数表的选取的开始号】福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个二位号码中选取,小明利用如图所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列和第10列的数字开始从左到右依次选取两个数字,则第四个被选中的红色球号码为( )
A. 12 B. 33 C. 06 D. 16
【答案】C
【解析】第1行第9列和第10列的数字为63,所以选择的数为17,12 ,33, 06,32,22,10,第四个数为06,故选C.
【变式2】【改变了随机数表的排列方式及与概率交汇】天气预报显示,在今后的三天中,每一天下雨的概率为40%,现用随机模拟的方法估计这三天中恰有两天下雨的概率:先利用计算器产生0--9之间整数值的随机数,并制定用1,2,3,4表示下雨,用5,6,7,8,9,0表示不下雨,再以每3个随机数作为一组,代表三天的天气情况,产生了如下20组随机数
907 966 191 925 271 932 812 458 569 683
431 257 393 027 556 488 730 113 537 989
则这三天中恰有两天下雨的概率近似为( )
A. B. C. D.
【答案】B
【解析】阅读随机数表可知,满足题意的数据为: ,据此可知:这三天中恰有两天下雨的概率近似为,故选B.
(二)系统抽样
例1 【2013年陕西卷】某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2, …,840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为 ( )
A.11 B.12 C.13 D.14
【答案】B
【方法技巧归纳】(1)系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码;(2)系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.
【变式1】【变求在某一区间内的抽取的个体数为求确定在第1段抽取的初始号】用系统抽样法(按等距离的规则)从160名学生中抽取容量为20的样本,将这160名学生从1到160编号.按编号顺序平均分成20段(1~8号,9~16号,…,153~160号),若第16段应抽出的号码为125,则第1段中用简单随机抽样确定的号码是( )
A. 7 B. 5 C. 4 D. 3
【答案】B
【解析】用系统抽样知,每段中有8人,第16段应为从121到128这8个号码,125是其中的第5个号码,所以第一段中被确定的号码是5,故选B.
【变式2】【变求某区间内的抽取的个数为确定系统抽样每个个体被抽取的概率】从2007名学生中选取50名参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下的2000人再按系统抽样的方法抽取,则每人入选的可能性( )
A. 不全相等 B. 均不相等
C. 都相等,且为 D. 都相等,且为
【答案】D
【解析】用简单随机抽样从2007人中剔除7人,每个人被剔除的概率相等,剩下的人再按系统抽样的方法抽取,每个人被抽取的概率也相等,∴这种方法下,每人入选的概率是相等的,为,故选D.
(三)分层抽样
例3 【2017年江苏卷】某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号
的产品中抽取________ 件.
【答案】18
【解析】由题意,知分层抽样的抽样比为,所以应从丙种型号的产品中抽取件,故填18.
【方法技巧归纳】进行分层抽样时应注意以下几点:(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠;(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同;(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样;(4)抽样比=样本容量÷个体数量=各层样本容量÷各层个体数量.
【变式1】【变确定某层的个数为确定求各层抽取的个体数】具有三种性质的总体,其容量为63,将三种性质的个体按1∶2∶4的比例进行分层抽样调查,如果抽取的样本容量为21,则三种元素分别抽取的个数是( )
A. 12、6、3 B. 12、3、6 C. 3、6、12 D. 3、12、6
【答案】C
【变式2】【变确定某层的个数为求样本容量】某工厂生产三种不同型号的产品,产品数量之比依次为.现用分层抽样的方法抽出一个容量为的样本,样本中种型号的产品共有件,那么此样本的容量为( )
A. B. C. D.
【答案】C
【解析】由题意知,总体中中种型号产品所占的比例是,因样本中种型号产品有件,则,解得,故选C.
(四)频率分布直方图
例4 【2017北京卷】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:
(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体
中男生和女生人数的比例.
【答案】(1)0.4(2)20(3)3:2
(2)由频率分布直方图知,
样本中分数在区间的人数为 (人),
已知样本中分数小于40的学生有5人,
所以样本中分数在区间内的人数为 (人),
设总体中分数在区间内的人数为,则,得,
所以总体中分数在区间内的人数为20人.
【方法技巧归纳】利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
【变式1】【背景变了,同时变计算各组频数与频率为和分层抽样结合】每年的4月23日是“世界读书日”,某校研究性学习小组为了解本校学生的阅读情况,随机调查了本校200名学生在这一天的阅读时间 (单位:分钟),将样本数据整理后绘制成如图的样本频率分布直方图.
(1)求的值;
(2)试估计该学校所有学生在这一天的平均阅读时间;
(3)若用分层抽样的方法从这200名学生中,抽出25人参加交流会,则阅读时间为, 的两组中各抽取多少人?
【答案】(1) ;(2) ;(3) 阅读时间在分钟的应选人,
阅读时间在分钟的应选人.
【解析】(1)由已知,得,
解得.
【变式2】【背景变了,同时变为考查频率与概率之间关系】微信运动和运动手环的普及,增强了人民运动的积极性,每天一万步称为一种健康时尚,某中学在全校范围内内积极倡导和督促师生开展“每天一万步”活动,经过几个月的扎实落地工作后,学校想了解全校师生每天一万步的情况,学校界定一人一天走路不足千步为不健康生活方式,不少于千步为超健康生活方式者,其他为一般生活方式者,学校委托数学组调查,数学组采用分层抽样的办法去估计全校师生的情况,结合实际及便于分层抽样,认定全校教师人数为人,高一学生人数为人,高二学生人数人,高三学生人数,从中抽取人作为调查对象,得到了如图所示的这人的频率分布直方图,这人中有人被学校界定为不健康生活方式者.
(1)求这次作为抽样调查对象的教师人数;
(2)根据频率分布直方图估算全校师生每人一天走路步数的中位数(四舍五入精确到整数步);
(3)校办公室欲从全校师生中速记抽取人作为“每天一万步”活动的慰问对象,计划学校界定不健康生活方式者鞭策性精神鼓励元,超健康生活方式者表彰奖励元,一般生活方式者鼓励性奖励元,利用样本估计总体,将频率视为概率,求这次校办公室慰问奖励金额恰好为元的概率.
考试文科数学
【答案】(1)10(2)(3)
(3)有频率分布直方图知不健康生活方式者概率为,超健康生活方式者的概率为,一般生活方式者的概率为,
因为,
这次校办公室慰问奖励金额恰好为元的概率为.
(五)茎叶图
例5 【2013年安徽卷】为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.
(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为1, 2,估计1-2的值.
【答案】(1)(2)
【解析】 (1)设甲校高三年级学生总人数为.
由题意知,解得.
样本中甲校高三年级学生数学成绩不及格人数为,据此估计甲校高三年级这次联考数学成绩的及格率为.
【方法技巧归纳】(1)由茎叶图可以清晰地看到数据的分布情况,且能从茎叶图中看到原始数据,没有任何信息损失,便于记录和表示,但当样本容量较大时,作图较繁;(2)茎叶图常与概率问题、样本的数字特征问题综合应用,这类问题首先要根据茎叶图获取原始数据,再利用古典概型或样本的数字特征的公式求解.
【变式1】【背景变了,所求问题增加了方差的计算】在某校组织的“共筑中国梦”竞赛活动中,甲、乙两班各有6位选手参赛,在第一轮笔试环节中,评委将他们的笔试成绩作为样本数据,绘制成如下图所示的茎叶图.为了增加结果的神秘感,主持人暂时没有公布甲、乙两班最后一位选手的成绩.
(Ⅰ)求乙班总分超过甲班的概率;
(Ⅱ)主持人最后宣布:甲班第六位选手的得分是90分,乙班第六位选手的得分是97分.请你从平均分和方差的角度来分析两个班的选手的情况.
【答案】(Ⅰ);(Ⅱ)甲班选手间的实力相当,相差不大,乙班选手间实力悬殊,差距较大.
【解析】(Ⅰ)甲班前5位选手的总分为,
乙班前5位选手的总分为,
若乙班总分超过甲班,则甲、乙两班第六位选手的成绩可分别为三种.
所以,乙班总分超过甲班的概率为.
(Ⅱ)甲班平均分为,
乙班平均分为,
,.
两班的平均分相同,但甲班选手的方差小于乙班,所以甲班选手间的实力相当,相差不大,乙班选手间实力悬殊,差距较大.
【变式2】【背景变了,所求问题变为平均数与方差的应用】为了展示中华汉字的无穷魅力,传递传统文化,提高学习热情,某校开展《中国汉字听写大会》的活动.为响应学校号召,2(9)班组建了兴趣班,根据甲、乙两人近期8次成绩画出茎叶图,如图所示(把频率当作概率).
(1)求甲、乙两人成绩的平均数和中位数;
(2)现要从甲、乙两人中选派一人参加比赛,从统计学的角度,你认为派哪位学生参加比较合适?
【答案】(1), , , .
(2)派甲参加比较合适.
【解析】(1)由茎叶图可知甲、乙两人成绩的平均数为
,
,
甲、乙两人成绩的中位数为
, .
(2)派甲参加比较合适,理由如下:
,
+,
+,
∵, ,
∴两人的平均成绩相等,但甲的成绩比较稳定,派甲参加比较合适.
(六)样本的数字特征
例6 【2014年全国新课标Ⅰ卷】从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
频数
6
26
38
22
8
(I)在答题卡上作出这些数据的频率分布直方图:
(Ⅱ)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(Ⅲ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
【答案】(1)
(2)质量指标值的样本平均数为100,质量指标值的样本方差为104
(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
【解析】(1)
(3)质量指标值不低于95的产品所占比例的估计值为
,
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品”的规定.
【方法技巧归纳】(1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征;(2)平均数和每一个数据都有关,可以反映样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低;(3)标准差、方差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据越分散,标准差、方差越小,数据越集中.
【变式1】【背景变了,同时变为与茎叶图和古典概型结合】某高职院校进行自主招生文化素质考试,考试内容为语文、数学、英语三科,总分为200分.现从上线的考生中随机抽取20人,将其成绩用茎叶图记录如下:
男
女
15
6
5
4
16
3
5
8
8
2
17
2
3
6
8
8
8
6
5
18
5
7
19
2
3
(Ⅰ)计算上线考生中抽取的男生成绩的方差;(结果精确到小数点后一位)
(Ⅱ)从上述茎叶图180分以上的考生中任选2人作为考生代表出席座谈会,求所选考生恰为一男一女的概率.
【答案】(1)(2)
【解析】(Ⅰ)依题意:样本中男生共6人,成绩分别为164、165、172、178、185、186.他们的总分为1050,平均分为175.
.
(Ⅱ)样本中180分以上的考生有男生2人,记为、,女生4人,记为、、、,从中任选2人,有、、、、、、、、、、、、、、共15种,
符合条件的有: 、、、、、、、8种,
故所求概率.
【变式2】【变所求问题为平均数与方差的在实际中应用】某研究小组为了研究某品牌智能手机在正常使用情况下的电池供电时间,分别从该品牌手机的甲、乙两种型号中各选取部进行测试,其结果如下:
甲种手机供电时间(小时)
乙种手机供电时间(小时)
(1)求甲、乙两种手机供电时间的平均值与方差,并判断哪种手机电池质量好;
(2)为了进一步研究乙种手机的电池性能,从上述部乙种手机中随机抽取部求这两部手机中恰有一部手机的供电时间大于该种手机供电时间平均值的概率.
【答案】(1)甲种手机电池质量更好 (2)所求概率为
(2)由题意得上述部乙种手机中有部手机的供电时间大于该种手机供电时间平均值,记它们分别是,其余的为,
从上述部乙种手机中随机抽取部的所有结果为 ,共有种,
其中恰有一部手机的供电时间大于该种手机供电时间平均值的结果为 ,共有种,
所以所求概率为.
【数学思想】
1.方程思想的应用:在频率分布直方图中的计算、系数抽样与分层抽样中的计算、样本的数字特征等方面都可能用到方程的思想;
2.数形结合思想的应用:数据的收集与整理常常利用茎叶图的来处理、样本和数数据常常利用频率分布直方图进行直观展示.
【典例试题演练】
1.【陕西省榆林市第二中学2018届高三上学期期中】某方便面生产线上每隔15分钟抽取一包进行检验,则该抽样方法为①:从某中学的40名数学爱好者中抽取5人了解学习负担情况,则该抽样方法为②,那么①和②分别为( )
A. ①系统抽样,②分层抽样 B. ①分层抽样,②系统抽样
C. ①系统抽样,②简单随机抽样 D. ①分层抽样,②简单随机抽样
【答案】C
【解析】由随机抽样的特征可知,①为等距抽样,是系统抽样;②是简单随机抽样,故选C.
2.【辽宁省鞍山市第一中学2017届高三下学期最后一次模拟】2017年2月为确保食品安全,鞍山市质检部门检查1000袋方便面的质量,抽查总量的2%,在这个问题中,下列说法正确的是( )
A. 总体是指这箱1000袋方便面 B. 个体是一袋方便面
C. 样本是按2%抽取的20袋方便面 D. 样本容量为20
【答案】D
【解析】由题意结合基本概念的定义:总体是指这箱1000包装食品的质量,A错误;个体是指一件包装食品的质量,B错误;样本是指按照2%抽取的20件包装食品的质量,C错误;样本容量为20,D正确,故选D.
3.【2018届江西九江高三上期模拟】从总体为的一批零件中使用简单随机抽样抽取一个容量为40的样本,若某个零件在第2次抽取时被抽到的可能性为1%,则( )
A. 100 B. 4000 C. 101 D. 4001
【答案】B
【解析】 因为从总体为的一批零件中使用简单随机抽样抽取一个容量为的样本, 某个零件第 次抽取的可能性为,所以,解得,故选B.
4.【云南省玉溪第一中学2018届高三上学期第一次月考】总体由编号为的各个体组成,利用随机数表(以下摘取了随机数表中第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第9列和第10列数字开始由左向右读取,则选出来的第4个个体的编号为
A. B. C. D.
【答案】B
【解析】从随机数表第1行的第9列和第10列数字开始,依次是14,05,11,09,则第四个数字是09,选B.
5.【2017届贵州遵义市高三上期中】某校高三年级有1000名学生,随机编号为0001,0002,...,1000,现按系统抽样方法,从中抽出200人,若0122号被抽到了,则下列编号也被抽到的是( )
A. 0927 B. 0834 C. 0726 D. 0116
【答案】A
【解析】 样本间隔为,因为余,所以抽取的余数应是的号码, 余余,所以在下列编号也被抽到的是,故选A.
6.【江西省宜春昌黎实验学校2018届高三第二次段考】某中学高一年级560人,高二年级540人,高三年级520人,用分层抽样的方法抽取容量为81的样本,则在高一、高二、高三三个年级抽取的人数分别为( )
A. 28、27、26 B. 28、26、24 C. 26、27、28 D. 27、26、25
【答案】A
7.【2017届辽宁省重点高中协作校高三上学期期末】如图描述的是我国2014年四个季度与2015年前三个季度三大产业累计同比贡献率,以下结论正确的是 ( )
A. 2015年前三个季度中国累计比较2014年同期增速有上升的趋势
B. 相对于2014年,2015年前三个季度第三产业对的贡献率明显增加
C. 相对于2014年,2015年前三个季度第二产业对的贡献率明显增加
D. 相对于2014年,2015年前三个季度第一产业对的贡献率明显增加
【答案】B
【解析】通过图形可以看出,最后三个条形中,白色条形所占的比重明显比前四个条形所占比重要大,即相对于2014年,2015年前三个季度第三产业对的贡献率明显增加,故选B.
8.【宁夏石嘴山一中2017届高三第二次模拟】是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在惠农县、平罗县两个地区附近的监测点统计的数据(单位:毫克/立方米)列出的茎叶图,惠农县、平罗县两个地区浓度的方差较小的是( )
A. 惠农县 B. 平罗县
C. 惠农县、平罗县两个地区相等 D. 无法确定
【答案】A
【解析】根据茎叶图中的数据可知,惠农县的数据都集中在0.06和0.07之间,数据分布比较稳定,而平罗县的数据分布比较分散,不如惠农县数据集中,∴惠农县的方差较小,故选A.
9.【河南省郑州市第一中学2018届高三上学期第二次月考】为了调查民众对最新各大城市房产限购政策的了解情况,对甲、乙、丙、丁四个不同性质的单位做分层抽样调查.假设四个单位的人数有如下关系:甲、乙的人数之和等于丙的人数,甲丁的人数之和等于乙、丙的人数之和,且丙单位有36人,若在甲、乙两个单位抽取的人数之比为1:2,则这四个单位的总人数为( )
A. 96 B. 120 C. 144 D. 160
【答案】B
10.【四川省成都市龙泉第二中学2018届高三10月月考】某校为了解本校高三学生学习的心理状态,采用系统抽样方法从人中抽取人参加某种测试,为此将他们随机编号为,分组后在第一组采用简单随机抽样的方法抽到的号码为,抽到的人中,编号落在区间的人做试卷,编号落在的人做试卷,其余的人做试卷,则做试卷的人数为( )
A. B. C. D.
【答案】B
【解析】, 由题意可得抽到的号码构成以为首项,以为公差的等差数列,且此
等差数列的通项公式为,落入区间的人做问卷,由,即,解得,再由为正整数可得, 做问卷的人数为,故选B.
11.【贵州省黔东南州2018届高三上学期第一次联考】近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图,其中年龄在岁的有2500人,年龄在岁的有1200人,则的值为( )
A. 0.013 B. 0.13 C. 0.012 D. 0.12
【答案】C
【解析】由题意,得年龄在范围岁的频率为,则赞成高校招生改革的市民有,因为年龄在范围岁的有1200人,则,故选C.
12.【天津市十二重点中学2017届高三第二次联考】甲、乙两名篮球运动员在10场比赛中得分的茎叶图如图所示,则“”是“甲运动员得分平均数大于乙运动员得分平均数”的( )
A. 充分不必要条件 B. 必要不充分条件
C. 充分必要条件 D. 既不充分也不必要条件
【答案】A
【解析】当 时,可得甲的平行数为 ,乙的平行数为, ,可得甲的平行数大于乙的平行数;若甲的平行数大于乙的平行数可得,即 或 ,所以“”是甲的平均分大于乙的平均分的充分不必要条件,故选A.
13.【2017届湖南省衡阳市高三下学期第二次联考】一组数据共有7个数,记得其中有10、2、5、2、4、2,还有一个数没记清,但知道这组数的平均值、中位数、众数依次成等差数列,这个数的所有可能值的和为( )
A. B. 3 C. 9 D. 17
【答案】C
【解析】设没记清的数为,若,则这列数: ,2,2,2,4,5,10,平均数为,中位数为2,众数为2,所以, ,若,则这列数为2,2,2, ,4,5,10,则平均数为,中位数为,众数为2,所以,若,则这列数为 2,2,2,4,5, ,10,或 2,2,2,4,5,10, ,则平均数为,中位数4,众数2,所以,所以,故选C.
14.【吉林省东北师范大学附属中学2017届高三下学期第三次模拟】为了解甲、乙、丙三个小区居民的生活成本,现分别对甲、乙、丙三个小区进行了“家庭每周日常消费额”的调查.将调查所得到的数据分别绘制成频率分布直方图(如图),若甲、乙、丙所调查数据的标准差分别为, , ,则它们的大小关系为( )
A. B. C. D.
【答案】A
15.【北京市昌平区2017年高三第二次统一练习】某校从高三年级中随机选取200名学生,将他们的一模数学成绩绘制成频率分布直方图(如图). 由图中数据可知__________ .若要从成绩在三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从成绩在内的学生中选取的人数应为__________ .
【答案】
【解析】直方图中各个矩形的面积之和为, ,解得,由直方图可知,身高在范围内抽取的学生人数占三个区域内总人数的,.
16.【四川省成都市2017届高三第二次诊断性检测】在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1,那么这组数据的方差可能的最大值是__________.
【答案】32.8
【解析】设这组数据的最后两个分别是: , ,则,得: ,故,故,显然最大取时, 有最大值.
17.【河北省唐山市2016-2017学年度高三年级第二次模拟】共享单车的出现方便了人们的出行,深受我市居民的喜爱.为调查某校大学生对共享单车的使用情况,从该校8000名学生中按年级用分层抽样的方式随机抽取了100位同学进行调查,得到这100名同学每周使用共享单车的时间(单位:小时)如表:
使用时间
人数
10
40
25
20
5
(Ⅰ)已知该校大一学生由2400人,求抽取的100名学生中大一学生人数;
(Ⅱ)作出这些数据的频率分布直方图;
(Ⅲ)估计该校大学生每周使用共享单车的平均时间(同一组中的数据用该组区间的中点值作代表).
【答案】(Ⅰ)30人;(Ⅱ)见解析;(Ⅲ)4.4小时.
【解析】(Ⅰ)设抽取的100名学生中大一学生有人,则,解得,
所以抽取的100名学生中大一学生有30人.
(Ⅱ)频率分布直方图如图所示.
(Ⅲ),
所以该校大学生每周使用共享单车的平均时间大约为4.4小时.
18.【云南省昆明一中2018届高三第一次摸底测试】某市为了解本市2万名学生的汉字书写水平,在全市范围内进行了汉字听写考试,现从某校随机抽取了50名学生,将所得成绩整理后,发现其成绩全部介于之间,将其成绩按如下分成六组,得到频数分布表
成绩
人数
4
10
16
10
6
4
(1)在答题卡上作出这些数据的频率分布直方图;
(2)估算该校50名学生成绩的平均值和中位数(同一组中的数据用该组区间的中点值作代表);
(3)以该校50名学生成绩的频率作为概率,试估计该市分数在的人数.
【答案】(1)见解析(2)平均值68.2 中位数66.875(3)4000
【解析】(Ⅰ)
(Ⅱ);
由已知可设中位数为,则;
所以,所求中位数为.
(Ⅲ)该市分数在的人数,故所求人数为人.
19.【四川省(大教育联盟)邻水实验学校2018届高三上学期第三次月考】某市对创“市级优质学校”的甲、乙两所学校复查验收,对办学的社会满意度一项评价随机访问了位市民,根据这
位市民对这两所学校的评分(评分越高表明市民的评价越好),绘制茎叶图如下:
(1)分别估计该市的市民对甲、乙两所学校评分的中位数;
(2)分别估计该市的市民对甲、乙两所学校的评分不低于分的概率;
(3)根据茎叶图分析该市的市民对甲、乙两所学校的评价.
【答案】(1)76;(2);(3)见解析
(3)由所给茎叶图知,该市市民对甲学校的评分的中位数高于对乙学校的评分的中位数,而且由茎叶图可以大致看出市民对甲学校的评分标准差要小于对乙学校的评分的标准差,说明该市的市民对甲学校的评价较高、评价较为一致,对乙学校的评价较低、评价差异较大.
20.【2017年湖北省武汉市武昌区高三1月调研】我国上是世界严重缺水的国家,城市缺水问题较为突出,某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准(吨),用水量不超过的部分按平价收费,超过的部分按议价收费,为了了解全市民月用水量的分布情况,通过抽样,获得了100位居民某年的月用水量(单位:吨),将数据按照, ,…, 分成9组,制成了如图所示的频率分布直方图.
(Ⅰ)求直方图中 的值;
(Ⅱ)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(Ⅲ)若该市政府希望使的居民每月的用水量不超过标准(吨),估计的值,并说明理由;
【答案】(Ⅰ);(Ⅱ) 人 ;(Ⅲ) 估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
【解析】(Ⅰ)由频率分布直方图,可得
,解得.
(Ⅱ)由频率分布直方图可知,100位居民每人月用水量不低于3吨的人数为
,
由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为
.
(Ⅲ) 前6组的频率之和为 ,
而前5组的频率之和为 ,
由 ,解得,
因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.