• 1.17 MB
  • 2021-06-24 发布

高考文科数学专题复习练习2简单随机抽样

  • 32页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
147 简单随机抽 样 1.(2015 河南十校测试(四),文 3,简单随机抽样,选择题)对一个容量为 50 的总体抽取容量为 10 的样本, 当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概 率分别为 p1,p2,p3,则(  )                  A.p1=p2=p3 B.p1=p21”的概率. 解:(1)由直方图知成绩在[14,16)内的人数为 50×0.16+50×0.38=27,所以该班成绩良好的人数为 27 人. (4 分) (2)由直方图知成绩在[13,14)内的人数为 50×0.06=3,分别记为 x,y,z; 成绩在[17,18]内的人数为 50×0.08=4 人,分别记为 A,B,C,D, 当 m,n∈[13,14)时,有 xy,xz,yz,3 种情况; 当 m,n∈[17,18]时,有 AB,AC,AD,BC,BD,CD,6 种情况; 当 m,n 分别在[13,14)和[17,18]内时,情况如下表所示: A B C D xxAxBxCx D yyAyByCy D z zA zB zC zD 结合表格可知满足要求的共有 12 种情况,而基本事件总数为 21 种.∴P(|m-n|>1)=12 21 = 4 7. (12 分) 4.(本小题满分 12 分)(2015 山西 3 月质量监测,文 19,频率分布直方图,解答题)某市为了节约能源,拟出 台“阶梯电价”制度,即制定住户月用电量的临界值 a.若某住户某月用电量不超过 a 千瓦时,则按平价 计费;若某月用电量超过 a 千瓦时,则超出部分按议价计费,未超出部分按平价计费.为确定 a 的值,随 机调查了该市 100 户的月用电量,工作人员已将 90 户的月用电量填在了下面的频率分布表中,最后 10 户的月用电量(单位:千瓦时)为 18 63 43 119 65 77 29 97 52 100 组 别 月用电 量 频数统计 频 数 频 率 ① [0,20) ② [20,40) ③ [40,60) ④ [60,80) ⑤ [80,100) ⑥ [100,120) (1)完成频率分布表并绘制频率分布直方图; (2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表); (3)若该市计划让全市 75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值 a. 解:(1) 组 别 月用电 量 频数统计 频 数 频 率 ① [0,20) 4 0.04 ② [20,40) 12 0.12 ③ [40,60) 24 0.24 ④ [60,80) 30 0.30 ⑤ [80,100) 25 0.25 ⑥ [100,120) 5 0.05 (2)由题意用每小组的中点值代表该小组的平均用电量,则 100 户住户组成的样本的平均用电量 为 10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65 千瓦时,用样本估计总体,可知全市 居民的平均月用电量约为 65 千瓦时. (9 分) (3)计算累计频率,可得下表: 分 组 [0,20 ) [20,40 ) [40,60 ) [60,80 ) [80,100 ) [100,120 ] 频 率0.04 0.12 0.24 0.30 0.25 0.05 累 计 频 率 0.04 0.16 0.40 0.70 0.95 1.00 由此可知临界值 a 应在[80,100)内,且频率分布直方图中,在临界值 a 左侧的总面积(频率)为 0.75, 故有 0.7+(a-80)×0.012 5=0.75,解得 a=84,由样本估计总体可得临界值 a 为 84. (12 分) 5.(本小题满分 12 分)(2015 山西二测,文 19,频率分布直方图,解答题)期中考试后,某教师对其所教班级 50 名学生的考试成绩(单位:分)进行分析整理,得到如下的频率分布直方图,其中分组情况为 [60,70),[70,80),[80,90),[90,100),[100,110),[110,120]. (1)根据图中的信息,估计该班学生成绩的平均分; (2)若从成绩不低于 100 的学生中任选 2 名学生,求这两名学生成绩都低于 110 的概率. 解:(1)由图可得(0.004+0.008+p+0.02+0.024+0.032)×10=1, (1 分) ∴p=0.012, (2 分) ∴该班学生成绩的平均分大约为 x=65×0.08+75×0.2+85×0.32+95×0.24+105×0.12+115×0.04(5 分) =87.4. (6 分) (2)由题意得成绩在[100,110)内的人数为 50×0.012×10=6,记这 6 人分别为 A1,A2,A3,A4,A5,A6,成绩 在[110,120]内的人数为 50×0.004×10=2,记这 2 人分别为 B1,B2, (8 分) 则成绩不低于 100 分的学生共有 8 人,从中任选 2 人的基本事件为 A1A2,A1A3,A1A4,A1A5,A1A6,A1B1,A1B2,A2A3,A2A4,A2A5,A2A6,A2B1,A2B2,A3A4,A3A5,A3A6,A3B1,A3B2,A4A5,A4A6, A4B1,A4B2,A5A6,A5B1,A5B2,A6B1,A6B2,B1B2,共有 28 个, (10 分) 其中两人成绩都低于 110 分的基本事件为 A1A2,A1A3,A1A4,A1A5,A1A6,A2A3,A2A4,A2A5,A2A6,A3A4,A3A5,A3A6,A4A5,A4A6,A5A6,共有 15 个, (11 分) 所以从成绩不低于 100 的学生中任选 2 人的成绩都低于 110 的概率为 P=15 28. (12 分) 6.(本小题满分 12 分)(2015 山西太原模拟(一),文 18,频率分布直方图,解答题)为了考察某厂 2 000 名 工人的生产技能情况,随机抽查了该厂 n 名工人某天的产量(单位:件),整理后得到如下的频率分布直 方图(产量的分组区间分别为[10,15),[15,20),[20,25),[25,30),[30,35]),其中产量在[20,25)的工人有 6 名. (1)求这一天产量不小于 25 的工人人数; (2)工厂规定从产量低于 20 件的工人中选取 2 名工人进行培训,求这 2 名工人不在同一分组的概率. 解:(1)由题意得,产量为[20,25)的频率为 0.06×5=0.3, (1 分) ∴n= 6 0.3=20, (3 分) ∴这一天产量不小于 25 的工人人数为(0.05+0.03)×5×20=8. (6 分) (2)由题意得,产量在[10,15)的工人人数为 20×0.02×5=2,记他们分别是 A,B,产量在[15,20)的工人 人数为 20×0.04×5=4,记他们分别是 a,b,c,d, (8 分) 则从产量低于 20 件的工人中选取 2 位工人的结果为 (A,B),(A,a),(A,b),(A,c),(A,d),(B,a),(B,b),(B,c),(B,d),(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),共有 15 种不同的结果, (10 分) 其中 2 位工人不在同一分组的结果为(A,a),(A,b),(A,c),(A,d),(B,a),(B,b),(B,c),(B,d),共有 8 种, ∴所求概率为 P= 8 15. (12 分) 7.(本小题满分 12 分)(2015 江西赣州摸底考试,文 19,频率分布直方图,解答题)为了解某校高三毕业生 报考体育考业学生的体重(单位:千克),将他们的体重数据整理后得到如下频率分布直方图.已知图中 从左到右前 3 个小组的频率之比为 1∶2∶3,其中第二小组的频数为 12. (1)求该校报考体育专业学生的总人数 n; (2)已知 A,a 是该校报考体育专业的两名学生,A 的体重小于 55 千克,a 的体重不小于 70 千克.现从该 校报考体育专业的学生中按分层抽样分别抽取小于 55 千克和不小于 70 千克的学生共 6 名,然后再 从这 6 人中抽取体重小于 55 千克的学生 2 人,体重不小于 70 千克的学生 1 人组成 3 人训练组,求 A 在训练组且 a 不在训练组的概率. 解:(1)由图知第四组的频率为 0.037 5×5=0.187 5, 第五组的频率为 0.012 5×5=0.062 5, (3 分) 又由条件知前三组的频率分别为 0.125,0.25,0.375, 所以 n= 12 0.25=48. (5 分) (2)易知按分层抽样抽取 6 名体重小于 55 千克和不小于 70 千克的学生中,体重小于 55 千克的学 生 4 人,记为 A,B,C,D,体重不小于 70 千克的学生 2 人,记为 a,b, (6 分) 从中抽取满足条件的所有结果有 (A,B,a),(A,B,b),(A,C,a),(A,C,b),(A,D,a),(A,D,b),(B,C,a),(B,C,b),(B,D,a),(B,D,b),(C,D,a),(C,D,b),共 12 种, (10 分) 所求事件的概率为 P= 3 12 = 1 4. (12 分) 8.(本小题满分 12 分)(2015 河北保定一模,文 18,频率分布直方图,解答题)随着经济发展带来的环境问 题,我国很多城市提出了大力发展城市公共交通的理念,同时为了保证不影响市民的正常出行,就要求 对公交车的数量必须进行合理配置.为此,某市公交公司在某站台随机对 20 名乘客进行了调查,其已 候车时间情况如下表所示(单位:分钟): 组 别 已候车时 间 人 数 Ⅰ [0,5) 4 Ⅱ [5,10) 6 Ⅲ [10,15) 6 Ⅳ [15,20) 3 Ⅴ [20,25] 1 (1)画出已候车时间的频率分布直方图; (2)求这 20 名乘客的平均已候车时间; (3)在这 20 名乘客中随机抽查一人,求其已候车时间不少于 15 分钟的概率. 解:(1)频率分布直方图如图. (2) 1 20×(2.5×4+7.5×6+12.5×6+17.5×3+22.5×1)=10.25 分钟. (8 分) (3)候车时间不少于 15 分钟的概率为3 + 1 20 = 1 5. (12 分) 9.(2015 河南高考适应性测试,文 3,频率分布直方图,选择题)某中学为了检验 1 000 名在校高三学生对 函数模块掌握的情况,进行了一次测试,并把成绩进行统计,得到的样本频率分布直方图如图所示,则 考试成绩的众数大约为 (  ) A.55 B.65 C.75 D.85 解析:由频率分布直方图得样本数据的众数位于[70,80]内,则样本的众数约为 75,故选 C. 答案:C 10.(本小题满分 12 分)(2015 江西南昌一模,文 18,频率分布直方图,解答题)某市教育局为了了解高三 学生体育达标情况,在某学校的高三学生体育达标成绩中随机抽取 50 个进行调研,按成绩分组:第 1 组[75,80),第 2 组[80,85),第 3 组[85,90),第 4 组[90,95),第 5 组[95,100]得到的频率分布直方图如图所示, 若要在成绩较高的第 3,4,5 组中用分层抽样抽取 6 名学生进行复查. (1)已知学生甲和学生乙的成绩均在第五组,求学生甲或学生乙被选中复查的概率; (2)在已抽取到的 6 名学生中随机抽取 2 名学生接受篮球项目的考核,求其中一人在第三组,另一人在 第四组的概率. 解:(1)设“学生甲或学生乙被选中复查”为事件 A, 第三组人数为 50×0.06×5=15, 第四组人数为 50×0.04×5=10, 第五组人数为 50×0.02×5=5, (2 分) 根据分层抽样知,第三组应抽取 3 人,第四组应抽取 2 人,第五组应抽取 1 人, (4 分) 所以 P(A)=2 5. (6 分) (2)记第三组选中的三人分别是 A1,A2,A3,第四组选中的二人分别为 B1,B2,第五组选中的人为 C,从 这六人中选出两人,有以下基本事 件:A1A2,A1A3,A1B1,A1B2,A1C,A2A3,A2B1,A2B2,A2C,A3B1,A3B2,A3C,B1B2,B1C,B2C,共 15 个基本事件, (9 分) 符合一人在第三组一人在第四组的基本事件有 A1B1,A1B2,A2B1,A2B2,A3B1,A3B2,共 6 个, 所以所求概率 P= 6 15 = 2 5. (12 分) 11.(本小题满分 12 分)(2015 甘肃兰州实战,文 19,频率分布直方图,解答题)据统计某校学生在上学路 上所需时间最多不超过 120 分钟.该校随机抽取部分新入校的新生就其在上学路上所需时间(单位:分 钟)进行调查,并将所得数据绘制成频率分布直方图. (1)求频率分布直方图中 a 的值; (2)为减轻学生负担,学校规定在上学路上所需时间不少于 1 小时的学生可申请在校内住宿.请根据抽 样数据估计该校 600 名新生中有多少学生可申请在校内住宿. 解:(1)由频率分布直方图可得(0.001 4+0.002 1+0.003 0+0.006 0+a+0.025 0)×20=1, a=0.012 5. (5 分) (2)新生上学所需时间不少于 1 小时的频率为 (0.003 0+0.002 1+0.001 4)×20=0.13, (9 分) 所以该校 600 名新生中可申请在校内住宿的人数约为 600×0.13=78. (12 分) 12.(本小题满分 12 分)(2015 贵州贵阳高三适应性检测考试(二),文 18,频率分布直方图,解答题)A 市积 极倡导学生课外读优秀书籍活动,从参加此活动同学中,抽取 60 名同学在读书活动月中的课外读书时 间(分钟,均为整数)分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到频率分布直方图(如 图),回答下列问题. (1)从频率分布直方图中,估计本次课外读优秀书籍活动时间的中位数; (2)若从第 1 组和第 6 组两组学生中,随机抽取 2 人,求所抽取 2 人课外读书时间之差的绝对值大于 10(分钟)的概率. 解:(1)由频率分布直方图知前三组的频率之和为 (0.01+0.015+0.015)×10=0.4, ∴中位数在第四组,设中位数为 70+x, 则 0.4+0.030x=0.5,∴x=10 3 , 中位数为 70+x=70+10 3 = 220 3 . (6 分) (2)第 1 组:60×0.1=6 人,设为 A,B,C,D,E,F; 第 6 组:60×0.05=3 人,设为 X,Y,Z. 基本事件共有 36 个,满足条件的有 18 个, ∴概率为 P=18 36 = 1 2. (12 分) 13.(本小题满分 12 分)(2015 吉林长春质量监测(二),文 18,频率分布直方图,解答题)根据某电子商务平 台的调查统计显示,参与调查的 1 000 位上网购物者的年龄情况如图所示. (1)已知[30,40),[40,50),[50,60)三个年龄段的上网购物者人数成等差数列,求 a,b 的值; (2)该电子商务平台将年龄在[30,50)之间的人群定义为高消费人群,其他的年龄段定义为潜在消费人 群,为了鼓励潜在消费人群的消费,该平台决定发放代金券,高消费人群每人发放 50 元的代金券,潜在 消费人群每人发放 100 元的代金券,现采用分层抽样的方式从参与调查的 1 000 位上网购物者中抽取 5 人,并在这 5 人中随机抽取 3 人进行回访,求此三人获得代金券总和为 200 元的概率. 解:(1)由图可知 a=0.035,b=0.025. (4 分) (2)利用分层抽样从样本中抽取 5 人,其中属于高消费人群的为 3 人,属于潜在消费人群的为 2 人. (6 分) 令高消费的人为 A,B,C,潜在消费的人为 a,b,从中取出三人,总共有 ABC,ABa,ABb,ACa,ACb,BCa,BCb,Aab,Bab,Cab,10 种情况, (8 分) 其中 ABa,ABb,ACa,ACb,BCa,BCb 为获得代金券总和为 200 元的情况, (10 分) 因此,三人获得代金券总和为 200 元的概率为3 5. (12 分) 14.(2015 甘肃第二次诊断考试,文 13,频率分布直方图,填空题)某商场在庆元宵节促销活动中,对元宵 节 9 时至 14 时的销售额进行统计,其频率分布直方图如图所示,已知 9 时至 10 时的销售额为 2.5 万 元,则 11 时至 12 时的销售额为     万元. 解析:由直方图可得 11 时到 12 时的频率是 9 时到 10 时的 4 倍,则 11 时到 12 时的销售额为 2.5×4=10 万元. 答案:10 151 茎叶 图 1.(本小题满分 12 分)(2015 河南十校测试(四),文 18,茎叶图,解答题)为备战某次运动会,市体育局组建 了一个由 4 个男运动员和 2 个女运动员组成的 6 人代表队并进行备战训练. (1)经过备战训练,从 6 人中随机选出 2 人进行成果检验,求选出的 2 人中至少有 1 个女运动员的概率; (2)检验结束后,甲、乙两名运动员的成绩茎叶图如图所示,请问哪位运动员的成绩更稳定,并说明理由. 解:(1)把 4 个男运动员和 2 个女运动员分别记为 a1,a2,a3,a4 和 b1,b2,则基本事件包括 (a1,a2),(a1,a3),(a1,a4),(a1,b1),(a1,b2),(a2,a3),(a2,a4),(a2,b1),(a2,b2),(a3,a4),(a3,b1),(a3,b2),(a4,b1),(a4,b2),(b1,b2), 共 15 种,至少有 1 个女运动员的情况有 9 种,故至少有 1 个女运动员的概率 P= 9 15 = 3 5. (6 分) (2)由题意知,푥甲 = 68 + 70 + 71 + 72 + 74 5 =71, 푥乙 = 69 + 70 + 70 + 72 + 74 5 =71, 푠2甲 = 1 5[(68-71)2+(70-71)2+(71-71)2+(72-71)2+(74-71)2]=4, 푠2乙 = 1 5[(69-71)2+(70-71)2+(70-71)2+(72-71)2+(74-71)2]=3.2, ∵푥甲 = 푥乙,푠2甲 > 푠2乙,故乙运动员的成绩更稳定. (12 分) 2.(本小题满分 12 分)(2015 河北衡水中学二模,文 18,茎叶图,解答题)现从某 100 件中药材中随机抽取 10 件,以这 10 件中药材的质量(单位:克)作为样本,样本数据的茎叶图如下: (1)求样本数据的中位数、平均数,并估计这 100 件中药材的总质量; (2)记质量在 15 克以上的中药材为优等品,在该样本的优等品中,随机抽取 2 件,求这 2 件中药材的质 量之差不超过 2 克的概率. 解:(1)样本数据的中位数是12 + 17 2 =14.5. (2 分) 样本数据的平均数是 8 + 9 + 10 + 12 + 12 + 17 + 18 + 20 + 21 + 23 10 =15. (4 分) 由样本估计总体可得这 100 件中药材质量的平均数是 15 克,因此,估计这 100 件中药材的总质量 约为 100×15=1 500 克. 答:样本数据的中位数、平均数分别是 14.5,15,估计这 100 件中药材的总质量是 1 500 克. (6 分) (2)这 10 件中药材的优等品的质量有 17 克、18 克、20 克、21 克、23 克. 从 10 件中药材的优等品中随机抽取 2 件,所有基本事件有 (17,18),(17,20),(17,21),(17,23),(18,20),(18,21),(18,23),(20,21),(20,23),(21,23),共 10 个. (8 分) 记“2 件优等品的质量之差不超过 2 克”为事件 A,则事件 A 的基本事件有 (17,18),(18,20),(20,21),(21,23),共 4 个. (10 分) 所以 P(A)= 4 10 = 2 5. 答:这两件中药材的质量之差不超过 2 克的概率为2 5. (12 分) 3.(本小题满分 12 分)(2015 山西四校三联,文 18,茎叶图,解答题)如图,茎叶图记录了甲、乙两组各四名 同学完成某道数学题(满分 12 分)的得分情况.乙组某个数据的个位数模糊,记为 x,已知甲、乙两组的 平均成绩相同. (1)求 x 的值,并判断哪组学生成绩更稳定; (2)在甲、乙两组中各抽出一名同学,求这两名同学的得分之和低于 20 分的概率. 解:(1)푥甲 = 9 + 9 + 11 + 11 4 =10, 푥乙 = 8 + 9 + 12 + 10 + 푥 4 =10. ∴x=1. (2 分) 又푠2甲 = 1 4[(10-9)2+(10-9)2+(11-10)2+(11-10)2]=1, 푠2乙 = 1 4[(10-8)2+(10-9)2+(11-10)2+(12-10)2]=5 2. (4 分) ∴푠2甲 < 푠2乙,∴甲组成绩比乙组稳定. (6 分) (2)记甲组 4 名同学分别为 A1,A2,A3,A4;乙组 4 名同学分别为 B1,B2,B3,B4,分别从甲乙两组中各抽 取一名同学所有可能的结果为 (A1,B1),(A1,B2),(A1,B3),(A1,B4),(A2,B1),(A2,B2),(A2,B3),(A2,B4),(A3,B1),(A3,B2),(A3,B3),(A3,B4),(A4,B1),(A4,B2), (A4,B3),(A4,B4),共 16 个基本事件,其中得分之和低于 20 分的共 6 个基本事件, (10 分) ∴得分之和低于 20 分的概率为 P= 6 16 = 3 8. (12 分) 4.(2015 河南郑州第二次质量检测,文 4,茎叶图,选择题)已知甲、乙两组数据如茎叶图所示,若它们的 中位数相同,平均数也相同,则图中的 m,n 的比值푚 푛=(  ) A.1 B.1 3 C.3 8 D.2 9 解析:依题意得{1 3(96 + 푚) = 1 4(124 + 푛), 30 + 푚 = 1 2(32 + 34), 解得 m=3,n=8,因此푚 푛 = 3 8,故选 C. 答案:C 5.(2015 河南平顶山、许昌、新乡二调,文 4,茎叶图,选择题)甲、乙两位运动员在 5 场比赛的得分情 况如茎叶图所示,记甲、乙两人的平均得分分别为푥甲,푥乙,则下列判断正确的是(  ) A.푥甲 > 푥乙;甲比乙成绩稳定 B.푥甲 > 푥乙;乙比甲成绩稳定 C.푥甲 < 푥乙;甲比乙成绩稳定 D.푥甲 < 푥乙;乙比甲成绩稳定 解析:利用茎叶图和平均数、方差的公式、意义判断.由茎叶图可得푥甲 = 16 + 17 + 28 + 30 + 34 5 =25,푥乙 = 15 + 26 + 28 + 28 + 33 5 =26,所以푥甲 < 푥乙,且乙的成绩比甲稳定,故选 D. 答案:D 6.(本小题满分 12 分)(2015 河北石家庄一检,文 19,茎叶图,解答题)随机抽取某中学高三年级甲、乙两 班各 10 名同学,测量出他们的身高(单位:cm),获得身高数据的茎叶图如图.其中甲班有一个数据被污 损. (1)若已知甲班同学身高平均数为 170 cm,求污损处的数据; (2)现从乙班这 10 名同学中随机抽取两名身高不低于 173 cm 的同学,求身高为 176 cm 的同学被抽中 的概率. 解:(1)푥 =158 + 162 + 163 + 168 + 168 + 170 + 171 + 179 + 푎 + 182 10 =170, (4 分) 解得 a=179,所以污损处是 9. (6 分) (2)设“身高为 176 cm 的同学被抽中”的事件为 A, 从乙班 10 名同学中抽取两名身高不低于 173 cm 的同学有 {181,173},{181,176},{181,178},{181,179},{179,173},{179,176},{179,178},{178,173},{178,176},{176,1 73},共 10 个基本事件, (8 分) 而事件 A 含有 4 个基本事件, (10 分) 所以 P(A)= 4 10 = 2 5. (12 分) 7.(2015 河北石家庄二中一模,文 15,茎叶图,填空题)将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最 低分,7 个剩余分数的平均分为 91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中 以 x 表示,则 7 个剩余分数的方差为     . 解析:由茎叶图知1 7(87+94+90+91+90+90+x+91)=91,解得 x=4,所以 7 个剩余分数的方差为1 7[(91- 87)2+(91-94)2+(91-90)2+(91-91)2+(91-90)2+(91-94)2+(91-91)2]=36 7 . 答案:36 7 8.(本小题满分 12 分)(2015 河北石家庄二检,文 18,茎叶图,解答题)我国城市空气污染指数范围及相应 的空气质量类别见下表: 空气污染指 数 空气质 量 空气污染指 数 空气质量 0~50 优 201~250 中度污染 51~100 良 251~300 中度重污 染 101~150 轻微污 染 >300 重污染 151~200 轻度污 染 我们把某天的空气污染指数在 0~100 时称作 A 类天,101~200 时称作 B 类天,大于 200 时称作 C 类天. 如图是从某市 2014 年全年的监测数据中随机抽取的 18 天数据的样本茎叶图(百位为茎、十、个位 为叶). (1)计算这 18 天样本数据的平均数和中位数; (2)从 A 类天和 B 类天中任取两天,求至少一天是 A 类天的概率. 解:(1)18 天的数据总和为 32+68+90+100×5+12+38+67+73+90+200×5+12+38+52+78+80+300×3+30+47+63+400×2+67+93 =4 230. (2 分) 所以这些数据的平均数为 4 230÷18=235. (4 分) 从小到大第 9,10 个数为 212,238,所以中位数是 225. (6 分) (2)A,B 类天共 8 天,设它们为 A1,A2,A3;B1,B2,B3,B4,B5. 从 A 类天和 B 类天中任取两天的所有情况有 (A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A1,B5),(A2,A3),(A2,B1),(A2,B2),(A2,B3),(A2,B4),(A2,B 5),(A3,B1),(A3,B2),(A3,B3),(A3,B4),(A3,B5),(B1,B2),(B1,B3),(B1,B4),(B1,B5),(B2,B3),(B2,B4),(B2,B5),(B 3,B4),(B3,B5),(B4,B5),共有 28 种. (8 分) 其中,至少有一天是 A 类天的取法数为 18 种, (10 分) 所以至少有一天是 A 类天的概率为 9 14. (12 分) 10.(本小题满分 12 分)(2015 山西太原二模,文 18,茎叶图,解答题)某网络广告 A 公司计划从甲、乙两 个网站选择一个网站拓展广告业务,为此 A 公司随机抽取了甲、乙两个网站某月中 10 天的日访问量 n(单位:万次),整理后得到如下茎叶图,已知 A 公司要从网站日访问量的平均值和稳定性两方面进行 考量选择. (1)请说明 A 公司应选择哪个网站; (2)现将抽取的样本分布近似看作总体分布,A 公司根据所选网站的日访问量 n 进行付费,其付费标准 如下: 选定网站的日访 问量 n(单位:万 次) A 公司的付费 标准(单位:元/ 日) n<25 500 25≤n≤35 700 n>35 1 000 求 A 公司每月(按 30 天计)应付给选定网站的费用 S. 解:(1)由茎叶图可知 푥甲=(15+24+28+25+30+36+30+32+35+45)÷10=30, 푠2甲 = 1 10×[(15-30)2+(24-30)2+(28-30)2+(25-30)2+(30-30)2+(36-30)2+(30-30)2+(32-30)2+(35- 30)2+(45-30)2]=58, (2 分) 푥乙=(18+25+22+24+32+38+30+36+35+40)÷10=30, 푠2乙 = 1 10×[(18-30)2+(25-30)2+(22-30)2+(24-30)2+(32-30)2+(38-30)2+(30-30)2+(36-30)2+(35- 30)2+(40-30)2]=49.8, (4 分) ∵푥甲 = 푥乙,푠2甲 > 푠2乙,∴A 公司应选择乙网站. (6 分) (2)由(1)得 A 公司应选择乙网站,由题意可得乙网站日访问量 n<25 的概率为 0.3,日访问量 35≤n≤35 的概率为 0.4,日访问量 n>35 的概率为 0.3, (9 分) ∴A 公司每月应付给乙网站的费用 S=30×(500×0.3+700×0.4+1 000×0.3)=21 900 元. (12 分) 11.(本小题满分 12 分)(2015 宁夏银川质量检测,文 19,茎叶图,解答题)为了比较两种复合材料制造的 轴承(分别称为类型Ⅰ轴承和类型Ⅱ承轴)的使用寿命,检验了两种类型轴承各 30 个,它们的使用寿命 (单位:百万圈)如下表: 类型Ⅰ 6.2 6.4 8.3 8.6 9.4 9.8 10.310.611.211.411.611.611.711.811. 8 12. 2 12.312.312.512.512.612.712.813.313.313.413.613.814.214. 5 类型Ⅱ 8.4 8.5 8.7 9.2 9.2 9.5 9.7 9.7 9.8 9.8 10.110.210.310.310. 4 10. 6 10.810.911.211.211.311.511.511.611.812.312.412.713.113. 4 (1)根据两组数据完成下面茎叶图; (2)分别估计两种类型轴承使用寿命的中位数; (3)根据茎叶图对两种类型轴承的使用寿命进行评价.解:(1)茎叶图. (4 分) (2)由茎叶图知,类型Ⅰ轴承的使用寿命按由小到大排序,排在第 15,16 位是 11.8,12.2,故中位数为 12,类型Ⅱ轴承的使用寿命按由小到大排序,排在第 15,16 位是 10.4,10.6,故中位数为 10.5. (8 分) (3)由所作茎叶图可知,类型Ⅰ轴承使用寿命的中位数高于类型Ⅱ轴承使用寿命的中位数,表明类 型Ⅰ轴承的使用寿命较长;由茎叶图可以大致看出类型Ⅰ轴承使用寿命的标准差大于类型Ⅱ轴承使 用寿命的标准差,表明类型Ⅱ轴承稳定性较好. (12 分) 12.(本小题满分 12 分)(2015 黑龙江哈尔滨第六中学二模,文 18,茎叶图,解答题)如图,茎叶图记录了甲、 乙两组各四名同学完成某道数学题的得分情况.乙组某个数据的个位数模糊,记为 x,已知甲、乙两组 的平均成绩相同. (1)求 x 的值,并判断哪组学生成绩更稳定; (2)在甲、乙两组中各抽出一名同学,求这两名同学的得分之和低于 20 分的概率. 解:(1)푥甲 = 1 4×(9+9+11+11)=10, 푥乙 = 푥甲 = 1 4×(8+9+10+x+12)=10, 解得 x=1,푠2甲=1,푠2乙=2.5,푠2甲 < 푠2乙,甲更稳定. (6 分) (2)3 8. (12 分) 152 样本的数字特 征 1.(2015 贵州贵阳高三适应性检测考试(二),文 13,样本的数字特征,填空题)数组 1,2,3,4,a 的平均数是 2, 则它的方差为     . 解析:由题意知1 + 2 + 3 + 4 + 푎 5 =2,得 a=0,所以其方差为(1 - 2)2 + (2 - 2)2 + (3 - 2)2 + (4 - 2)2 + (0 - 2)2 5 =2. 答案:2 2.(2015 江西南昌一模,文 13,样本的数字特征,填空题)若 1,2,3,4,m 这五个数的平均数为 3,则这五个数 的方差为     . 解析:利用平均数、方差公式求解. 由平均数是 3 可得 1+2+3+4+m=15,解得 m=5, 所以这五个数的方差为4 + 1 + 0 + 1 + 4 5 =2. 答案:2 3.(本小题满分 12 分)(2015 东北三省四市二联,文 18,样本的数字特征,解答题)某校甲、乙两个班级各 有 5 名编号分别为 1,2,3,4,5 的学生进行投篮训练,每人投 10 次,投中的次数统计如下表: 学 生 1 号 2 号 3 号 4 号 5 号 甲 班 6 5 7 9 8 乙 班 4 8 9 7 7 (1)从统计数据看,甲、乙两个班哪个班的同学投篮水平更稳定(用数据说明) (2)在本次训练中,从两班中分别任选一个同学,比较两人的投中次数,求甲班同学投中次数多于乙班同 学投中次数的概率. 解:(1)两个班数据的平均值都为 7, (2 分) 甲班的方差푠21 =(6 - 7)2 + (5 - 7)2 + (7 - 7)2 + (9 - 7)2 + (8 - 7)2 5 =2, (3 分) 乙班的方差푠22 =(4 - 7)2 + (8 - 7)2 + (9 - 7)2 + (7 - 7)2 + (7 - 7)2 5 =14 5 , (4 分) 因为푠21 < 푠22,甲班的方差较小,所以甲班的投篮水平比较稳定. (6 分) (2)甲班 1 到 5 号记作 a,b,c,d,e,乙班 1 到 5 号记作 1,2,3,4,5,从两班中分别任选一个同学,得到的 基本样本空间为 Ω={a1,a2,a3,a4,a5,b1,b2,b3,b4,b5,c1,c2,c3,c4,c5,d1,d2,d3,d4,d5,e1,e2,e3,e4,e5},Ω 由 25 个基本事件组成,这 25 个事件是等可能的; (8 分) 将“甲班同学投中次数高于乙班同学投中次数”记作 A,则 A={a1,b1,c1,d1,d2,d4,d5,e1,e4,e5},A 由 10 个基本事件组成, (10 分) 所以甲班同学投中次数高于乙班同学投中次数的概率为10 25 = 2 5. (12 分) 155 回归方程的求法及回归 分析 1.(2015 河南实验中学质量检测,文 5,回归方程的求法及回归分析,选择题)已知 x 与 y 之间的一组数据: x0 12 3 ym35.57 已求得关于 y 与 x 的线性回归方程为 ^ 푦=2.1x+0.85,则 m 的值为(  ) A.1 B.0.85 C.0.7 D.0.5 解析:利用线性回归方程经过中心点的性质求解. 由数据可得x = 3 2,代入线性回归方程得 ^ y=2.1×1.5+0.85=4,则 m+3+5.5+7=4×4=16,m=0.5,故选 D. 答案:D 2.(2015 江西南昌二模,文 8,回归方程的求法及回归分析,选择题)为了解某商品销售量 y(件)与销售价 格 x(元/件)的关系,统计了(x,y)的 10 组值,并画成散点图如图,则其回归方程可能是(  ) A. ^ 푦=-10x-198 B. ^ y=-10x+198 C. ^ 푦=10x+198 D. ^ 푦=10x-198 解析:由图象可知回归直线方程的斜率小于零,截距大于零,故选 B. 答案:B 3.(2015 辽宁东北育才学校五模,文 8,回归方程的求法及回归分析,选择题)从某高中随机选取 5 名高 三男生,其身高和体重的数据如下表所示: 身高 x(cm) 160165170175180 体重 y(kg) 63 66 70 72 74 根据上表可得回归直线方程 y=0.56x+a,据此模型估计身高为 172 cm 的高三男生的体重为(  ) A.70.09 kg B.70.12 kg C.70.55 kg D.71.05 kg 解析:依题意,样本中心为(170,69),代入 y=0.56x+a 中,解得 a=-26.2,故回归直线的方程为 y=0.56x-26.2; 当 x=172 时,y=0.56×172-26.2=70.12,故选 B. 答案:B 4.(2015 辽宁大连双基测试,文 4,回归方程的求法及回归分析,选择题)已知 x,y 的取值如表所示: x234 y645 如果 y 与 x 呈线性相关,且线性回归方程为 ^ 푦 = ^ bx+13 2 ,则 ^ 푏的值为(  ) A.-1 2 B.1 2 C.- 1 10 D. 1 10 解析:依题意得푥 = 1 3×(2+3+4)=3,푦 = 1 3×(6+4+5)=5,因此回归直线必经过点(3,5),于是有 3 ^ 푏 + 13 2 =5,解 得 ^ 푏=-1 2,故选 A. 答案:A 5.(2015 广西桂林、防城港一联,文 14,回归方程的求法及回归分析,填空题)某产品的广告费用 x 与销 售额 y 的统计数据如下表: 广告费用(万 元) 4 2 3 5 销售额(万 元) 49263954 根据上表可得回归方程 ^ 푦 = ^ bx+ ^ 푎,其中 ^ 푏=9.4,据此模型预报广告费用为 6 万元时,销售额为      万元. 解析:利用线性回归方程过中心点的性质求解回归方程. 由数据得푥=3.5,푦=42,代入回归方程得 ^ 푎=42-9.4×3.5=9.1,所以当 x=6 时, ^ 푦=9.4×6+9.1=65.5,即销 售额为 65.5 万元. 答案:65.5 6.(2015 黑龙江哈尔滨第三中学二模,文 14,回归方程的求法及回归分析,填空题)某产品的广告费用 x(单位:万元)与销售额 y(单位:万元)的统计数据如下表: 广告费用 x(单位: 万元) 2 3 4 5 利润 y(单位:万元) 26 4954 根据上表可得线性回归方程为 ^ 푦=9.4x+9.1,表中有一数据模糊不清,请推算该数据的值 为     . 解析:利用线性回归方程经过中心点的性质求解. 由表中数据可得x = 2 + 3 + 4 + 5 4 = 7 2,代入线性回归方程解得y=9.4×7 2+9.1=42,所以模糊数据为 4×42-(26+49+54)=39. 答案:39 7.(本小题满分 12 分)(2015 广西南宁第二次适应性测试,文 18,回归方程的求法及回归分析,解答题)某 位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关系进行分 析研究,他分别记录了 1 月 11 日至 1 月 15 日的白天平均气温 x(℃)与该奶茶店的这种饮料销量 y(杯), 得到如下数据: 日期 1 月 11 日 1 月 12 日 1 月 13 日 1 月 14 日 1 月 15 日 平均气温 x(℃) 9 10 12 11 8 销量 y(杯) 23 25 30 26 21 (1)若先从这五组数据中抽出 2 组,求抽出的 2 组数据恰好是相邻 2 天数据的概率; (2)请根据所给五组数据,求出 y 关于 x 的线性回归方程 ^ 푦 = ^ bx+ ^ 푎;并根据线性回归方程预测当天气预 报 1 月 16 日的白天平均气温为 7(℃)时奶茶店这种饮料的销量. 附:线性回归方程 ^ 푦 = ^ 푏x+ ^ 푎中,{^ 푏 = 푛 ∑ 푖 = 1 (푥푖 - 푥)(푦푖 - 푦) 푛 ∑ 푖 = 1 (푥푖 - 푥)2 = 푛 ∑ 푖 = 1 푥푖푦푖 - 푛푥 푦 푛 ∑ 푖 = 1 푥2 푖 - 푛푥2 , ^ 푎 = 푦 - ^ 푏푥, 其中푥,푦为样本平均值. 解:(1)设“选取的 2 组数据恰好是相邻 2 天数据”为事件 A, ∵所有基本事件(m,n)(其中 m,n 为 1 月份的日期数)有 (11,12),(11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14),(13,15),(14,15),共 10 种. (2 分) 事件 A 包括的基本事件有(11,12),(12,13),(13,14),(14,15),共 4 种. (4 分) ∴抽出的 2 组数据恰好是相邻 2 天数据的概率 P(A)= 4 10 = 2 5. (5 分) (2)∵푥 = 9 + 10 + 12 + 11 + 8 5 =10, (6 分) 푦 = 23 + 25 + 30 + 26 + 21 5 =25. (7 分) 由公式求得 ^ 푏=2.1, ^ 푎 = 푦 ― ^ 푏 푥=4, (9 分) ∴y 关于 x 的线性回归方程为 ^ 푦=2.1x+4. (10 分) ∵当 x=7 时, ^ 푦=2.1×7+4=18.7, (11 分) ∴该奶茶店这种饮料的销量大约为 19 杯(或 18 杯). (12 分) 8.(本小题满分 12 分)(2015 河北唐山一模,文 18,回归方程的求法及回归分析,解答题)为了研究某种细 菌在特定环境下,随时间变化繁殖规律,得如下实验数据: 天数 t(天) 3 456 7 繁殖个数 y(千 个) 2.5344.56 (1)求 y 关于 t 的线性回归方程; (2)利用(1)中的回归方程,预测 t=8 时,细菌繁殖个数. 附:回归直线的斜率和截距的最小二乘法估计公式分别为 ^ 푏 = n ∑ i = 1 (푡푖 - 푡)(푦푖 - 푦) 푛 ∑ 푖 = 1 (푡푖 - 푡)2 , ^ 푎 = 푦 ― ^ 푏 푡. 解:(1)由表中数据计算得푡=5,푦=4, 푛 ∑ 푖 = 1 (ti-t)(yi-y)=8.5, n ∑ i = 1 (ti-푡)2=10, ^ 푏 = 푛 ∑ 푖 = 1 (푡푖 - 푡)(푦푖 - 푦) 푛 ∑ 푖 = 1 (푡푖 - 푡)2 =0.85, ^ 푎 = 푦 ― ^ 푏 푡=-0.25. 所以回归方程为 ^ 푦=0.85t-0.25. (2)将 t=8 代入(1)的回归方程中得 ^ 푦=0.85×8-0.25=6.55. 故预测 t=8 时,细菌繁殖个数为 6.55 千个. 9.(本小题满分 12 分)(2015 吉林省吉林市二调,文 18,回归方程的求法及回归分析,解答题)勘探部门在 某地区寻找石油.初步勘探时期已零散地钻探了 6 口井,取得了地质资料.进入系统勘探时期后,要在一 个区域内按纵横等距的网格点来布置井位,进行“撒网式”全面钻探.由于钻一口井的费用很高,如果新 设计的井位与原有井位重合(或相当接近),便可利用旧井的地质资料,不必打这口新井,因此,应该尽量 利用旧井,少打新井,以节约钻探费用.现将勘探初期数据附表如下: I(x,y)( 千米) 1(2,30 ) 2(4,40 ) 3(5,60 ) 4(6,50 ) 5(8,70 ) 6(1,y ) 钻探深 度 (千米) 2 4 5 6 8 10 出油量 (L) 40 70 110 90 160 205 (I(x,y):其中 I 表示井号,x,y 分别表示此井在此地区的横纵坐标,单位:千米) 参考公式: ^ 푏 = n ∑ i = 1 푥푖푦푖 - 푛푥 푦 푛 ∑ 푖 = 1 푥2 푖 - 푛푥2 , ^ 푎 = 푦 ― ^ 푏푥。 (1)①若 1~6 号旧井位置满足线性分布,请利用表中前 5 组数据求出回归方程; ②现新设计 6 号井数据 6(1,24),请问 6 号井是否可用原有旧井? (2)设 出油量 钻探深度=k,当 k≥20 时,则称此勘探井为优质井.那么在原有 6 口旧井中任意勘察 2 口井,求恰有 1 口井为优质井的概率. 解:(1)①由图表可知,푥 = 25 5 =5,푦 = 250 5 =50, (2 分) 5 ∑ 푖 = 1 x2i =145, 5 ∑ i = 1 xiyi=1 380. (3 分) 于是可得 ^ 푏 = 5 ∑ 푖 = 1 푥푖푦푖 - 5푥 푦 5 ∑ 푖 = 1 푥2 푖 - 5푥2 = 1 380 - 5 × 5 × 50 145 - 5 × 52 =6.5;(5 分) ^ 푎 = 푦 ― ^ 푏푥=50-6.5×5=17.5, 因此,所求回归直线方程是 ^ 푦=6.5x+17.5. ②当 x=1 时,y=24,所以 6 号井可以用原有井. (6 分) (2)由图表可知 1,3,5,6 号井为优质井,在 6 口井中任意勘察 2 口井,共有 (1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共 15 种情况, (8 分) 其中恰有 1 口优质井的共有(1,2),(1,4),(2,3),(2,5),(2,6),(3,4),(4,5),(4,6),共 8 种情况. (10 分) 所以在此 6 口井中任意勘察 2 口井,恰有 1 口井为优质井的概率 P= 8 15. (12 分) 156 独立性检 验 1.(本小题满分 12 分)(2015 辽宁重点中学协作体模拟,文 18,独立性检验,解答题)为了研究“教学方式” 对教学质量的影响,某校数学老师分别用两种不同的教学方式对入学时数学平均分数和优秀率都相 同的甲、乙两个班级进行教学(勤奋程度和自觉性都一样).以下茎叶图为甲、乙两班(每班均为 20 人) 学生的数学期末考试成绩. (1)现从甲班数学成绩不低于 80 分的同学中随机抽取两名同学,求成绩为 87 分的同学中至少有一名 被抽中的概率; (2)学校规定:成绩不低于 75 分的为优秀.请填写下面的 2×2 列联表,并判断是否有 99%把握认为“成 绩优秀与教学方式有关”. 甲 班 乙 班 合 计 优秀 不优 秀 合计 下面临界值表仅供参考: P(χ2≥k ) 0.15 0.10 0.05 0.0250.0100.0050.001 k 2.0722.7063.8415.0246.6357.87910.82 8 参考公式:χ2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),n=a+b+c+d. 解:(1)记成绩为 87 分的同学为 A,B,其他成绩不低于 80 分的同学为 C,D,E,“从甲班数学成绩不低于 80 分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有 (A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共 10 个, (2 分) “抽到至少有一个 87 分的同学”所组成的基本事件有(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共 7 个, (4 分) 所以所求事件的概率为 P= 7 10. (5 分) (2) 甲 班 乙 班 合 计 优秀 6 14 20 不优 秀 14 6 20 合计 20 20 40 (7 分) χ2=40 × (6 × 6 - 14 × 14)2 20 × 20 × 20 × 20 =6.400<6.635, (10 分) 因此,我们没有 99%的把握认为成绩优秀与教学方式有关. (12 分) 2.(本小题满分 12 分)(2015 甘肃第二次诊断考试,文 19,独立性检验,解答题)某媒体对“男女同龄退休” 这一公众关注的问题进行了民意调查,下表是在某单位得到的数据(人数): 赞 同 反 对 合 计 男 士 10 20 30 女 士 20 5 25 合 计 30 25 55 (1)判断是否有 99.5%的把握认为赞同“男女同龄退休”与性别有关? (2)用分层抽样的方法从赞同“男女同龄退休”的人员中随机抽取 6 人作进一步调查分析,将这 6 人作 为一个样本,从中任选 2 人,求恰有 1 名男士和 1 名女士的概率. 下面的临界值表供参考: P(K2≥k ) 0.10 0.05 0.0250.0100.0050.001 k 2.7063.8415.0246.6357.87910.82 8 参考公式:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),其中 n=a+b+c+d. 解:(1)由公式 K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑) =55 × (10 × 5 - 20 × 20)2 30 × 25 × 30 × 25 ≈11.978>7.879, 所以有 99.5%的把握认为赞同“男女同龄退休”与性别有关. (5 分) (2)设所抽样本中有 n 位男士,则 푛 10 = 6 30,得 n=2,所以样本中有 2 名男士,4 名女士,记作 A1,A2,B1,B2,B3,B4,从中任选 2 人的基本事件有 (A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A2,B1),(A2,B2),(A2,B3),(A2,B4),(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4), (B3,B4),共 15 个. 其中恰有 1 名男士和 1 名女士的概率 P= 8 15. (12 分) 3.(本小题满分 12 分)(2015 广西桂林、防城港一联,文 18,独立性检验,解答题)在北方某城市随机选取 一年内 40 天的空气污染指数(API)的监测数据,统计结果如下: AP I [0,50 ] (50, 100 ] (100 , 150] (150 , 200] (200 , 250] (250 , 300] (300 , +∞) 天 数 3 5 8 10 8 4 2 (1)已知污染指数 API 大于 250 为重度污染,若本次抽取样本数据有 9 天是在供暖季,其中有 3 天为重 度污染,完成下面的 2×2 列联表,问有多大把握认为该城市空气重度污染与供暖有关? 非重度污 染 重度污 染 合 计 供暖季 非供暖 季 合计 40 (2)在样本中,从污染指数 API 大于 250 的 6 天中任取 2 天,求至少有 1 天 API 大于 300 的概率. 附注:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),n=a+b+c+d. P(K2≥k ) 0.25 0.15 0.10 0.05 0.0250.0100.0050.001 k 1.3232.0722.7063.8415.0246.6357.87910.82 8 解:(1)2×2 列联表如下: 非重度污 染 重度污 染 合 计 供暖季 6 3 9 非供暖 季 28 3 31 合计 34 6 40 (2 分) K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑) =40 × (6 × 3 - 28 × 3)2 34 × 6 × 31 × 9 =3.061>2.706, (5 分) 所以有 90%的把握认为该城市空气重度污染与供暖有关. (6 分) (2)污染指数 API 在(250,300]的 4 天记为 A1,A2,A3,A4,污染指数 API 大于 300 的 2 天记为 B1,B2,则 从这 6 天中任取 2 天,至少有 1 天 API 大于 300 有 A1B1,A2B1,A3B1,A4B1,A1B2,A2B2,A3B2,A4B2,B1B2,共有 9 种. (8 分) 从 A1,A2,A3,A4,B1,B2 这 6 天中任取 2 天有 15 种选法, (10 分) 设从这 6 天中任取 2 天,至少有 1 天 API 大于 300 的为事件 C,则 P(C)= 9 15 = 3 5, (11 分) 所以从这 6 天中任取 2 天,至少有 1 天 API 大于 300 的概率为3 5. (12 分) 4.(本小题满分 12 分)(2015 辽宁大连双基测试,文 18,独立性检验,解答题)某食品厂为了检查甲、乙两 条自动包装流水线的生产情况,随机在这两条流水线上各抽取 40 件产品作为样本,并称出它们的质量 (单位:克),质量值落在[495,510)内的产品为合格品,否则为不合格品,统计结果如下: 下表是甲流水线样本的频数分布表 产品质量 (克) 频 数 [490,495) 6 [495,500) 8 [500,505) 14 [505,510) 8 [510,515] 4 下图是乙流水线样本的频率分布直方图 (1)求甲流水线样本合格的频率; (2)从乙流水线上质量值落在[505,515]内的产品中任取 2 件产品,求这两件产品中恰好只有一件合格 的概率; (3)由以上统计数据完成下面 2×2 列联表,并回答有多大的把握认为产品的包装质量与两条自动包装 流水线的选择有关. 甲流水 线 乙流水 线 合 计 合格品 不合格 品 合计 附:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑) P(K2≥k ) 0.15 0.10 0.05 0.0250.0100.0050.001 k 2.0722.7063.8415.0246.6357.87910.82 8 解:(1)由表知甲流水线样本中合格品数为 8+14+8=30,故甲流水线样本中合格品的频率为30 40=0.75.(2 分) (2)从乙流水线上重量值落在[505,515]内的合格产品件数为 0.02×5×40=4,不合格产品件数为 0.01×5×40=2. 将合格产品编号为 A1,A2,A3,A4,不合格产品编号为 B1,B2,抽取 2 件产品的基本事件空间为 Ω1={(A1,A2),(A1,A3),(A1,A4),(A1,B1),(A1,B2),(A2,A3),(A2,A4),(A2,B1),(A2,B2),(A3,A4),(A3,B1),(A3,B2),(A4,B1),( A4,B2),(B1,B2)},共 15 个. Ω2={(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A4,B1),(A4,B2)},共 8 个,概率 P= 8 15. (8 分) (3)由(2)知甲流水线样本中合格件数为 30,乙流水线样本中合格件数为 0.9×40=36. 2×2 列联表如下: 甲流水 线 乙流水 线 合 计 合格品 30 36 66 不合格 品 10 4 14 合计 40 40 80 ∵K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑) = 80 × (120 - 360)2 66 × 14 × 40 × 40≈3.117>2.706, ∴有 90%的把握认为产品的包装质量与两条自动包装流水线的选择有关. (12 分) 5.(本小题满分 12 分)(2015 江西三校联考,文 18,独立性检验,解答题)“ALS 冰桶挑战赛”是一项社交网 络上发起的筹款活动,活动规定:被邀请者要么在 24 小时内接受挑战,要么选择为慈善机构捐款(不接 受挑战),并且不能重复参加该活动.若被邀请者接受挑战,则他需在网络上发布自己被冰水浇遍全身 的视频内容,然后便可以邀请另外 3 个人参与这项活动.假设每个人接受挑战与不接受挑战是等可能 的,且互不影响. (1)若某参与者接受挑战后,对其他 3 个人发出邀请,则这 3 个人中至少有 2 个人接受挑战的概率是多 少? (2)为了解冰桶挑战赛与受邀者的性别是否有关,某调查机构进行了随机抽样调查,调查得到如下 2×2 列联表: 接受挑 战 不接受挑 战 合 计 男 性 45 15 60 女 性 25 15 40 合 计 70 30 100 根据表中数据,能否有 90%的把握认为“冰桶挑战赛与受邀者的性别有关”? 附:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑) P(K2≥k0 ) 0.1000.0500.0100.001 k0 2.7063.8416.63510.82 8 解:(1)这 3 个人接受挑战分别记为 A,B,C,则퐴,퐵,퐶分别表示这 3 个人不接受挑战. 这 3 个人参与该项活动的可能结果为{A,B,C},{퐴,B,C},{A,퐵,C},{A,B,퐶},{퐴,퐵,C},{퐴,B,퐶},{A,퐵, 퐶},{퐴,퐵,퐶},共有 8 种, (2 分) 其中至少有 2 个人接受挑战的可能结果有{A,B,C},{퐴,B,C},{A,퐵,C},{A,B,퐶},共有 4 种. (4 分) 因此所求的概率 P=4 8 = 1 2. (6 分) (2)根据 2×2 列联表,得到 K2 的观测值为 K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑) =100 × (45 × 15 - 25 × 15)2 60 × 40 × 70 × 30 =25 14≈1.79. (10 分) 因为 1.79<2.706,所以没有 90%的把握认为“冰桶挑战赛与受邀者的性别有关”. (12 分) 6.(本小题满分 12 分)(2015 河南平顶山、许昌、新乡二调,文 19,独立性检验,解答题)某中学高中部有 300 名学生,初中部有 200 名学生.为了研究学生“周平均学习时间”是否与年级组有关.现采用分层抽 样的方法,从中抽取了 100 名学生,先统计了他们某学期的周平均学习时间,然后按“初中组”和“高中 组”分为两组,再将两组学生的周平均学习时间分成 5 组:[40,50),[50,60),[60,70),[70,80),[80,90)分别加 以统计,得到如图所示的频率分布直方图. 初中组 高中组 (1)求高中部学生的“周平均学习时间”; (2)从样本中周平均学习时间不足 50 小时的学生中随机抽取 2 人,求至少抽到一名“初中组”学生的频 率; (3)规定“周平均学习时间”不少于 70 小时者为“学霸”,请你根据已知条件完成 2×2 列联表,并判断是 否有 90%的把握认为“学霸”与学生所在的年级组有关. 附:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑) P(K2≥k ) 0.1000.0500.0100.001 k 2.7063.8416.63510.82 8 解:(1)由已知得样本中有“高中组”学生 60 名,“初中组”学生 40 名. 在“高中组”抽取的 60 名学生中,“周平均学习时间”分别落在[40,50),[50,60),[60,70),[70,80),[80,90) 的人数依次为 6,15,24,12,3. 所以高中部学生的“周平均学习时间”为 (6×45+15×55+24×65+12×75+3×85)÷60=63.5(小时). (4 分) (2)由已知得样本中,“周平均学习时间”不足 50 小时的学生中,“高中组”学生有 60×0.10=6(人),记 为 A1,A2,…,A6;“初中组”学生有 40×0.05=2(人),记为 B1,B2. 从中随机抽取 2 名学生,所有可能的结果共有 28 种,他们是 (A1,A2),…,(A1,A6),…,(A5,A6),(A1,B1),(A1,B2),(A2,B1),(A2,B2),…,(A6,B1),(A6,B2),(B1,B2). 其中,至少有一名“初中组”学生的可能结果共 13 种,它们是 (A1,B1),(A1,B2),(A2,B1),(A2,B2),…,(A6,B1),(A6,B2),(B1,B2). 故所求的概率 P=13 28. (8 分) (3)由频率分布直方图可知,在抽取的 100 名学生中,“高中组”中“学霸”人数为 60×0.25=15(人),“初中组”中“学霸”人数为 40×0.375=15(人),据此可得 2×2 列联表如下: 学 霸 非学 霸 合 计 高中 组 15 45 60 初中 组 15 25 40 合计 30 70 100 所以 K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑) =100 × (15 × 25 - 15 × 45)2 60 × 40 × 30 × 70 = 25 14≈1.79. 因为 1.79<2.706,所以没有 90%的把握认为“学霸”与学生所在的年级组有关. 7.(本小题满分 12 分)(2015 河南适应性模拟练习,文 18,独立性检验,解答题)某中学研究性学习小组,为 了研究高中文科学生的历史成绩是否与语文成绩有关系,在本校高三年级随机调查了 50 名文科学生. 调查结果表明:在语文成绩优秀的 25 人中 16 人历史成绩优秀,另外 9 人历史成绩一般;在语文成绩一 般的 25 人中有 6 人历史成绩优秀,另外 19 人历史成绩一般. (1)试根据以上数据完成以下 2×2 列联表,并运用独立性检验思想,指出有多大把握认为高中文科学生 的历史成绩与语文成绩有关系; 语文成绩优 秀 语文成绩一 般 总 计 历史成绩优 秀 历史成绩一 般 总计 (2)将其中某 5 名语文成绩与历史成绩均优秀的学生分别编号为 1,2,3,4,5,某 5 名语文成绩优秀但历 史成绩一般的学生也分别编号为 1,2,3,4,5,从这两组学生中各任选 1 人进行学习交流,求被选取的 2 名学生的编号之和为 3 的倍数或 4 的倍数的概率. 参考公式:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),其中 n=a+b+c+d. 参考数据: P(K2≥k0 ) 0.10 0.05 0.0250.0100.0050.001 k0 2.7063.8415.0246.6357.87910.82 8 解:(1)2×2 列联表如下: 语文成绩优 秀 语文成绩一 般 总 计 历史成绩优 秀 16 6 22 历史成绩一 般 9 19 28 总计 25 25 50 因为 K2=50 × (16 × 19 - 6 × 9)2 25 × 25 × 22 × 28 = 625 77 ≈8.117>7.879, 由表知 P(K2>7.879)=0.005, 所以有 99.5%的把握认为高中文科学生的历史成绩与语文成绩有关系. (6 分) (2)设“被选取的 2 名学生的编号之和为 3 的倍数”为事件 A,“被选取的 2 名学生的编号之和为 4 的倍数”为事件 B,则基本事件为 1 2 3 4 5 1(1,1)(1,2)(1,3)(1,4)(1,5 ) 2(2,1)(2,2)(2,3)(2,4)(2,5 ) 3(3,1)(3,2)(3,3)(3,4)(3,5 ) 4(4,1)(4,2)(4,3)(4,4)(4,5 ) 5(5,1)(5,2)(5,3)(5,4)(5,5 ) 共 25 个, 因为事件 A 所包含的基本事件为(1,2),(1,5),(2,1),(2,4),(3,3),(4,2),(4,5),(5,1),(5,4),共 9 个,所以 P(A)= 9 25; 事件 B 所包含的基本事件为(1,3),(2,2),(3,1),(3,5),(4,4),(5,3),共 6 个,所以 P(B)= 6 25. 因为事件 A,B 互斥,所以 P(A∪B)=P(A)+P(B)= 6 25 + 9 25 = 3 5, 即被选取的 2 名学生的编号之和为 3 的倍数或 4 的倍数的概率为3 5. (12 分) 8.(2015 河北石家庄二检,文 4,独立性检验,选择题)某校为了研究“学生的性别”和“对待某一活动的支 持态度”是否有关,运用 2×2 列联表进行独立性检验,经计算 K2=7.069,则认为“学生性别与支持活动有 关”的犯错误的概率不超过(  ) A.0.1% B.1% C.99% D.99.9% 附: P(K2≥k0 ) 0.1000.0500.0250.0100.001 k0 2.7063.8415.0246.63510.82 8 解析:利用临界值表判断.因为 7.069>6.635,所以至少有 99%的把握认为“学生性别与支持活动有关系”, 即认为“学生性别与支持活动有关系”出错的概率不超过 1%,故选 B. 答案:B 9.(本小题满分 12 分)(2015 东北三省三校二联,文 18,独立性检验,解答题)微信是现代生活进行信息交 流的重要工具,据统计,某公司 200 名员工中 90%的人使用微信,其中每天使用微信时间在一小时以内 的有 60 人,其余每天使用微信在一小时以上.若将员工年龄分成青年(年龄小于 40 岁)和中年(年龄不 小于 40 岁)两个阶段,使用微信的人中 75%是青年人.若规定:每天使用微信时间在一小时以上为经常 使用微信,经常使用微信的员工中2 3是青年人. (1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出 2×2 列联表; 2×2 列联表 青年 人 中年 人 合 计 经常使用微信 不经常使用微 信 合计 (2)根据列联表中所得数据,利用独立性检验的方法判断是否有 99.9%的把握认为“经常使用微信与年 龄有关”? (3)采用分层抽样的方法从“经常使用微信”的人中抽取 6 人,从这 6 人中任选 2 人,求事件 A“选出的 2 人均是青年人”的概率. 附: P(K2≥k ) 0.0100.001 k 6.63510.82 8 K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑). 解:(1)由已知可得该公司员工中使用微信的共有 200×0.9=180 人,其中青年人:180×3 4=135 人. 经常使用微信的有 180-60=120 人,其中青年人:120×2 3=80 人. 所以可列下面 2×2 列联表: 青年 人 中年 人 合 计 经常使用微信 80 40 120 不经常使用微 信 55 5 60 合计 135 45 180 (4 分) (2)将列联表中数据代入公式可得 K2=180 × (80 × 5 - 55 × 40)2 120 × 60 × 135 × 45 ≈13.333. (7 分) 由于 13.333>10.828,所以有 99.9%的把握认为“经常使用微信与年龄有关”. (8 分) (3)从“经常使用微信”的人中抽取 6 人,青年人有 80 120×6=4(人),中年人有 2 人. 设 4 名青年人编号分别为 1,2,3,4,2 名中年人编号分别为 5,6, 则“从这 6 人中任选 2 人”的基本事件为 (1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共 15 个. (10 分) 其中事件 A“选出的 2 人均是青年人”的基本事件为(1,2),(1,3),(1,4),(2,3),(2,4),(3,4),共 6 个, (11 分) 故 P(A)=2 5. (12 分) 10.(本小题满分 12 分)(2015 东北三省四市一联,文 18,独立性检验,解答题)2014 年 7 月 16 日,中国互 联网网络信息中心发布《第三十四次中国互联网发展状况报告》.报告显示:我国网络购物用户已达 3.32 亿.为了了解网络购者一次性购物金额情况,某统计部门随机抽查了 6 月 1 日这一天 100 名网购 者的网购情况,得到如下数据统计表.已知网购金额在 2 000 元以上(不含 2 000 元)的频率为 0.4. 网购金额 (元) 频 数 频 率 (0,500] 5 0.05 (500,1 000] x p (1 000,1 500] 15 0.15 (1 500,2 000] 25 0.25 (2 000,2 500] 30 0.3 (2 500,3 000] y q 合计 100 1.00 (1)确定 x,y,p,q 的值,并补全频率分布直方图; (2)为进一步了解网购金额的多少是否与网龄有关,对这 100 名网购者调查显示:购物金额在 2 000 元 以上的网购者中网龄 3 年以上的有 35 人,购物金额在 2 000 元以下(含 2 000 元)的网购者中网龄不足 3 年的有 20 人. ①请将列联表补充完整; 网龄 3 年以 上 网龄不足 3 年 合 计 购物金额 在 2 000 元以 上 35 购物金额 在 2 000 元以 下 20 合计 100 ②并据此列联表,判断是否有 97.5%的把握认为网购金额超过 2 000 元与网龄在三年以上有关? 参考数据: P(K2≥k ) 0.15 0.10 0.05 0.0250.0100.0050.001 k 2.0722.7063.8415.0246.6357.87910.82 8 (   参考公式:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),其中 n=a+b+c+d   ) 解:(1)因为网购金额在 2 000 元以上的频率为 0.4,所以网购金额在 2 000 元以上的人数为 100×0.4=40. 所以 30+y=40,所以 y=10, (1 分) x=15, (2 分) 所以 p=0.15,q=0.1. (4 分) 所以频率分布直方图如图所示. (5 分) (2)①由题意补全列联表如下: 网龄 3 年以 上 网龄不足 3 年 合 计 购物金额 在 2 000 元以 上 35 5 40 购物金额 在 2 000 元以 下 40 20 60 合计 75 25 100 (7 分) ②K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑) =100 × (35 × 20 - 40 × 5)2 40 × 60 × 75 × 25 ≈5.56, (9 分) 因为 5.56>5.024, (10 分) 所以据此列联表判断,有 97.5%的把握认为网购金额超过 2 000 元与网龄在三年以上有关.(12 分) 11.(本小题满分 12 分)(2015 河南洛阳 3 月统一考试,文 18,独立性检验,解答题)有 2 000 名网购者在 11 月 11 日当天于某购物网站进行网购消费(消费金额不超过 1 000 元),其中有女士 1 100 名,男士 900 名.该购物网站为优化营销策略,根据性别采用分层抽样的方法从这 2 000 名网购者中抽取 200 名进 行分析,如下表:(消费金额单位:元) 女士消费情况: 消费 (0, [200,[400,[600,[800, 金额 200)400) 600) 800) 1 000] 人数 10 25 35 30 x 男士消费情况: 消费 金额 (0, 200) [200, 400) [400, 600) [600, 800) [800, 1 000] 人数 15 30 25 y 5 (1)计算 x,y 的值;在抽出的 200 名且消费金额在[800,1 000](单位:元)的网购者中随机选出两名发放网 购红包,求选出的两名网购者都是男士的概率; (2)若消费金额不低于 600 元的网购者为“网购达人”,低于 600 元的网购者为“非网购达人”,根据以上 统计数据填写下面 2×2 列联表,并回答能否在犯错误的概率不超过 0.05 的前提下认为“是否为‘网 购达人’与性别有关?” 女 士 男 士 总 计 网购达人 非网购达 人 总计 附: P(K2≥k ) 0.10 0.05 0.0250.0100.00 5 k0 2.7063.8415.0246.6357.87 9 (K2 = 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),푛 = 푎 + 푏 + 푐 + 푑) 解:(1)依题意,女士应抽取 110 人,男士应抽取 90 人, 故 x=10,y=15. (2 分) 消费金额在[800,1 000](单位:元)的网购者共有 15 名,从中选出两名共有 105 种选法,若两名网购 者都是男士共有 10 种情况,所以,消费金额在[800,1 000]的网购者中选出两名,这两名网购者都是男士 的概率为 10 105 = 2 21. (6 分) (2) 女 士 男 士 总 计 网购达人 40 20 60 非网购达 人 70 70 140 总计 110 90 200 (8 分) k=200 × (40 × 70 - 20 × 70)2 110 × 90 × 60 × 140 ≈4.714. (10 分) 又因为 4.714>3.841,故能在犯错误的概率不超过 0.05 的前提下认为“是否为‘网购达人’与性 别有关”. (12 分)

相关文档