- 397.00 KB
- 2021-06-11 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第十章统计与统计案例
10.1 随机抽样
148 系统抽
样
1.(2015 广西柳州一模,文 3,系统抽样,选择题)采用系统抽样方法从 1 000 人中抽取 50 人做问卷调查,
为此将他们随机编号为 1,2,…,1 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为 8.
抽到的 50 人中,编号落入区间[1,400]的人做问卷 A,编号落入区间[401,750]的人做问卷 B,其余的人做
问卷 C.则抽到的人中,做问卷 C 的人数为( )
A.12 B.13 C.14 D.15
解析:由 1 000÷50=20,故由题意可得抽到的号码构成以 8 为首项、以 20 为公差的等差数列,且此等
差数列的通项公式为 an=8+(n-1)20=20n-12.
由 751≤20n-12≤1 000,解得 38.2≤n≤50.6.
再由 n 为正整数可得 39≤n≤50,且 n∈Z,
故做问卷 C 的人数为 12.
答案:A
2.(2015 黑龙江绥化重点中学二模,文 14,系统抽样,填空题)将高一(9)班参加社会实践编号分别
为:1,2,3,…48 的 48 名学生,采用系统抽样的方法抽取一个容量为 4 的样本,已知 5 号,29 号,41 号学生
在样本中,则样本中还有一名学生的编号是 .
解析:样本间距为 48÷4=12,则另外一个编号为 5+12=17.
答案:17
3.(2015 江西景德镇二模,文 3,系统抽样,选择题)某次考试结束后,从考号为 1~1 000 号的 1 000 份试卷
中,采用系统抽样法抽取 50 份试卷进行试评,则在考号区间[850,949]之中被抽到的试卷份数为( )
A.一定是 5 份 B.可能是 4 份
C.可能会有 10 份 D.不能具体确定
解析:样本间隔为 1 000÷50=20,考号区间[850,949]的个数为 949-850+1=100,则 100÷20=5,即一定是
5 份.
答案:A
13.(2015 甘肃兰州一中模拟,文 13,系统抽样,填空题)采用系统抽样方法从 600 人中抽取 50 人做问卷
调查,为此将他们随机编号为 001,002,…,600,分组后在第一组采用简单随机抽样的方法抽得的号码
为 003,抽到的 50 人中,编号落入区间[001,300]的人做问卷 A,编号落入区间[301,495]的人做问卷 B,编
号落入区间[496,600]的人做问卷 C,则抽到的人中,做问卷 C 的人数为 .
解析:∵600÷50=12,∴由题意可得抽到的号码构成以 3 为首项、以 12 为公差的等差数列,且此等差
数列的通项公式为 an=3+12(n-1)=12n-9.
落入区间[496,600]的人做问卷 C,
由 496≤12n-9≤600,即 505≤12n≤609,
解得 42 1
12≤n≤503
4.
再由 n 为正整数可得 43≤n≤50,
∴做问卷 C 的人数为 50-43+1=8.
答案:8
149 分层抽
样
1.(2015 广西玉林、贵港 4 月模拟,文 4,分层抽样,选择题)某市修建经济适用房,已知 A,B,C 三个社区
分别有低收入家庭 400 户、300 户、200 户,若首批有 90 套经济适用房用于解决住房紧张问题,采用
分层抽样的方法决定各社区买房的户数,则应从 A 社区中抽取低收入家庭的户数为 ( )
A.40 B.36 C.30 D.20
解析:设从 A 社区抽取 n 户,则 400
400 + 300 + 200 = 푛
90,
解得 n=40.
答案:A
2.(2015 广西桂林、防城港联合调研,文 14,分层抽样,填空题)某校参加某项课外活动的四个小组的学
生人数依次为 300 人,300 人,600 人,900 人,现用分层抽样的方法从四个小组学生中抽取容量为 35 的
样本,则第三组中应抽取的学生人数是 .
解析:根据分层抽样的定义可知第三组中应抽取的学生人数是 600
300 + 300 + 600 + 900×35=10.
答案:10
13.(2015 江西鹰潭一模,文 13,分层抽样,填空题)某校对全校男女学生共 1 600 名进行健康调查,选用
分层抽样法抽取一个容量为 200 的样本.已知女生比男生少抽了 10 人,则该校的女生人数应是
人.
解析:由题意知样本和总体比为 200∶1 600=1∶8.
设抽取女生为 x 人,则男生为 x+10.
因为 x+x+10=2x+10=200,解得 x=95 人.
所以该校的女生人数为 95×8=760 人.
答案:760
4.(2015 吉林三模,文 4,分层抽样,选择题)某学校共有师生 2 400 人,现用分层抽样的方法,从所有师生
中抽取一个容量为 150 的样本,已知从学生中抽取的人数为 135,那么该学校的教师人数是( )
A.15 B.200 C.240 D.2 160
解析:∵抽取样本为 150 人,
∴抽取比例为 2 400∶150=16∶1.
∵从学生中抽取的人数为 135 人,
∴从老师抽取 150-135=15(人).
则教师人数为 15×16=240(人).
答案:C
13.(2015 江西鹰潭二模,文 13,分层抽样,填空题)现在所有旅客购买火车票必须实行实名制,据不完全
统计共有 28 种有效证件可用于窗口的实名购票,常用的有效证件有:身份证,户口簿,军人证,教师证等,
对 2015 年春运期间 120 名购票的旅客进行调查后得到下表:
购买火
车
票方式
身份
证
户口
簿
军人
证
教师
证
其他证
件
旅客人
数 a 6 8 b 19
已知 a-b=57,则使用教师证购票的旅客的频率大约为 .
解析:由表格值 a+b=120-6-8-19=87,
∵a-b=57,∴a=72,b=15.
则使用教师证购票的旅客的频率大约为 15
120=0.125.
答案:0.125
13.(2015 广西南宁一模,文 13,分层抽样,填空题)某班某次数学考试成绩好,中,差的学生人数之比为 3 ∶
5∶2,现在用分层抽样方法从中抽取容量为 20 的样本,则应从成绩好的学生中抽取 名学
生.
解析:由题意应从成绩好的学生中抽取的人数为 3
10×20=6(人).
答案:6
18.(2015 山西太原五中二模,文 18,分层抽样,解答题)某高中三年级有一个实验班和一个对比班,各有
50 名同学.根据这两个班二模考试的数学科目成绩(规定考试成绩在[120,150]内为优秀),统计结果如
下:
实验班数学成绩的频数分布表:
分
组
[70
,
80)
[80
,
90)
[90,
100
)
[100
,
110)
[110
,
120)
[120
,
130)
[130
,
140)
[140
,
150]
频
数1 2 12 13 12 9 1 0
对比两班数学成绩的频数分布表:
分
组
[70
,
80)
[80
,
90)
[90,
100
)
[100
,
110)
[110
,
120)
[120
,
130)
[130
,
140)
[140
,
150]
频
数2 3 13 11 9 10 1 1
(1)分别求这两个班数学成绩的优秀率;若采用分层抽样从实验班中抽取 15 位同学的数学试卷,进行
试卷分析,则从该班数学成绩为优秀的试卷中应抽取多少份?
(2)统计学中常用 M 值作为衡量总体水平的一种指标,已知 M 与分数 t 的关系式为:M=
{ -2(푡 < 90)
2(90 ≤ 푡 < 120),
4(푡 ≥ 120),
分别求这两个班学生数学成绩的 M 总值,并据此对这两个班数学成绩总体水平作一
简单评价.
解:(1)实验班优秀率为10
50=0.2,
对比班优秀率为12
50=0.24.
数学成绩为优秀的试卷中应抽取 15×10
50=3(份).
(2)实验班数学成绩的 M 总值为 3×(-2)+37×2+10×4=108,
对比班数学成绩的 M 总值为 5×(-2)+33×2+12×4=104.
所以,本次市二模考试实验班数学成绩总体水平略高于对比班.
10.2 用样本估计总体
150 频率分布直方
图
1.(2015 江西上饶重点中学一模,文 14,频率分布直方图,填空题)某校从参加高三年级期末考试的学生
中随机抽取 100 名学生,将其数学成绩分成五段:[50,70),[70,90),[90,110),[110,130),[130,150],它的频率
分布直方图如图所示,则该批学生中成绩不低于 90 分的人数是 .
解析:根据频率分布直方图,得
该批学生中成绩低于 90 分的频率是(0.002 5+0.015 0)×20=0.35,
∴该批学生中成绩不低于 90 分的频率是 1-0.35=0.65,∴该批学生中成绩不低于 90 分的人数是
100×0.65=65.
答案:65
19.(2015 江西六校联考二模,文 19,频率分布直方图,解答题)某校 50 名学生参加 2013 年全国数学联
赛初赛,成绩全部介于 90 分到 140 分之间.将成绩结果按如下方式分成五组:第一组[90,100),第二组
[100,110),第三组[110,120),第四组[120,130),第五组[130,140].按上述分组方法得到的频率分布直方图
如图所示.
(1)若成绩大于或等于 100 分且小于 120 分认为是良好的,求该校参赛学生在这次数学联赛中成绩良
好的人数;
(2)若从第一、五组中共随机取出两个同学的成绩,求这两个成绩差的绝对值大于 30 分的概率.
解:(1)由频率分布直方图知,成绩在[100,120)内的人数为:50×0.16+50×0.38=27(人),
∴该班成绩良好的人数为 27 人.
(2)由频率分布直方图知,成绩在[90,100)的人数为 50×0.06=3(人),设为 x,y,z.
成绩在[130,140]的人数为 50×0.08=4(人),设为 A,B,C,D;
若 m,n∈[90,100)时,有 xy,xz,yz 3 种情况;
若 m,n∈[130,140]时,有 AB,AC,AD,BC,BD,CD 6 种情况;
若 m,n 分别在[90,100)和[130,140]内时,
有 xA,xB,xC,xD,yA,yB,yC,yD,zA,zB,zC,zD 12 种情况;
∴基本事件总数为 21,事件“|m-n|>30”所包含的基本事件个数为 12;
∴概率为 P(|m-n|>30)=12
21 = 4
7.
14.(2015 广西梧州一模,文 14,频率分布直方图,填空题)某校学生在一次学业水平测试中的数学成绩
制成如图所示频率分布直方图,60 分以下的人要补考,已知 90 分以上的有 80 人,则该校需要补考的人
数为 .
解析:根据频率分布直方图,得 90 分以上的频率是 0.010×10=0.10,对应的频数为 80,
∴样本容量是80
0.1=800.
∴60 分以下的频率为(0.005+0.010)×10=0.15,
∴对应的频数为 800×0.15=120.
∴该校需要补考的人数为 120.
答案:120
13.(2015 江西南昌零模,文 13,频率分布直方图,填空题)一所中学共有 4 000 名学生,为了引导学生树
立正确的消费观,需抽样调查学生每天使用零花钱的数量(取整数元)情况,分层抽取容量为 300 的样
本,作出频率分布直方图如图所示,请估计在全校所有学生中,一天使用零花钱在 6 元~14 元的学生大
约有 人.
解析:根据频率分布直方图得,一天使用零花钱在 6 元~14 元的学生频率是 1-(0.02+0.03+0.03)×4=1-
0.32=0.68,∴对应的频数是 4 000×0.68=2 720.
∴估计全校学生中,一天使用零花钱在 6 元~14 元的大约有 2 720 人.
答案:2 720
19.(2015 甘肃兰州一中三模,文 19,频率分布直方图,解答题)为了调查高一新生中女生的体重情况,校
卫生室随机选取 20 名女生作为样本测量她们的体重(单位:kg),获得的所有数据按照区间
(40,45],(45,50],(50,55],(55,60]进行分组,得到频率分布直方图如图所示.已知样本中体重在区间(45,50]
上的女生数与体重在区间(55,60]上的女生数之比为 4∶3.
(1)求 a,b 的值;
(2)从样本中体重在区间(50,60]上的女生中随机抽取两人,求体重在区间(55,60]上的女生至少有一人
被抽中的概率.
解:(1)样本中体重在区间(45,50]上的女生有 a×5×20=100a(人),
样本中体重在区间(50,60]上的女生有(b+0.02)×5×20=100(b+0.02)(人),
依题意,有 100a=4
3×100(b+0.02),
即 a=4
3×(b+0.02). ①
根据频率分布直方图可知(0.02+b+0.06+a)×5=1, ②
解①②得 a=0.08,b=0.04.
(2)样本中体重在区间(50,55]上的女生有 0.04×5×20=4 人,分别记为 A1,A2,A3,A4,
体重在区间(55,60]上的女生有 0.02×5×20=2 人,分别记为 B1,B2.
从这 6 名女生中随机抽取两人共有 15 种情
况:(A1,A2),(A1,A3),(A1,A4),(A1,B1),(A1,B2),(A2,A3),(A2,A4),(A2,B1),(A2,B2),(A3,A4),(A3,B1),(A3,B2),(A4,B1),(A4,
B2),(B1,B2).
其中体重在(55,60]上的女生至少有一人共有 9 种情
况:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A4,B1),(A4,B2),(B1,B2).
记“从样本中体重在区间(50,60]上的女生中随机抽取两人,体重在区间(55,60]上的女生至少有一
人被抽中”为事件 M,则 P(M)= 9
15 = 3
5.
19.(2015 甘肃兰州二诊,文 19,频率分布直方图,解答题)据统计某校学生在上学路上所需时间最多不
超过 120 分钟.该校随机抽取部分新生在上学路上所需时间(单位:分钟)进行调查,并将所得数据绘制
成频率分布直方图.
(1)求频率分布直方图中 a 的值;
(2)为减轻学生负担,学校规定在上学路上所需时间不少于 1 小时的学生可申请在校内住宿.请根据抽
样数据估计该校 600 名新生中有多少学生可申请在校内住宿.
解:(1)由频率直方图可得(0.003 0+0.002 1+0.001 4+0.006 0+a+0.025)×20=1,a=0.012 5.
(2)新生上学所需时间不少于 1 小时的频率为(0.003 0+0.002 1+0.001 4)×20=0.13,
所以该校 600 名新生中可申请在校内住宿的人数估计为 600×0.13=78.
6.(2015 甘肃庆阳一诊,文 6,频率分布直方图,选择题)为了了解某学校 1 500 名高中男生的身体发育情
况,抽查了该校 100 名高中男生的体重情况.根据所得数据画出样本的频率分布直方图,据此估计该校
高中男生体重在 70~78 kg 的人数为( )
A.240 B.210 C.180 D.60
解析:由频率分布直方图得到体重在 70~78 kg 的男生的频率为(0.02+0.01)×4=0.12,∴该校 1 500 名高
中男生中体重在 70~78 kg 的人数大约为 0.12×1 500=180.
答案:C
151 茎叶
图
7.(2015 黑龙江哈尔滨三中四模,文 7,茎叶图,选择题)PM2.5 是指大气中直径小于或等于 2.5 微米的颗
粒物,也称为可入肺颗粒物.如图是根据哈尔滨三中学生社团某日早 6 点至晚 9 点在南岗、群力两个
校区附近的 PM2.5 监测点统计的数据(单位:毫克/立方米)列出的茎叶图,南岗、群力两个校区浓度的
方差较小的是( )
A.南岗校区 B.群力校区
C.南岗、群力两个校区相等 D.无法确定
解析:根据茎叶图中的数据可知,南岗校区的数据大部分集中在 0.06 和 0.07 之间,数据分布比较稳定,
而群力校区的数据分布比较分散,不如南岗校区数据集中,∴南岗校区的方差较小.
答案:A
152 样本的数字特
征
18.(2015 山西太原二模,文 18,样本的数字特征,解答题)某网络广告 A 公司计划从甲、乙两个网站选
择一个网站拓展广告业务,为此 A 公司随机抽取了甲、乙两个网站某月中 10 天的日访问量 n(单位:
万次),整理后得到如图茎叶图,已知 A 公司要从网站日访问量的平均值和稳定性两方面进行考虑选
择.
(1)请说明 A 公司应选择哪个网站;
(2)现将抽取的样本分布近似看作总体分布,A 公司根据所选网站的日访问量 n 进行付费,其付费标准
如下:
选定网站的日访
问量 n(单位:万
次)
A 公司的付费
标准(单位:元/
日)
n<25 500
25≤n≤35 700
n>35 1 000
求 A 公司每月(按 30 天计)应付给选定网站的费用 S.
解:(1)根据茎叶图,得
푥甲=(15+24+28+25+30+36+30+32+35+45)÷10=30,
푠2甲 = 1
10[(15-30)2+(24-30)2+(28-30)2+(25-30)2+(30-30)2+(36-30)2+(30-30)2+(32-30)2+(35-
30)2+(45-30)2]=58;
푥乙=(18+25+22+24+32+38+30+36+35+40)÷10=30,
푠2乙 = 1
10[(18-30)2+(25-30)2+(22-30)2+(24-30)2+(32-30)2+(38-30)2+(30-30)2+(36-30)2+(35-
30)2+(40-30)2]=49.8;
∵푥甲 = 푥乙,푠2甲 > 푠2乙,
∴A 公司应选择乙网站.
(2)由(1)得 A 公司应选择乙网站,根据题意得,乙网站日访问量 n<25 的概率为 0.3,日访问量
25≤n≤35 的概率为 0.4,日访问量 n>35 的概率为 0.3,
∴A 公司每月应付给乙网站的费用为 S=30×(500×0.3+700×0.4+1 000×0.3)=21 900 元.
5.(2015 江西红色六校一模,文 5,样本的数字特征,选择题)若样本 a1,a2,a3 的方差是 a,则样本
3a1+1,3a2+1,3a3+1 的方差为( )
A.3a+1 B.9a+1
C.9a+3 D.9a
解析:∵样本 a1,a2,a3 的方差是 a,
∴样本 3a1+1,3a2+1,3a3+1 方差为 32×a=9a.
答案:D
13.(2015 贵州贵阳二模,文 13,样本的数字特征,填空题)数组 1,2,3,4,a 的平均数是 2,则它的方差
是 .
解析:∵5 个数 1,2,3,4,a 的平均数是 2,
∴1 + 2 + 3 + 4 + 푎
5 =2,∴a=0.
∴这组数据的方差是1
5×(1+0+1+4+4)=2.
答案:2
5.(2015 江西上饶重点中学二模,文 5,样本的数字特征,选择题)已知样本:8,6,4,7,11,6,8,9,10,5,则样本的
平均值푥和中位数 a 的值是( )
A.푥=7.3,a=7.5 B.푥=7.4,a=7.5
C.푥=7.3,a=7 和 8 D.푥=7.4,a=7 和 8
解析:푥 = 1
10×(8+6+4+7+11+6+8+9+10+5)=7.4,
样本从小到大的顺序为:4,5,6,6,7,8,8,9,10,11,
所以中位数 a=1
2×(7+8)=7.5.
答案:B
153 用样本估计总
体
18.(2015 黑龙江哈尔滨六中四模,文 18,用样本估计总体,解答题)某商场为了了解顾客的购物信息,随
机的在商场收集了 100 位顾客购物的相关数据,整理如下:
一次购
物款
(单位:
元)
[0,50)[50,100)[100,150)[150,200)[200,+∞)
顾客人
数 m 20 30 n 10
统计结果显示 100 位顾客中购物款不低于 100 元的顾客占 60%,据统计该商场每日大约有 5 000 名顾
客,为了增加商场销售额度,对一次性购物不低于 100 元的顾客发放纪念品(每人一件).(注:视频率为概
率)
(1)试确定 m,n 的值,并估计该商场每日应准备纪念品的数量;
(2)为了迎接店庆,商场进行让利活动,一次性购物款 200 元及以上的一次返利 30 元;一次性购物款小
于 200 元的按购物款的百分比返利,具体见下表:
一次购
物款
(单位:
元)
[0,50)[50,100)[100,150)[150,200)
返利百
分比 0 6% 8% 10%
请估计该商场日均让利多少元?
解:(1)由已知,100 位顾客中购物款不低于 100 元的顾客有 n+10+30=100×60%,解得 n=20.∴m=100-
(20+30+20+10)=20.
该商场每日应准备纪念品的数量大约为 5 000× 60
100=3 000.
(2)设购物款为 a 元,
当 a∈[50,100)时,顾客有 5 000×20%=1 000 人,
当 a∈[100,150)时,顾客有 5 000×30%=1 500 人,
当 a∈[150,200)时,顾客有 5 000×20%=1 000 人,
当 a∈[200,+∞)时,顾客有 5 000×10%=500 人,
∴估计日均让利为 75×6%×1 000+125×8%×1 500+175×10%×1 000+30×500=52 000 元.
10.3 变量间的相关关系、统计案例
155 回归方程的求法及回归
分析
4.(2015 广西梧州一模,文 4,回归方程的求法及回归分析,选择题)根据如下样本数据:
x345 67 8
y42-
1 1-
2
-
3
得到的回归方程为
^
푦 =
^
bx+
^
푎,则( )
A.
^
푎>0,
^
푏<0 B.
^
푎>0,
^
푏>0
C.
^
푎<0,
^
푏<0 D.
^
푎<0,
^
푏>0
解析:由题意可知:回归方程经过的样本数据对应的点附近,是减函数,所以
^
푏<0,且回归方程经过(3,4)
与(4,2)附近,所以
^
푎>0.
答案:A
4.(2015 江西重点中学协作体一模,文 4,回归方程的求法及回归分析,选择题)根据如下样本数据
x3 4 5 6 7 8
y-
4.0
-
2.50.5-
0.52.03.
0
得到的回归方程为
^
푦 =
^
bx+
^
푎,则( )
A.
^
푎>0,
^
푏<0 B.
^
푎>0,
^
푏>0
C.
^
푎<0,
^
푏<0 D.
^
푎<0,
^
푏>0
解析:样本平均数푥=5.5,푦=-0.25,
∴
6
∑
푖 = 1
(xi-x)(yi-y)=23,
6
∑
i = 1
(xi-푥)2=17.5,
∴
^
푏 = 23
17.5 = 46
35>0.
∴
^
푎=-0.25-46
35·5.5<0.
答案:D
5.(2015 江西重点中学协作体二模,文 5,回归方程的求法及回归分析,选择题)对于下列表格所示的五
个散点,已知求得的线性回归方程为
^
푦=0.76x-71.
x989910010110
2
y2 3 5 m 8
则实数 m 的值为( )
A.6.8 B.7 C.7.2 D.7.4
解析:由题意可得푥 = 1
5×(98+99+100+101+102)=100,同理可得푦 = 1
5×(2+3+5+m+8)=18 + 푚
5 ,
代入回归方程可得18 + 푚
5 =0.76×100-71,
解得 m=7.
答案:B
14.(2015 广西防城港、桂林一模,文 14,回归方程的求法及回归分析,填空题)某产品的广告费用 x 与
销售额 y 的统计数据如下表
广告费用 x(万
元) 4 2 3 5
销售额 y(万
元) 49263954
根据上表可得回归方程
^
푦 =
^
bx+
^
푎中的
^
푏为 9.4,据此模型预报广告费用为 6 万元时销售额
为 .
解析:∵푥 = 4 + 2 + 3 + 5
4 =3.5,
푦 = 49 + 26 + 39 + 54
4 =42,
∵数据的样本中心点在线性回归直线上,
回归方程
^
푦 =
^
푏x+
^
푎中的
^
푏为 9.4,
∴42=9.4×3.5+
^
푎,∴
^
푎=9.1.
∴线性回归方程是 y=9.4x+9.1,
∴广告费用为 6 万元时销售额为 9.4×6+9.1=65.5.
答案:65.5 万元
19.(2015 江西三县部分高中一模,文 19,回归方程的求法及回归分析,解答题)为了研究某种细菌在特
定环境下,随时间变化的繁殖情况,得如下实验数据:
天数 t(天) 3 456 7
繁殖个数 y(千
个) 2.5344.56
(1)求 y 关于 t 的线性回归方程;
(2)利用(1)中的回归方程,预测 t=8 时,细菌繁殖个数.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:
^
푏 =
n
∑
i = 1
(푡푖 - 푡)(푦푖 - 푦)
푛
∑
푖 = 1
(푡푖 - 푡)2
,
^
푎 = 푦 ―
^
푏 푡.
解:(1)由表中数据计算得,푡=5,푦=4,
푛
∑
푖 = 1
(ti-t)(yi-y)=8.5,
n
∑
i = 1
(ti-푡)2=10,
所以
^
푏=0.85,
^
푎=-0.25.
所以回归方程为 y=0.85t-0.25.
(2)将 t=8 代入(1)的回归方程中得
^
푦=0.85×8-0.25=6.55.
故预测 t=8 时,细菌繁殖个数为 6.55 千个.
4.(2015 山西太原外国语学校 4 月模拟,文 4,回归方程的求法及回归分析,选择题)从某高中随机选取
5 名高三男生,其身高和体重的数据如下表所示:
身高
x(cm) 160165170175180
体重
y(kg) 63 66 70 72 74
根据上表可得回归直线方程
^
푦=0.56x+
^
a,据此模型预报身高为 172 cm 的高三男生的体重为( )
A.70.09 kg B.70.12 kg
C.70.55 kg D.71.05 kg
解析:由表中数据可得푥 = 160 + 165 + 170 + 175 + 180
5 =170,푦 = 63 + 66 + 70 + 72 + 74
5 =69,
∵(푥,푦)一定在回归直线方程
^
푦=0.56x+
^
푎上,
故 69=0.56×170+
^
푎,解得
^
푎=-26.2,
故
^
푦=0.56x-26.2,
当 x=172 时,
^
푦=0.56×172-26.2=70.12.
答案:B
156 独立性检
验
1.(2015 广西玉林、贵港 4 月模拟,文 18,独立性检验,解答题)某市地铁于 2013 年 12 月开始运营,运营
前召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了 50 人,他们月收入与态度如下:
月收
入
(单位
百元)
[15,25)[25,35)[35,45)[45,55)[55,65)[65,75]
赞成
定价
者人
数
1 2 3 5 3 4
认为
价格
偏高
者人
数
4 8 12 5 2 1
(1)若以区间的中点为该区间的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”
的月平均收入的差距是多少(结果保留 2 位小数);
(2)由以上统计数据填下面 2 乘 2 列联表并分析是否有 99%把握认为“月收入以 5 500 为分界点对地
铁定价的态度有差异”.
月收入不低
于
55 百元的人
数
月收入低于
55 百元的人
数
合
计
认为价
格
偏高者
a= c=
赞成
定价者 b= d=
合计
参考数据:K2= 푛(푎푑 - 푏푐)2
(푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),
P(x2≥k
) 0.05 0.01
k 3.8416.63
5
解:(1)赞成定价者月平均收入 1
18×(20×1+30×2+40×3+50×5+60×3+70×4)=940
18 ,
认为价格偏高者月平均收入 1
32×(20×4+30×8+40×12+50×5+60×2+70×1)=1 240
32 ,
∴940
18 ― 1 240
32 =13.47.
(2)2 乘 2 列联表
月收入不低
于
55 百元人数
月收入低
于
55 百元人
数
合
计
不赞
成 3 29 32
赞成 7 11 18
合计 10 40 50
K2 的观测值 k=50 × (3 × 11 - 7 × 29)2
10 × 40 × 32 × 18 ≈6.27<6.635.
所以没有 99%的把握认为月收入以 5 500 为分界点对地铁定价的态度有差异.
2.(2015 广西柳州一中一模,文 19,独立性检验,解答题)某班主任对全班 50 名学生学习积极性和参加
社团活动情况进行调查,统计数据如下表:
参加社团活
动
不参加社团活
动
合
计
学习积极性高 17 8 25
学习积极性一
般 5 20 25
合计 22 28 50
(1)如果随机从该班抽查一名学生,抽到参加社团活动的学生的概率是多少?抽到不参加社团活动且学
习积极性一般的学生的概率是多少?
(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由.
P(K2≥k
) 0.05 0.01 0.001
k 3.8416.63510.82
8
解:(1)随机从该班抽查一名学生,抽到参加社团活动的学生的概率是22
50 = 11
25,抽到不参加社团活动且学
习积极性一般的学生的概率是20
50 = 2
5.
(2)∵K2 的观测值 k=50 × (17 × 20 - 5 × 8)2
25 × 25 × 22 × 28 ≈11.688>10.828,∴有 99.9%的把握认为学生的学习积极
性与参加社团活动的态度有关系.
18.(2015 江西鹰潭一模,文 18,独立性检验,解答题)某市调研考试后,某校对甲、乙两个文科班的数学
考试成绩进行分析,规定:大于或等于 120 分为优秀,120 分以下为非优秀.统计成绩后,得到如下的
2×2 列联表:
优
秀
非优
秀
合
计
甲
班 10 50 60
乙
班 20 30 50
合 30 80 110
计
(1)根据列联表的数据,若按 99.9%的可靠性要求,能否认为“成绩与班级有关系”;
(2)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的 10 名学生从 2 到 11 进行编号,先后
两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到 9 号或 10 号的概率.
参考公式与临界值表:
K2= 푛(푎푑 - 푏푐)2
(푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑).
P(K2≥k
) 0.1000.0500.0250.0100.001
k 2.7063.8415.0246.63510.82
8
解:(1)假设成绩与班级无关,
则 K2 的观测值 k=110 × (10 × 30 - 20 × 50)2
30 × 80 × 50 × 60 ≈7.5>6.635 但小于 10.828,则查表得相关的概率为 99%,
故没达到可靠性要求.
(2)设“抽到 9 或 10 号”为事件 A,先后两次抛掷一枚均匀的骰子,所有的基本事件有:6×6=36 个.
事件 A 包含的基本事件有:(3,6),(4,5),(5,4),(6,3),(5,5),(4,6),(6,4)共 7 个.
所以 P(A)= 7
36,即抽到 9 号或 10 号的概率为 7
36.
18.(2015 吉林三模,文 18,独立性检验,解答题)某学校研究性学习小组对该校高三学生视力情况进行
调查,在高三的全体 1 000 名学生中随机抽取了若干名学生的体检表,并得到如图直方图:
(1)若直方图中前三组的频率成等比数列,后四组的频率成等差数列,试估计全年级视力在 5.0 以下的
人数;
(2)学习小组成员发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关
系,对年级名次在 1~50 名和 951~1 000 名的学生进行了调查,得到如下数据:
年级
名次
是否近视
1~50951~1
000
近视 41 32
不近视 9 18
根据表中的数据,能否在犯错的概率不超过 0.05 的前提下认为视力与学习成绩有关系?附:
K2= 푛(푎푑 - 푏푐)2
(푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑)
P(K2≥k
) 0.10 0.05 0.0250.0100.00
5
k 2.7063.8415.0246.6357.87
9
解:(1)设各组的频率为 fi(i=1,2,3,4,5,6),
依题意,前三组的频率成等比数列,后四组的频率成等差数列,故
f1=0.15×0.2=0.03,f2=0.45×0.2=0.09,f3=
푓2
2
푓1
=0.27,
所以由(푓3 + 푓6) × 4
2 =1-(0.03+0.09),得 f6=0.17.
所以视力在 5.0 以下的频率为 1-0.17=0.83,
故全年级视力在 5.0 以下的人数约为 1 000×0.83=830.
(2)K2 的观测值 k=100 × (41 × 18 - 32 × 9)2
50 × 50 × 73 × 27 ≈4.110>3.841.
因此能在犯错误的概率不超过 0.05 的前提下认为视力与学习成绩有关系.
18.(2015 广西防城港、桂林一模,文 18,独立性检验,解答题)在北方某城市随机选取一年内 40 天的空
气污染指数(API)的监测数据,统计结果如下:
AP
I
[0,
50
]
(50,
100
]
(100
,
150]
(150
,
200]
(200
,
250]
(250
,
300]
(300
,
+∞)
天
数 3 5 8 10 8 4 2
(1)已知污染指数 API 大于 250 为重度污染,若本次抽取样本数据有 9 天是在供暖季,其中有 3 天为重
度污染,完成下面的 2×2 列联表,问有多大把握认为该城市空气重度污染与供暖有关?
非重度污
染
重度污
染
合
计
供暖季
非供暖
季
合计 40
(2)在样本中,从污染指数 API 大于 250 的 6 天中任取 2 天,求至少有 1 天 API 大于 300 的概率.
附注:K2= 푛(푎푑 - 푏푐)2
(푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),n=a+b+c+d.
P(K2≥k
) 0.25 0.15 0.10 0.05 0.0250.01 0.0050.001
k 1.3232.0722.7063.8415.0256.6357.87910.82
8
解:(1)根据以上数据得到下表:
非重度污
染
重度污
染
合
计
供暖季 6 3 9
非供暖
季 28 3 31
合计 34 6 40
K2 的观测值 k=40 × (6 × 3 - 28 × 3)2
34 × 6 × 31 × 9 ≈3.061>2.706,所以有 90%的把握认为空气重度污染与供暖有
关.
(2)污染指数 API 在(250,300)有 4 天,污染指数 API 大于 300 有 2 天,6 天中任取 2 天,共有C26=15
种,至少有 1 天 API 大于 300,共有 15-C24=9 种,
所以在样本中,从污染指数 API 大于 250 的 6 天中任取 2 天,至少有 1 天 API 大于 300 的概率为
9
15 = 3
5.
18.(2015 黑龙江哈尔滨九中三模,文 18,独立性检验,解答题)“开门大吉”是某电视台推出的游戏节目.
选手面对 1~8 号 8 扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色
旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场
外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如
图所示.
(1)写出 2×2 列联表;判断是否有 90%的把握认为猜对歌曲名称是否与年龄有关;说明你的理由;(下面
的临界值表供参考)
P(K2≥k0
) 0.10 0.05 0.0100.00
5
k0 2.7063.8416.6357.87
9
(2)现计划在这次场外调查中按年龄段用分层抽样的方法选取 6 名选手,并抽取 3 名幸运选手,求 3 名
幸运选手中至少有一人在 20~30 岁之间的概率.
(
参考公式:K2= 푛(푎푑 - 푏푐)2
(푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),其中 n=a+b+c+d
)
解:(1)根据所给的二维条形图得到列联表,
正
确
错
误
合
计
20~30(岁)10 30 40
30~40(岁)10 70 80
合计 20 100 120
根据列联表所给的数据代入观测值的公式得到 K2 的观测值 k=120 × (10 × 70 - 10 × 30)2
20 × 100 × 40 × 80 =3,
∵3>2.706.
∴有 1-0.10=90%的把握认为猜对歌曲名称与否与年龄有关.
(2)按照分层抽样方法可知:20~30(岁)抽取:6× 40
120=2(人);30~40(岁)抽取:6× 80
120=4(人).
在上述抽取的 6 名选手中,年龄在 20~30(岁)有 2 人,年龄在 30~40(岁)有 4 人.
年龄在 20~30(岁)记为(A,B);
年龄在 30~40(岁)记为(a,b,c,d),
则从 6 名选手中任取 3 名的所有情况
为:(A,B,a),(A,B,b),(A,B,c),(A,B,d),(A,a,b),(A,a,c),(A,a,d),(A,b,c),(A,b,d),(A,c,d),(B,a,b),(B,a,c),(B,a,d),(B,b,
c),(B,b,d),(B,c,d),(a,b,c),(a,b,d),(a,c,d),(b,c,d),共 20 种情况,
其中至少有一人年龄在 20~30 岁情况
有:(A,B,a),(A,B,b),(A,B,c),(A,B,d),(A,a,b),(A,a,c),(A,a,d),(A,b,c),(A,b,d),(A,c,d),(B,a,b),(B,a,c),(B,a,d),(B,b,
c),(B,b,d),(B,c,d),共 16 种情况.
记至少有一人年龄在 20~30 岁为事件 A,
则 P(A)=16
20 = 4
5.
∴至少有一人年龄在 20~30 岁之间的概率为4
5.
18.(2015 吉林实验中学六模,文 18,独立性检验,解答题)为了解少年儿童的肥胖是否与常喝碳酸饮料
有关,现对 30 名六年级学生进行了问卷调查得到如下列联表:平均每天喝 500 ml 以上为常喝,体重超
过 50 kg 为肥胖.
常
喝
不常
喝
合
计
肥胖 2
不肥
胖 18
合计 30
已知在全部 30 人中随机抽取 1 人,抽到肥胖的学生的概率为 4
15.
(1)请将上面的列联表补充完整;
(2)是否有 99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由;
(3)现从常喝碳酸饮料且肥胖的学生中(其中有 2 名女生),抽取 2 人参加电视节目,则正好抽到一男一
女的概率是多少?
参考数据:
P(K2>k)0.15 0.10 0.05 0.0250.0100.0050.001
k 2.0722.7063.8415.0246.6357.87910.82
8
(
参考公式:K2= 푛(푎푑 - 푏푐)2
(푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),其中 n=a+b+c+d
)
解:(1)设常喝碳酸饮料肥胖的学生有 x 人,푥 + 3
30 = 4
15,
∴x=6.
常
喝
不常
喝
合
计
肥
胖 6 2 8
不
胖 4 18 22
合
计 10 20 30
(2)由已知数据可求得:K2 的观测值 k=30 × (6 × 18 - 2 × 4)2
10 × 20 × 8 × 22 ≈8.522>7.879,因此有 99.5%的把握认为
肥胖与常喝碳酸饮料有关.
(3)设常喝碳酸饮料的肥胖者男生为 A,B,C,D,女生为 E,F,则任取两人有
AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共 15 种.其中一男一女有
AE,AF,BE,BF,CE,CF,DE,DF.故抽出一男一女的概率是 P= 8
15.