- 362.50 KB
- 2021-05-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
2017年04月19日的高中数学组卷
一.选择题(共11小题)
1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程,其中,据此估计,该社区一户收入为15万元家庭年支出为( )
A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元
2.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( )
A.=0.4x+2.3 B.=2x﹣2.4 C.=﹣2x+9.5 D.=﹣0.3x+4.4
3.根据如下样本数据,得到回归方程=bx+a,则( )
x
3
4
5
6
7
8
y
4.0
2.5
﹣0.5
0.5
﹣2.0
﹣3.0
A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0
4.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )
A.抽签法 B.系统抽样法 C.分层抽样法 D.随机数法
5.根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
6.重庆市2013年各月的平均气温(℃)数据的茎叶图如,则这组数据的中位数是( )
A.19 B.20 C.21.5 D.23
7.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1﹣35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )
A.3 B.4 C.5 D.6
8.若样本数据x1,x2,…,x10的标准差为8,则数据2x1﹣1,2x2﹣1,…,2x10﹣1的标准差为( )
A.8 B.15 C.16 D.32
9.为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8 C.12 D.18
10.某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12 C.13 D.14
11.一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( )
A.12,24,15,9 B.9,12,12,7 C.8,15,12,5 D.8,16,10,6
二.解答题(共7小题)
12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi﹣)2
(wi﹣)2
(xi﹣)(yi﹣)
(wi﹣)(yi﹣)
46.6
563
6.8
289.8
1.6
1469
108.8
表中wi=i,=
(Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x.根据(Ⅱ)的结果回答下列问题:
(i)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ii)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1 v1),(u2 v2)…..(un vn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:=,=﹣.
13.如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1﹣7分别对应年份2008﹣2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646.
参考公式:r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:
=,=﹣.
14.某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表:
年份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
2.9
3.3
3.6
4.4
4.8
5.2
5.9
人均纯收入y
(Ⅰ)求y关于t的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=﹣.
15.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得,,,.
(Ⅰ)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;
(Ⅱ)判断变量x与y之间是正相关还是负相关;
(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程y=bx+a中,,,其中,为样本平均值,线性回归方程也可写为.
16.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(I)求直方图中的a值;
(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;
(Ⅲ)估计居民月均用水量的中位数.
17.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为,[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
18.某工厂36名工人年龄数据如图:
工人编号
年龄
工人编号
年龄
工人编号
年龄
工人编号
年龄
1
2
40
44
10
11
36
31
19
20
27
43
28
29
34
39
3
4
5
6
7
8
9
40
41
33
40
45
42
43
12
13
14
15
16
17
18
38
39
43
45
39
38
36
21
22
23
24
25
26
27
41
37
34
42
37
44
42
30
31
32
33
34
35
36
43
38
42
53
37
49
39
(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;
(2)计算(1)中样本的均值和方差s2;
(3)36名工人中年龄在﹣s和+s之间有多少人?所占百分比是多少(精确到0.01%)?
2017年04月19日的高中数学组卷
参考答案与试题解析
一.选择题(共11小题)
1.(2015•福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程,其中,据此估计,该社区一户收入为15万元家庭年支出为( )
A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元
【解答】解:由题意可得=(8.2+8.6+10.0+11.3+11.9)=10,
=(6.2+7.5+8.0+8.5+9.8)=8,
代入回归方程可得=8﹣0.76×10=0.4,
∴回归方程为=0.76x+0.4,
把x=15代入方程可得y=0.76×15+0.4=11.8,
故选:B.
2.(2014•重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( )
A.=0.4x+2.3 B.=2x﹣2.4 C.=﹣2x+9.5 D.=﹣0.3x+4.4
【解答】解:∵变量x与y正相关,
∴可以排除C,D;
样本平均数=3,=3.5,代入A符合,B不符合,
故选:A.
3.(2014•湖北)根据如下样本数据,得到回归方程=bx+a,则( )
x
3
4
5
6
7
8
y
4.0
2.5
﹣0.5
0.5
﹣2.0
﹣3.0
A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0
【解答】解:由题意可知:回归方程经过的样本数据对应的点附近,是减函数,所以b<0,且回归方程经过(3,4)与(4,3.5)附近,所以a>0.
故选:B.
4.(2015•四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )
A.抽签法 B.系统抽样法 C.分层抽样法 D.随机数法
【解答】解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,
而事先已经了解到三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,这种方式具有代表性,比较合理.
故选:C.
5.(2015•新课标Ⅱ)根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
【解答】解:A从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量明显减少,且减少的最多,故A正确;
B2004﹣2006年二氧化硫排放量越来越多,从2007年开始二氧化硫排放量变少,故B正确;
C从图中看出,2006年以来我国二氧化硫年排放量越来越少,故C正确;
D2006年以来我国二氧化硫年排放量越来越少,而不是与年份正相关,故D错误.
故选:D
6.(2015•重庆)重庆市2013年各月的平均气温(℃)数据的茎叶图如,则这组数据的中位数是( )
A.19 B.20 C.21.5 D.23
【解答】解:样本数据有12个,位于中间的两个数为20,20,
则中位数为,
故选:B
7.(2015•湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1﹣35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )
A.3 B.4 C.5 D.6
【解答】解:由已知,将个数据分为三个层次是[130,138],[139,151],[152,153],根据系统抽样方法从中抽取7人,得到抽取比例为,
所以成绩在区间[139,151]中共有20名运动员,抽取人数为20×=4;
故选B.
8.(2015•安徽)若样本数据x1,x2,…,x10的标准差为8,则数据2x1﹣1,2x2﹣1,…,2x10﹣1的标准差为( )
A.8 B.15 C.16 D.32
【解答】解:∵样本数据x1,x2,…,x10的标准差为8,
∴=8,即DX=64,
数据2x1﹣1,2x2﹣1,…,2x10﹣1的方差为D(2X﹣1)=4DX=4×64,
则对应的标准差为==16,
故选:C.
9.(2014•山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8 C.12 D.18
【解答】
解:由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,
第三组中没有疗效的有6人,
第三组中有疗效的有12人.
故选:C.
10.(2013•陕西)某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12 C.13 D.14
【解答】解:使用系统抽样方法,从840人中抽取42人,即从20人抽取1人.
所以从编号1~480的人中,恰好抽取=24人,接着从编号481~720共240人中抽取=12人.
故:B.
11.(2010•四川)一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( )
A.12,24,15,9 B.9,12,12,7 C.8,15,12,5 D.8,16,10,6
【解答】解:因为=,故各层中依次抽取的人数分别是=8,=16,=10,=6,
故选D.
二.解答题(共7小题)
12.(2015•新课标Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi﹣)2
(wi﹣)2
(xi﹣)(yi﹣)
(wi﹣)(yi﹣)
46.6
563
6.8
289.8
1.6
1469
108.8
表中wi=i,=
(Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x.根据(Ⅱ)的结果回答下列问题:
(i)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ii)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1 v1),(u2 v2)…..(un vn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:=,=﹣.
【解答】解:(Ⅰ)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型;
(Ⅱ)令w=,先建立y关于w的线性回归方程,由于==68,
=﹣=563﹣68×6.8=100.6,
所以y关于w的线性回归方程为=100.6+68w,
因此y关于x的回归方程为=100.6+68,
(Ⅲ)(i)由(Ⅱ)知,当x=49时,年销售量y的预报值=100.6+68=576.6,
年利润z的预报值=576.6×0.2﹣49=66.32,
(ii)根据(Ⅱ)的结果可知,年利润z的预报值=0.2(100.6+68)﹣x=﹣x+13.6+20.12,
当==6.8时,即当x=46.24时,年利润的预报值最大.
13.(2016•新课标Ⅲ)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1﹣7分别对应年份2008﹣2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646.
参考公式:r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:
=,=﹣.
【解答】解:(1)由折线图看出,y与t之间存在较强的正相关关系,理由如下:
∵r==≈≈≈0.993,
∵0.993>0.75,
故y与t之间存在较强的正相关关系;
(2)==≈≈0.103,
=﹣≈1.331﹣0.103×4≈0.92,
∴y关于t的回归方程=0.10t+0.92,
2016年对应的t值为9,
故=0.10×9+0.92=1.82,
预测2016年我国生活垃圾无害化处理量为1.82亿吨.
14.(2014•新课标Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表:
年份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(Ⅰ)求y关于t的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=﹣.
【解答】解:(Ⅰ)由题意,=×(1+2+3+4+5+6+7)=4,
=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
∴===0.5,
=﹣=4.3﹣0.5×4=2.3.
∴y关于t的线性回归方程为=0.5t+2.3;
(Ⅱ)由(Ⅰ)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2015年的年份代号t=9代入=0.5t+2.3,得:
=0.5×9+2.3=6.8,
故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
15.(2013•重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi
(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得,,,.
(Ⅰ)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;
(Ⅱ)判断变量x与y之间是正相关还是负相关;
(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程y=bx+a中,,,其中,为样本平均值,线性回归方程也可写为.
【解答】解:(Ⅰ)由题意可知n=10,===8,===2,
故lxx==720﹣10×82=80,lxy==184﹣10×8×2=24,
故可得b=═=0.3,a==2﹣0.3×8=﹣0.4,
故所求的回归方程为:y=0.3x﹣0.4;
(Ⅱ)由(Ⅰ)可知b=0.3>0,即变量y随x的增加而增加,故x与y之间是正相关;
(Ⅲ)把x=7代入回归方程可预测该家庭的月储蓄为y=0.3×7﹣0.4=1.7(千元).
16.(2016•四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…[4,4.5]
分成9组,制成了如图所示的频率分布直方图.
(I)求直方图中的a值;
(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;
(Ⅲ)估计居民月均用水量的中位数.
【解答】解:(I)∵1=(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5,整理可得:2=1.4+2a,
∴解得:a=0.3.
(II)估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下:
由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12,
又样本容量=30万,
则样本中月均用水量不低于3吨的户数为30×0.12=3.6万.
(Ⅲ)根据频率分布直方图,得;
0.08×0.5+0.16×0.5+0.30×0.5+0.40×0.5=0.47<0.5,
0.47+0.5×0.52=0.73>0.5,
∴中位数应在(2,2.5]组内,设出未知数x,
令0.08×0.5+0.16×0.5+0.30×0.5+0.4×0.5+0.5×x=0.5,
解得x=0.06;
∴中位数是2+0.06=2.06.
17.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),
[280,300)分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为,[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
【解答】解:(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,
解方程可得x=0.0075,∴直方图中x的值为0.0075;
(2)月平均用电量的众数是=230,
∵(0.002+0.0095+0.011)×20=0.45<0.5,
∴月平均用电量的中位数在[220,240)内,
设中位数为a,由(0.002+0.0095+0.011)×20+0.0125×(a﹣220)=0.5可得a=224,
∴月平均用电量的中位数为224;
(3)月平均用电量为[220,240)的用户有0.0125×20×100=25,
月平均用电量为[240,260)的用户有0.0075×20×100=15,
月平均用电量为[260,280)的用户有0.005×20×100=10,
月平均用电量为[280,300)的用户有0.0025×20×100=5,
∴抽取比例为=,
∴月平均用电量在[220,240)的用户中应抽取25×=5户.
18.(2015•广东)某工厂36名工人年龄数据如图:
工人编号
年龄
工人编号
年龄
工人编号
年龄
工人编号
年龄
1
2
3
4
5
6
7
8
9
40
44
40
41
33
40
45
42
43
10
11
12
13
14
15
16
17
18
36
31
38
39
43
45
39
38
36
19
20
21
22
23
24
25
26
27
27
43
41
37
34
42
37
44
42
28
29
30
31
32
33
34
35
36
34
39
43
38
42
53
37
49
39
(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;
(2)计算(1)中样本的均值和方差s2;
(3)36名工人中年龄在﹣s和+s之间有多少人?所占百分比是多少(精确到0.01%)?
【解答】解:(1)由系统抽样知,36人分成9组,每组4人,其中第一组的工人年龄为44,所以其编号为2,
∴所有样本数据的编号为:4n﹣2,(n=1,2,…,9),
其数据为:44,40,36,43,36,37,44,43,37.
(2)由平均值公式得=(44+40+36+43+36+37+44+43+37)=40.
由方差公式得s2=[(44﹣40)2+(40﹣40)2+…+(37﹣40)2]=.
(3)∵s2=.∴s=∈(3,4),
∴36名工人中年龄在﹣s和+s之间的人数等于区间[37,43]的人数,
即40,40,41,…,39,共23人.
∴36名工人中年龄在﹣s和+s之间所占百分比为≈63.89%.