- 221.50 KB
- 2021-06-11 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第二章 统 计(A)
(时间:120 分钟 满分:150 分)
一、选择题(本大题共 12小题,每小题 5分,共 60分)
1.从某年级 1 000名学生中抽取 125名学生进行体重的统计分析,就这个问题来说,
下列说法正确的是( )
A.1 000名学生是总体
B.每个被抽查的学生是个体
C.抽查的 125名学生的体重是一个样本
D.抽取的 125名学生的体重是样本容量
2.由小到大排列的一组数据 x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于
样本 1,x1,-x2,x3,-x4,x5的中位数可以表示为( )
A.1
2
(1+x2) B.1
2
(x2-x1)
C.1
2
(1+x5) D.1
2
(x3-x4)
3.某单位有老年人 27人,中年人 54人,青年人 81人,为了调查他们的身体状况的某
项指标,需从他们中间抽取一个容量为 36的样本,则老年人、中年人、青年人分别应
抽取的人数是( )
A.7,11,19 B.6,12,18
C.6,13,17 D.7,12,17
4.对变量 x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图 1;对变量 u,v有观测
数据(ui,vi)(i=1,2,…,10),得散点图 2.由这两个散点图可以判断( )
A.变量 x与 y正相关,u与 v正相关
B.变量 x与 y正相关,u与 v负相关
C.变量 x与 y负相关,u与 v正相关
D.变量 x与 y负相关,u与 v负相关
5.已知一组数据 x1,x2,x3,x4,x5的平均数是 2,方差是
1
3
,那么另一组数 3x1-2,3x2
-2,3x3-2,3x4-2,3x5-2的平均数,方差分别是( )
A.2,1
3
B.2,1
C.4,2
3
D.4,3
6.某学院有 4 个饲养房,分别养有 18,54,24,48 只白鼠供实验用.某项实验需抽取 24
只白鼠,你认为最合适的抽样方法是( )
A.在每个饲养房各抽取 6只
B.把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定 24只
C.从 4个饲养房分别抽取 3,9,4,8只
D.先确定这 4个饲养房应分别抽取 3,9,4,8只,再由各饲养房自己加号码颈圈,用简单
随机抽样的方法确定
7.下列有关线性回归的说法,不正确的是( )
A.相关关系的两个变量不一定是因果关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任一组数据都有回归直线方程
8.已知施肥量与水稻产量之间的回归直线方程为y
^
=4.75x+257,则施肥量 x=30时,
对产量 y的估计值为( )
A.398.5 B.399.5
C.400 D.400.5
9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模
群体感染的标志为“连续 10天,每天新增疑似病例不超过 7人”.根据过去 10天甲、
乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为 3,中位数为 4
B.乙地:总体均值为 1,总体方差大于 0
C.丙地:中位数为 2,众数为 3
D.丁地:总体均值为 2,总体方差为 3
10.某高中在校学生 2 000人,高一与高二人数相同并都比高三多 1人.为了响应“阳
光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与
了其中一项比赛,各年级参与比赛人数情况如下表:
高一 高二 高三
跑步 a b c
登山 x y z
其中 a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的
2
5
.为了了解学生对本次活动的
满意程度,从中抽取一个 200人的样本进行调查,则高二参与跑步的学生中应抽取( )
A.36人 B.60 人 C.24 人 D.30
人
11.某赛季,甲、乙两名篮球运动员都参加了 11场比赛,他们所有比赛得分的情况用
如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为( )
A.19,13 B.13,19
C.20,18 D.18,20
12.从一堆苹果中任取了 20个,并得到它们的质量(单位:克)数据分布表如下:
分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,15
0]
频数 1 2 3 10 3 1
则这堆苹果中,质量不小于 120克的苹果数约占苹果总数的( )
A.30% B.70%
C.60% D.50%
题号 1 2 3 4 5 6 7 8 9 10 11 12
答案
二、填空题(本大题共 4小题,每小题 5分,共 20分)
13.甲、乙、丙、丁四名射击手在选拔赛中的平均环数 x 及其标准差 s如下表所示,
则选送决赛的最佳人选应是________.
甲 乙 丙 丁
x 7 8 8 7
s 2.5 2.5 2.8 3
14.一组数据 23,27,20,18,x,12,它们的中位数是 21,即 x是________.
15.某市居民 2005~2009年家庭年平均收入 x(单位:万元)与年平均支出 Y(单位:万
元)的统计资料如下表所示:
年份 2005 2006 2007 2008 2009
收入 x 11.5 12.1 13 13.3 15
支出 Y 6.8 8.8 9.8 10 12
根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支
出有________线性相关关系.
16.某单位为了了解用电量 y度与气温 x℃之间的关系,随机统计了某 4天的用电量与
当天气温.
气温(℃) 14 12 8 6
用电量(度) 22 26 34 38
由表中数据得回归直线方程y
^
=b
^
x+a
^
中b
^
=-2,据此预测当气温为 5℃时,用电量
的度数约为______________________________________________________________.
三、解答题(本大题共 6小题,共 70分)
17.(10)一批产品中,有一级品 100个,二级品 60个,三级品 40个,用分层抽样的方
法,从这批产品中抽取一个容量为 20的样本,写出抽样过程.
18.(12分)为了了解学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,所
得数据整理后,画出频率分布直方图(如下),图中从左到右各小长方形面积之比为
2∶4∶17∶15∶9∶3,第二小组频数为 12.
(1)学生跳绳次数的中位数落在哪个小组内?
(2)第二小组的频率是多少?样本容量是多少?
(3)若次数在 110以上(含 110次)为良好,试估计该学校全体高一学生的良好率是多少?
19.(12 分)为了研究三月下旬的平均气温(x)与四月棉花害虫化蛹高峰日(y)的关系,某
地区观察了 2003年至 2008年的情况,得到下面数据:
年份 2003 2004 2005 2006 2007 2008
x(℃) 24.4 29.6 32.9 28.7 30.3 28.9
y 19 6 1 10 1 8
已知 x与 y之间具有线性相关关系,据气象预测该地区在 2010年三月下旬平均气温为
27℃,试估计 2010年四月化蛹高峰日为哪天?
20.(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与
相应的生产能耗 y(吨标准煤)的几组对照数据.
x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出 y关于 x的回归直线方程y
^
=b
^
x+a
^
;
(3)已知该厂技改前 100吨甲产品的生产能耗为 90吨标准煤.试根据(2)求出回归直线方
程,预测生产 100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
21.(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种
麦苗的试验田中各抽取 6株麦苗测量麦苗的株高,数据如下:(单位:cm)
甲:9,10,11,12,10,20
乙:8,14,13,10,12,21.
(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;
(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦
苗的长势情况.
22.(12分)从高三抽出 50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.
试利用频率分布直方图求:
(1)这 50名学生成绩的众数与中位数.
(2)这 50名学生的平均成绩.
第二章 统 计(A)
1.C [在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考
察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数
目叫做样本容量.”因此题中所指的对象应是体重,故 A、B错误,样本容量应为 125,
故 D错误.]
2.C [由题意把样本从小到大排序为 x1,x3,x5,1,-x4,-x2,因此得中位数为
1
2
(1
+x5).]
3.B [因 27∶54∶81=1∶2∶3,1
6
×36=6,2
6
×36=12,3
6
×36=18.]
4.C [由点的分布知 x与 y负相关,u与 v正相关.]
5.D [因为数据 x1,x2,x3,x4,x5的平均数是 2,方差是
1
3
,所以 x =2,1
5
∑
5
i=1
(xi-
2)2=1
3
,
因此数据 3x1-2,3x2-2,3x3-2,3x4-2,3x5-2 的平均数为:
1
5
∑
5
i=1
(3xi-2)=3×1
5
∑
5
i=1
xi-2
=4,
方差为:
1
5
∑
5
i=1
(3xi-2- x )2=1
5
∑
5
i=1
(3xi-6)2=9×1
5
∑
5
i=1
(xi-2)2=9×1
3
=3.]
6.D [因为这 24只白鼠要从 4个饲养房中抽取,因此要用分层抽样决定各个饲养房
应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠.C虽然用了分层抽样,
但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明
是否具有随机性,故选 D.]
7.D [根据两个变量具有相关关系的概念,可知 A正确,散点图能直观地描述呈相关
关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以 B、C正
确.只有线性相关的数据才有回归直线方程,所以 D不正确.]
8.B [成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当 x=30
时,y
^
=4.75×30+257=399.5.]
9.D [由于甲地总体均值为 3,中位数为 4,即中间两个数(第 5、6天)人数的平均数
为 4,因此后面的人数可以大于 7,故甲地不符合.乙地中总体均值为 1,因此这 10天
的感染人数总和为 10,又由于方差大于 0,故这 10天中不可能每天都是 1,可以有一
天大于 7,故乙地不符合.丙地中中位数为 2,众数为 3,3出现的最多,并且可以出现
8,故丙地不符合.故丁地符合.]
10.A [由题意知高一、高二、高三的人数分别为 667,667,666.
设 a=2k,b=3k,c=5k,
则 a+b+c=3
5
×2 000,即 k=120.
∴b=3×120=360.
又 2 000人中抽取 200人的样本,即每 10人中抽取一人,则 360人中应抽取 36人,故
选 A.]
11.A [分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数.]
12.B [由数据分布表可知,质量不小于 120克的苹果有 10+3+1=14(个),占苹果总
数的
14
20
×100%=70%.]
13.乙
解析 平均数反映平均水平大小,标准差表明稳定性.标准差越小,稳定性越好.
14.22
15.13 正
16.40
解析 ∵ x =
1
4
(14+12+8+6)=10,
y =
1
4
(22+26+34+38)=30,
∴a
^
= y -b
^ x =30+2×10=50.
∴当 x=5时,y
^
=-2×5+50=40.
17.解 分层抽样方法:
先将总体按其级别分为三层,一级品有 100个,产品按 00,01,…,99编号,二级品有
60个,产品按 00,01,…,59编号,三级品有 40 个,产品按 00,01,…,39编号.因
总体个数∶样本容量为 10∶1,故用简单随机抽样的方法,在一级品中抽 10个,二级
品中抽 6个,三级品中抽 4个.这样就可得到一个容量为 20的样本.
18.解 (1)∵前三组的频率和为
2+4+17
50
=
23
50
<1
2
,
前四组的频率之和为
2+4+17+15
50
=
38
50
>1
2
,
∴中位数落在第四小组内.
(2)频率为:
4
2+4+17+15+9+3
=0.08,
又∵频率=
第二小组频数
样本容量
,
∴样本容量=
频数
频率
=
12
0.08
=150.
(3)由图可估计所求良好率约为:
17+15+9+3
2+4+17+15+9+3
×100%=88%.
19.解 由题意知:
x ≈29.13, y =7.5,∑
6
i=1
x2i=5 130.92,
∑
6
i=1
xiyi=1 222.6,
∴b
^
=
∑
6
i=1
xiyi-6 x y
∑
6
i=1
x2i-6 x 2
≈-2.2,
a
^
= y -b
^ x ≈71.6,
∴回归直线方程为y
^
=-2.2x+71.6.
当 x=27时,y
^
=-2.2×27+71.6=12.2,据此,可估计该地区 2010年 4月 12日或 13
日为化蛹高峰日.
20.解 (1)散点图如下:
(2) x =
3+4+5+6
4
=4.5,
y =
2.5+3+4+4.5
4
=3.5,
∑
4
i=1
xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
∑
4
i=1
x2i=32+42+52+62=86,
∴b
^
=
∑
4
i=1
xiyi-4 x y
∑
4
i=1
x2i-4 x 2
=
66.5-4×3.5×4.5
86-4×4.52
=0.7,
a
^
= y -b
^ x =3.5-0.7×4.5=0.35.
∴y
^
=0.7x+0.35.
∴所求的回归直线方程为y
^
=0.7x+0.35.
(3)现在生产 100吨甲产品用煤
y
^
=0.7×100+0.35=70.35,
∴90-70.35=19.65.
∴生产能耗比技改前降低约 19.65吨标准煤.
21.解 (1)茎叶图如图所示:
(2) x 甲=
9+10+11+12+10+20
6
=12,
x
乙=
8+14+13+10+12+21
6
=13,
s 2甲 =
1
6
×[(9- 12)2+ (10- 12)2+ (11- 12)2+ (12- 12)2+ (10- 12)2+ (20-
12)2]≈13.67,
s 2乙 =
1
6
×[(8- 13)2+ (14- 13)2+ (13- 13)2+ (10- 13)2+ (12- 13)2+ (21-
13)2]≈16.67.
因为 x
甲< x
乙,所以乙种麦苗平均株高较高,
又因为 s2甲0.5,∴中位数应位于第四个小矩形内.
设其底边为 x,高为 0.03,∴令 0.03x=0.2得 x≈6.7,
故中位数约为 70+6.7=76.7.
(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形
底边的中点值乘以每个小矩形的面积即可.
∴平均成绩为 45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+
85×(0.021×10)+95×(0.016×10)≈74.