- 227.61 KB
- 2021-06-15 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
单元质检十 算法初步、统计与统计案例
(时间:45分钟 满分:100分)
单元质检卷第20页
一、选择题(本大题共7小题,每小题7分,共49分)
1.执行如图所示的程序框图,输出的s值为( )
A.12 B.56
C.76 D.712
答案:B
解析:第一步:s=1-12=12,
k=2,k<3;
第二步:s=12+13=56,k=3,
输出s.
故选B.
2.某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图如图所示,则这1 000名学生在该次自主招生水平测试中成绩不低于70分的学生人数是( )
9
A.300 B.400 C.500 D.600
答案:D
解析:依题意,得题中的1000名学生在该次自主招生水平测试中成绩不低于70分的学生人数是1000×(0.035+0.015+0.010)×10=600,故选D.
3.某校共有2 000名学生,各年级男、女生人数如表所示.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.18.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )
一年级
二年级
三年级
女生
363
x
y
男生
387
390
z
A.12 B.16 C.18 D.24
答案:B
解析:由题意可得二年级的女生的人数为2000×0.18=360,则一、二年级学生总数363+387+360+390=1500,故三年级学生总数是2000-1500=500.因此,用分层抽样法在三年级抽取的学生数为64×5002000=16.故选B.
4.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图如图所示,则甲、乙两地PM2.5的方差较小的是( )
A.甲 B.乙
9
C.甲、乙相等 D.无法确定
答案:A
解析:从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地PM2.5的方差较小.
5.(2019云南玉溪高三五调)在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是( )
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
答案:B
解析:由题图可知,随着年龄的增加,脂肪含量的百分比也在不断增加,因此人体脂肪含量与年龄正相关,图中有10个数据点,中间的第5,6个均在20%以下,所以脂肪含量的中位数小于20%.
6.在利用最小二乘法求回归方程y^=0.67x+54.9时,用到了下面表中的5组数据,则表格中a的值为( )
x
10
20
30
40
50
y
62
a
75
81
89
A.68 B.70 C.75 D.72
答案:A
解析:由题意可得x=15(10+20+30+40+50)=30,y=15(62+a+75+81+89)=15(a+307).
9
因为回归直线方程y^=0.67x+54.9过样本点的中心,所以15(a+307)=0.67×30+54.9,解得a=68.
7.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示:
分数段
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
[85,90]
人数
2
3
4
9
5
1
据此估计允许参加面试的分数线是( )
A.75 B.80 C.85 D.90
答案:B
解析:因为参加笔试的400人中择优选出100人,所以每个人被择优选出的概率P=100400=14.因为随机调查24名笔试者,所以估计能够参加面试的人数为24×14=6.观察表格可知,分数在[80,85)的有5人,分数在[85,90)的有1人,故面试的分数线大约为80分,故选B.
二、填空题(本大题共2小题,每小题7分,共14分)
8.若一组样本数据2,3,7,8,a的平均数为5,则该组数据的方差s2= .
答案:265
解析:∵2+3+7+8+a5=5,∴a=5.∴s2=15[(2-5)2+(3-5)2+(7-5)2+(8-5)2+(5-5)2]=265.
9.执行如图所示的程序框图,若输出的结果为80,则判断框内应填入 .
答案:n>7?
解析:模拟程序的运行,可得S=0,n=1,a=3,执行循环体,S=3,a=5,
不满足条件,执行循环体,n=2;S=8,a=7,
9
不满足条件,执行循环体,n=3;S=15,a=9,
不满足条件,执行循环体,n=4;S=24,a=11,
不满足条件,执行循环体,n=5;S=35,a=13,
不满足条件,执行循环体,n=6;S=48,a=15,
不满足条件,执行循环体,n=7;S=63,a=17,
不满足条件,执行循环体,n=8;S=80,a=19,
由题意,此时满足条件,退出循环,输出的S结果为80,
则判断框内应填入“n>7?”.
三、解答题(本大题共3小题,共37分)
10.(12分)从某校随机抽取200名学生,获得了他们一周课外阅读时间(单位:h)的数据,整理得到数据的频数分布表和频率分布直方图(如图).
编 号
分 组
频 数
1
[0,2)
12
2
[2,4)
16
3
[4,6)
34
4
[6,8)
44
5
[8,10)
50
6
[10,12)
24
7
[12,14)
12
8
[14,16)
4
9
[16,18]
4
合 计
200
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12 h的概率;
(2)求频率分布直方图中的a,b的值;
9
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的200名学生该周课外阅读时间的平均数在第几组.
解:(1)由频率分布表可知该周课外阅读时间不少于12h的频数为12+4+4=20,故可估计该周课外阅读时间少于12h的概率为1-20200=0.9.
(2)由频率分布表可知数据在[4,6)的频数为34,故这一组的频率为0.17,即a=0.085,数据在[8,10)的频数为50,故这一组的频率为0.25,即b=0.125.
(3)数据的平均数为1200(1×12+3×16+5×34+7×44+9×50+11×24+13×12+15×4+17×4)=7.68(h),故样本中的200名学生该周课外阅读时间的平均数在第四组.
11.(12分)(2019广东深圳高三二调)某网店销售某种商品,为了解该商品的月销量y(单位:千件)与月售价x(单位:元/件)之间的关系,对近几年的月销售量yi和月销售价xi(i=1,2,3,…,10)数据进行了统计分析,得到了下面的散点图:
(1)根据散点图判断,y=c+dln x与y=bx+a哪一个更适宜作为月销量y关于月销售价x的回归方程类型?(给出判断即可,不需说明理由)并根据判断结果及表中数据,建立y关于x的回归方程;
(2)利用(1)中的结果回答问题:已知该商品的月销售额为z(单位:千元),当月销售量为何值时,商品的月销售额预报值最大?(月销售额=月销售量×当月售价)
参考公式、参考数据及说明:
①对一组数据(v1,w1),(v2,w2),…,(vn,wn),其回归直线w^=α^+β^v的斜率和截距的最小二乘法估计分别为β^=∑i=1n(wi-w)(vi-v)∑i=1n(vi-v)2,α^=w-β^v.
②参考数据:
9
x
y
u
∑i=110(xi-x)2
∑i=110(ui-u)2
∑i=110(xi-x)·
(yi-y)
∑i=110(ui-u)·
(yi-y)
6.50
6.60
1.75
82.50
2.70
-143.25
-27.54
表中ui=ln xi,u=110∑i=110ui.
③计算时,所有的小数都精确到0.01,如ln 4.06≈1.40.
解:(1)y=c+dlnx更适宜销量y关于月销售价x的回归方程类型.
令u=lnx,先建立y关于u的线性回归方程,
由于d^=∑i=110(yi-y)(ui-u)∑i=110(ui-u)2=-27.542.70=-10.20,
c^=y-d^u=6.6+10.20×1.75=24.45,
所以y关于u的线性回归方程为y^=24.45-10.20u,
因此y关于x的线性回归方程为y^=24.45-10.20ln x,
(2)依题意得:z=xy=x(24.45-10.20ln x),
z'=xy=[x(24.45-10.20ln x)]'=14.25-10.20ln x,
令z'=0,即14.25-10.20ln x=0,解得ln x≈1.40,
所以x≈4.06,
当x∈(0,4.06)时,z递增,当x∈(4.06,+∞)时,z递减,
故当x=4.06,即月销售量y=10.17(千件)时,月销售额预报值最大.
12.(13分)某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的课外体育锻炼平均每天运动的时间(单位:min)进行调查,将收集到的数据分成[0,10),[10,20),[20,30),[30,40),[40,50),[50,60]六组,并作出频率分布直方图(如图).将日均课外体育锻炼时间不低于40 min的学生评价为“课外体育达标”.
9
(1)请根据频率分布直方图中的数据填写下面的2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关?
课外体育不达标
课外体育达标
总计
男
60
女
110
总计
(2)现从“课外体育达标”学生中按分层抽样抽取5人,再从这5名学生中随机抽取2人参加体育知识问卷调查,求抽取的这2人课外体育锻炼时间都在[40,50)内的概率.
附参考公式与数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)
P(K2≥k0)
0.10
0.05
0.010
0.005
0.001
k0
2.706
3.841
6.635
7.879
10.828
解:(1)根据频率分布直方图,得“课外体育达标”的学生数为200×(0.020+0.005)×10=50.
由2×2列联表可知“课外体育达标”的男生人数为30,女生人数为20.
补全2×2列联表如下:
课外体育不达标
课外体育达标
总计
男
60
30
90
女
90
20
110
总计
150
50
200
计算K2的观测值
k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=200×(60×20-90×30)290×110×150×50≈6.061<6.635,
故在犯错误的概率不超过0.01的前提下不能认为“课外体育达标”与性别有关.
9
(2)从“课外体育达标”学生中按分层抽样抽取5人,其中课外体育锻炼时间在[40,50)内有5×0.0200.020+0.005=4(人),分别记为a,b,c,d;
在[50,60]上有1人,记为E.
从这5人中抽取2人,总的基本事件有ab,ac,ad,aE,bc,bd,bE,cd,cE,dE共10种,其中2人都在[40,50)内的基本事件有ab,ac,ad,bc,bd,cd共6种,故所求的概率为610=0.6.
9