- 210.50 KB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
一、选择题
1.[2016·兰州双基测试]某乡政府调查A、B、C、D四个村的村民外出打工的情况,拟采用分层抽样的方法从四个村中抽取一个容量为500的样本进行调查.已知A、B、C、D四个村的人数之比为4∶5∶5∶6,则应从C村中抽取的村民人数为( )
A.100 B.125
C.150 D.175
答案 B
解析 由题意可知,应从C村中抽取500×=125名村民.
2.[2016·湖北武汉第二次调研]如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45)的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为( )
A.0.04 B.0.06
C.0.2 D.0.3
答案 C
解析 由频率分布直方图的知识得,年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07×
5=0.35,设年龄在[30,35),[35,40),[40,45]的频率为x,y,z,又x,y,z成等差数列,所以可得
解得y=0.2,
所以年龄在[35,40)的网民出现的频率为0.2.故选C.
3.[2016·开封一模]下列说法错误的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
答案 B
解析 根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好.二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C,D正确,故选B.
4.[2016·河南郑州二模]某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价(元)
4
5
6
7
8
9
销量(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程=-4x+a,若在这些样本点中任取一点,则它在回归直线左下方的概率为( )
A. B.
C. D.
答案 B
解析 由表中数据得=6.5,=80.
由(,)在直线=-4x+a上,得a=106.
即线性回归方程为=-4x+106.经过计算只有(5,84)和(9,68)在直线的下方,故所求概率为=,选B.
5.[2016·湖南永州一模]为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
做不到“光盘”
能做到“光盘”
男
45
10
女
30
15
附:
P(K2≥k)
0.10
0.05
0.025
k
2.706
3.841
5.024
K2=.
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”
D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”
答案 C
解析 由题设知,a=45,b=10,c=30,d=15,
所以K2=≈3.0303.
2.706<3.0303<3.841.
由附表可知,有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选C.
二、填空题
6.[2016·石家庄质检二]将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6、24、33的学生,则样本中剩余一名学生的编号是________.
答案 15
解析 根据系统抽样的特点可知抽取的4名学生的编号依次成等差数列,故剩余一名学生的编号是15.
7.[2015·豫北十校联考]2015年的NBA全明星赛于北京时间2015年2月14日举行.如图是参加此次比赛的甲、乙两名篮球运动员以往几场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是________.
答案 64
解析 应用茎叶图的知识得,甲、乙两人这几场比赛得分的中位数分别为28,36,因此甲、乙两人这几场比赛得分的中位数之和是64.
8.[2016·吉林通化月考]某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:
广告费用x(万元)
3
4
5
6
销售额y(万元)
25
30
40
45
根据上表可得回归方程=x+中的为7.据此模型预测广告费用为10万元时销售额为________万元.
答案 73.5
解析 由题表可知,=4.5,=35,代入回归方程=7x+,得=3.5,所以回归方程为=7x+3.5.所以当x=10时,=7×10+3.5=73.5.
三、解答题
9.[2016·河北三市二联]下表是高三某位文科生连续5次月考的历史、政治的成绩,结果统计如下:
月份
9
10
11
12
1
历史(x分)
79
81
83
85
87
政治(y分)
77
79
79
82
83
(1)求该生5次月考历史成绩的平均分和政治成绩的方差;
(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x、y的线性回归方程=x+.
附:==,=-
解 (1)=×(79+81+83+85+87)=83,
∵=×(77+79+79+82+83)=80,
∴s=×[(77-80)2+(79-80)2+(79-80)2+(82-80)2+(83-80)2]=4.8.
(2)∵(xi-)(yi-)=30,(xi-)2=40,
∴=0.75,=- =17.75.
则所求的线性回归方程为=0.75x+17.75.
10.[2016·江淮十校一联]某学校在高一、高二两个年级学生中各抽取100人的样本,进行普法知识调查,其结果如下表:
高一
高二
总数
合格人数
70
x
150
不合格人数
y
20
50
总数
100
100
200
(1)求x,y的值;
(2)有没有99%的把握认为“高一、高二两个年级这次普法知识调查结果有差异”;
(3)用分层抽样的方法从样本的不合格同学中抽取5人的辅导小组,在5人中随机选2人,这2人中,正好高一、高二各1人的概率为多少?
参考公式:χ2=
χ2≥
5.024
6.635
7.879
10.828
97.5%
99%
99.5%
99.9%
解 (1)x=80,y=30.
(2)由(1)得χ2=≈2.67<6.635,
所以没有99%的把握认为“高一、高二两个年级这次普法知识调查结果有差异”.
(3)由分层抽样得从高一抽取3人,设为A,B,C,从高二抽取2人,设为1,2.
从5人中选2人,有(AB),(AC),(A1),(A2),(BC),(B1),(B
2),(C1),(C2),(12),共10种选法.
其中正好高一、高二各1人,有(A1),(A2),(B1),(B2),(C1),(C2),共6种选法.
所以所求概率为P=.
11.[2016·重庆测试]从甲、乙两部门中各任选10名员工进行职业技能测试,测试成绩(单位:分)数据的茎叶图如图1所示:
(1)分别求出甲、乙两组数据的中位数,并比较两组数据的分散程度(只需给出结论);
(2)甲组数据频率分布直方图如图2所示,求a、b、c的值;
(3)从甲、乙两组数据中各任取一个,求所取两数之差的绝对值大于20的概率.
解 (1)甲组数据的中位数为=78.5,乙组数据的中位数为=78.5.
从茎叶图可以看出,甲组数据比较集中,乙组数据比较分散.
(2)由图易知a=0.05,b=0.02,c=0.01.
(3)从甲、乙两组数据中各任取一个,得到的所有基本事件共有100个,其中满足“两数之差的绝对值大于20”的基本事件有16个,故所求概率P==.
12.为了调查学生星期天晚上学习时间的利用问题,某校从高二年级1000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n名学生进行问卷调查.根据问卷取得了这n名同学星期天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组:①[0,30),②[30,60),③[60,90),④[90,120),⑤[120,150),⑥[150, 180),⑦[180,210),⑧[210, 240),得到频率分布直方图如图,已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人.
(1)求n的值并补全频率分布直方图;
(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n名学生,完成下列2×2列联表:
利用时间充分
利用时间不充分
总计
走读生
住宿生
10
总计
据此资料,是否有95%的把握认为学生“利用时间是否充分”与走读、住宿有关?
(3)若在第①组、第②组共抽出2人调查影响有效利用时间的原因,求抽出的2人中第①组、第②组各有1人的概率.
参考数据:
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解 (1)设第i组的频率为Pi(i=1,2,…,8),
由图可知P1=×30=,P2=×30=,
∴学习时间少于60分钟的频率为P1+P2=,
由题意得n×=5,∴n=100.
又P3=×30=,P5=×30=,
P6=×30=,P7=×30=,
P8=×30=,
∴P4=1-(P1+P2+P3+P5+P6+P7+P8)=,
∴第④组的高度为h=×==,
频率分布直方图如图.
(2)由频率分布直方图可知,在抽取的100人中,“住宿生”有55人,“走读生”有45人,利用时间不充分的有100×(P1+P2+P3+P4)=25人,从而2×2列联表如下:
利用时间充分
利用时间不充分
总计
走读生
30
15
45
住宿生
45
10
55
总计
75
25
100
将2×2列联表中的数据代入公式计算,
得K2===
≈3.030.∵3.030<3.841,
∴没有理由认为学生“利用时间是否充分”与走读、住宿有关.
(3)由题可知第①组人数为100×P1=2(人),第②组人数为100×P2=3(人),
记第①组的2人为A1,A2,第②组的3人为B1,B2,B3,
则“从5人中抽取2人”所构成的基本事件有A1A2,A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,B1B2,B1B3,B2B3”,共10个基本事件;
记“抽取2人中第①组、第②组各有1人”记作事件A,则事件A所包含的基本事件有A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,共6个基本事件,
∴P(A)==,
即抽出的2人中第①组、第②组各有1人的概率为.