- 183.50 KB
- 2021-06-10 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
1.(2019·南昌市第一次模拟测试)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5).根据收集到的数据可知x1+x2+x3+x4+x5=150,由最小二乘法求得回归直线方程为=0.67x+54.9,则y1+y2+y3+y4+y5的值为( )
A.75 B.155.4
C.375 D.466.2
解析:选C.由x1+x2+x3+x4+x5=150,得=30,代入回归直线方程=0.67x+54.9,得=75,则y1+y2+y3+y4+y5=375.
2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=,
算得K2=≈7.8.
附表:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
解析:选C.根据独立性检验的定义,由K2≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.
3.(2019·赣州摸底考试)在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动.经计算xi=11,yi=13,x=21,则实数b的值为________.
解析:令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-,此时t==,y==
,代入y=bt-,得=b×-,解得b=.
答案:
4.有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表:
优秀
不优秀
总计
甲班
10
35
45
乙班
7
38
45
总计
17
73
90
利用列联表的独立性检验估计,则成绩与班级________.(填“有关”或“无关”)
解析:成绩与班级有无关系,就是看随机变量的值与临界值2.706的大小关系.
由公式得K2的观测值k=≈0.653<2.706,所以成绩与班级无关.
答案:无关
5.(2019·广东省六校联考)某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为.
优秀
非优秀
总计
甲班
10
乙班
30
总计
110
(1)请完成上面的列联表;
(2)根据列联表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”.
参考公式与临界值表:K2=.
P(K2≥k0)
0.100
0.050
0.025
0.010
0.001
k0
2.706
3.841
5.024
6.635
10.828
解:(1)列联表如下:
优秀
非优秀
总计
甲班
10
50
60
乙班
20
30
50
总计
30
80
110
(2)根据列联表中的数据,得到
K2=≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.
6.(2019·成都市第二次诊断性检测)某项科研活动共进行了5次试验,其数据如下表所示:
次数
特征量
第1次
第2次
第3次
第4次
第5次
x
555
559
551
563
552
y
601
605
597
599
598
(1)从特征量y的5次试验数据中随机地抽取两个数据,求至少有一个大于600的概率;
(2)求特征量y关于x的线性回归方程=x+,并预测当特征量x为570时特征量y的值.
分别为=
解:(1)记“至少有一个大于600”为事件A,
则P(A)=1-=.
(2)由题中表格可知,==556,==600.所以===0.3,=-=600-0.3×556=433.2,
所以线性回归方程为=0.3x+433.2.
当x=570时,=0.3×570+433.2=604.2
故特征量x为570时,特征量y的估计值为604.2.
1.(2019·张掖市第一次诊断考试)中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:
年龄
[15,25)
[25,35)
[35,45)
[45,55)
[55,65]
支持“延迟
15
5
15
28
17
退休”的人数
(1)由以上统计数据填2×2列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;
45岁以下
45岁以上
总计
支持
不支持
总计
(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人.
(ⅰ)抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率.
(ⅱ)记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望.
参考数据:
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
K2=
解:(1)列联表如下:
45岁以下
45岁以上
总计
支持
35
45
80
不支持
15
5
20
总计
50
50
100
因为K2===6.25>3.841,
所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.
(2)(ⅰ)抽到1人是45岁以下的概率为=,抽到1人是45岁以下且另一人是45岁以上的概率为=.
故所求概率为=.
(ⅱ)从不支持“延迟退休”的人中抽取8人,则45岁以下的应抽6人,45岁以上的应抽2人.
则X=0,1,2.
P(X=0)==,P(X=1)===,
P(X=2)==.
可得随机变量X的分布列为
X
0
1
2
P
故E(X)=1×+2×=.
2.(2019·广东汕头模拟)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:
使用年数x
2
3
4
5
6
7
售价y
20
12
8
6.4
4.4
3
z=ln y
3.00
2.48
2.08
1.86
1.48
1.10
下面是z关于x的折线图:
(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明;
(2)求y关于x的回归方程,并预测某辆A型号二手车当使用年数为9年时售价约为多少;(、小数点后保留两位有效数字)
(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年.
参考公式:==,=-,r=
参考数据:
xiyi=187.4,xizi=47.64,x=139,
≈4.18, ≈13.96,
≈1.53,ln 1.46≈0.38,ln 0.711 8≈-0.34.
解:(1)由题意,知=×(2+3+4+5+6+7)=4.5,
=×(3+2.48+2.08+1.86+1.48+1.10)=2,
又xizi=47.64,≈4.18,
≈1.53,
所以r==-≈-0.99,
所以z与x的相关系数大约为-0.99,说明z与x的线性相关程度很高.
(2)==-≈-0.36,
所以=-=2+0.36×4.5=3.62,
所以z与x的线性回归方程是=-0.36x+3.62,
又z=ln y,所以y关于x的回归方程是=e-0.36x+3.62.
令x=9,得=e-0.36×9+3.62=e0.38,因为ln 1.46≈0.38,所以=1.46,即预测某辆A型号二手车当使用年数为9年时售价约为1.46万元.
(3)当≥0.711 8,即e-0.36x+3.62≥0.711 8=eln 0.711 8=e-0.34时,则有-0.36x+3.62≥-0.34,解得x≤11,因此,预测在收购该型号二手车时车辆的使用年数不得超过11年.