- 133.00 KB
- 2021-05-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第三章 统计案例
本章归纳整合
高考真题
1.(2011·山东)某产品的广告费用x与销售额y的统计数据如下表:
广告费用x/万元
4
2
3
5
销售额y/万元
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为 ( ).
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析 ∵==,==42,
又=x+必过(,),∴42=×9.4+,∴=9.1.
∴线性回归方程为=9.4x+9.1.
∴当x=6时,=9.4×6+9.1=65.5(万元).
答案 B
2.(2011·江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x/cm
174
176
176
176
178
儿子身高y/cm
175
175
176
177
177
则y对x的线性回归方程为 ( ).
A.=x-1 B.=x+1
C.=88+x D.=176
解析 因为==176,
==176,
又y对x的线性回归方程表示的直线恒过点(,),
所以将(176,176)代入A、B、C、D中检验知选C.
答案 C
3.(2011·陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( ).
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同
D.直线l过点(,)
解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的
绝对值越接近1,两个变量的线性相关程度越强,所以A、B错误.C中n
为偶数时,分布在l两侧的样本点的个数可以不相同,所以C错误.根据回
归直线方程一定经过样本中心点可知D正确,所以选D.
答案 D
4.(2011·广东)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.
解析 小李这5天的平均投篮命中率
==0.5,
可求得小李这5天的平均打篮球时间=3.根据表中数据可求得=0.01,=
0.47,故回归直线方程为=0.47+0.01x,将x=6代入得6号打6小时篮球的
投篮命中率约为0.53.
答案 0.5 0.53
5.(2011·辽宁)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析 由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254.
答案 0.254
6.(2011·安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份
2002
2004
2006
2008
2010
需求量(万吨)
236
246
257
276
286
(1)利用所给数据求年需求量与年份之间的回归直线方程=x+;
(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.
解 (1)由所给数据看出,年需求量与年份之间是近似直线上升的,下面求回归直线方程.为此对数据预处理如下:
年份-2006
-4
-2
0
2
4
需求量-257
-21
-11
0
19
29
对预处理后的数据,容易算得=0,=3.2.
=
==6.5,=-b=3.
由上述计算结果,知所求回归直线方程为
-257=(x-2 006)+=6.5(x-2 006)+3.2,
即=6.5(x-2 006)+260.2. ①
(2)利用直线方程①,可预测2012年的粮食需求量为
6.5×(2012-2006)+260.2=6.5×6+260.2=299.2(万吨).
7.(2010·新课标全国)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性 别
是否需要志愿者
男
女
需要
40
30
不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?
说明理由.
附:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
K2=
解 (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为=14%.
(2)K2=≈9.967.
由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.
(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据
能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此
在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两
层并采用分层抽样方法比采用简单随机抽样方法更好.
8.(2010·辽宁)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)
表1:注射药物A后皮肤疱疹面积的频数分布表
疱疹面积
[60,65)
[65,70)
[70,75)
[75,80)
频数
30
40
20
10
表2:注射药物B后皮肤疱疹面积的频数分布表
疱疹面积
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
频数
10
25
20
30
15
(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;
(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
表3:
疱疹面积小于70 mm2
疱疹面积不
小于70 mm2
总计
注射药物A
a=
b=
注射药物B
c=
d=
总计
n=
附:K2=
P(K2≥k)
0.100
0.050
0.025
0.010
0.001
k
2.706
3.841
5.024
6.635
10.828
解 (1)
从频率分布直方图中可以看出注射药物A后皮肤疱疹面积的中位数在65至70之间,而注射药物B后皮肤疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.
(2)表3:
疱疹面积
小于70 mm2
疱疹面积不
小于70 mm2
总计
注射药物A
a=70
b=30
100
注射药物B
c=35
d=65
100
总计
105
95
n=200
K2=≈24.56.
由于K2>10.828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.