- 3.58 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
透析高考数 23题对对碰【 精品】 第三篇 主题18 随机变量分布列与统计(理)
【主题考法】本主题考题类型为解答题,以应用题为背景以茎叶图、频率分布直方图、条形图等统计数表为载体,考查运用排列组合值求古典概型、几何概型、互斥事件和概率公式、相互独立事件积概率、条件概率、n次独立重复试验、离散型随机变量分布列及其期望与方差、正态分布等数 知识与方法,考查抽样方法、总体估计、回归分析与独立性检验等统计知识和方法,考查运算求解能力、阅读理解能力、应用意识,难度为中档题,分值12分.
【主题考前回扣】
1.抽样方法
简单随机抽样、分层抽样、系统抽样.
①从容量为N的总体中抽取容量为n的样本,则每个个体被抽到的概率都为;
②分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量.
2.统计中四个数据特征
①众数 在样本数据中,出现次数最多的那个数据;
②中位数 在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数;
③平均数 样本数据的算术平均数,
即=(x1+x2+…xn);
④方差与标准差
方差 s2=[(x1-)2+(x2-)2+…+(xn-)2].
标准差 =
s=.
3.直方图的三个结论
①小长方形的面积=组距×=频率;
②各小长方形的面积之和等于1;
③小长方形的高=,所有小长方形高的和为.
4.回归分析(1)回归直线=x+经过样本点的中心点(,),若x取某一个值代入回归直线方程=x+中,可求出y的估计值.
5.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
n
则 2=(其中n=a+b+c+d为样本容量).
利用随机变量 2 判断“两个分类变量有关系”的方法称为独立性检验.如果 2的观测值 越大,说明“两个分类变量有关系”的可能性越大.
6.牢记概念与公式
(1)概率的计算公式
①古典概型的概率计算公式
P(A)=;
②互斥事件的概率计算公式
P(A∪B)=P(A)+P(B);
③对立事件的概率计算公式
P()=1-P(A);
④几何概型的概率计算公式
P(A)=.
7.八组公式
①离散型随机变量的分布列的两个性质
(ⅰ)pi≥0(i=1,2,…,n);(ⅱ)p1+p2+…+pn=1.
②期望公式
E(X)=x1p1+x2p2+…+xnpn.
③期望的性质
(ⅰ)E(aX+b)=aE(X)+b;
(ⅱ)若X~B(n,p),则E(X)=np;
(ⅲ)若X服从两点分布,则E(X)=p.
④方差公式
D(X)=[x1-E(X)]2·p1+[x2-E(X)]2·p2+…+[xn-E(X)]2·pn,标准差为.
⑤方差的性质
(ⅰ)D(aX+b)=a2D(X);
(ⅱ)若X~B(n,p),则D(X)=np(1-p);
(ⅲ)若X服从两点分布,则D(X)=p(1-p).
⑥独立事件同时发生的概率计算公式
P(AB)=P(A)P(B).
⑦独立重复试验的概率计算公式
Pn( )=Cp (1-p)n- .
⑧条件概率公式
P(B|A)=.
【易错点提醒】
1.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
2.利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义
(1)最高的小长方形底边中点的横坐标即是众数; -
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3.在独立性检验中, 2=(其中n=a+b+c+d)所给出的检验随机变量 2的观测值 ,并且 的值越大,说明“X与Y有关系”成立的可能性越大,可以利用数据 确定“X与Y有关系”的可信程度.
4.混淆直线方程y=ax+b与回归直线=x+系数的含义,导致回归分析中致误.
5.应用互斥事件的概率加法公式,一定要注意首先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.
6.正确区别互斥事件与对立事件的关系 对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件.
7.要注意概率P(A|B)与P(AB)的区别
(1)在P(A|B)中,事件A,B发生有时间上的差异,B先A后;在P(AB)中,事件A,B同时发生.
(2)样本空间不同,在P(A|B)中,事件B成为样本空间;在P(AB)中,样本空间仍为Ω,因而有P(A|B)≥P(AB).
8.易忘判定随机变量是否服从二项分布,盲目使用二项分布的期望和方差公式计算致误.
【主题考向】
考向一 抽样方法与总体估计
【解决法宝】1.分层抽样的本质是按比例确定每层抽取个体的个数。
2.解决总体分布估计问题,若利用频率分布直方图求众数,即最高的小长方形底边中点的横坐标即是众数;若利用频率分布直方图求为中位数,即利用中位数左边和右边的小长方形的面积和是相等的求解;若为利用频率分布直方图求平均数,即为频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和;若为估计某个范围上的概率或频数,根据频率分布直方图求出该范围上所有频率之和即为概率,频率乘以样本容量即为频数.
.3.给出样本的茎叶图,出现次数最多的样本数据即为众数,数据从小到大排成一列,若中间为一个数,该数为中位数,若中间为两个数,则中间两个数的平均值为中位数,均值和方差利用均值和方差公式计算出样本的均值和方差即为总体的均值与方差.
例1.【宁夏石嘴山市三中2018届一模】某校从参加高一年级期末考试的 生中抽出60名 生,将其数 成绩(均为整数)分成六段后,画出如下部分频率分布直方图.观察图形的信息,回答下列问题
(1)求第四小组的频率,补全频率分布直方图,并求样本数据的众数,中位数,平均数和方差,(同一组中的数据用该区间的中点值作代表);
(2)从被抽取的数 成绩是分以上(包括分)的 生中选两人,求他们在同一分数段的概率;
(3)假设从全市参加高一年级期末考试的 生中,任意抽取个 生,设这四个 生中数 成绩为分以上(包括分)的人数为(以该校 生的成绩的频率估计概率),求的分布列和数 期望.
【分析】(1)通过各组的频率和等于,求出第四组的频率,考查直方图,面积一半的横坐标就是中位数,每个矩形的中点横坐标与该矩形的纵坐标相乘后求和,即可得到平均数,最高矩形的中点横坐标为众数,利用方差公式可求得方差;(2)分别求出, , 的人数是, ,
,然后根据组合知识利用古典概型概率求解即可;(3), 即可写出分布列,利用二项分布的期望公式可得结果.
【解析】(1)因为各组的频率和等于1,故第四组的频率
.
直方图如图所示.
中位数是,
样本数据中位数是分.众数是75;=71;=194
(2), , 的人数是, , ,所以从成绩是分以上(包括分)的 生中选两人,他们在同一分数段的概率
.
考向二 独立性检验
【解决法宝】对独立性检验问题,根据条件列出2×2列联表,根据实际问题需要的可信度确定临界值;利用公式=,由观测数据计算得到随机变量的观测值;如果>,就以的把握认为“与有关系”;否则就说样本观测值没有提供“与有关系”的充分证据.
例2【云南省保山市2018届第二次市统测某校进行文 、理 数 成绩对比,某次考试后,各随机抽取100名同 的数 考试成绩进行统计,其频率分布表如下.
(Ⅰ)根据数 成绩的频率分布表,求理 数 成绩的中位数的估计值;
(Ⅱ)请填写下面的列联表,并根据列联表判断是否有90 的把握认为数 成绩与文理 有关
(Ⅲ)设文理 数 成绩相互独立,记表示事件“文 、理 数 成绩都大于等于120分”,估计的概率.
附
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【分析】(1)利用频率分布直方图求出中位数的估计值;(2)计算,根据表格中的数据,作出判断;(3)记B表示“文 数 成绩大于等于120分”,C表示“理 数 成绩大于等于120分”,由于文理 数 成绩相互独立,利用概率乘法公式即可得到结果.
【解析】(Ⅰ)理 数 成绩的频率分布表中,成绩小于105分的频率为0.35<0.5,
成绩小于120分的频率为0.75>0.5,
故理 数 成绩的中位数的估计值为分.
(Ⅱ)根据数 成绩的频率分布表得如下列联表
数 成绩分
数 成绩分
合计
理
25
75
100
文
22
78
100
合计
47
153
200
,
故没有90 的把握认为数 成绩与文理 有关.
(Ⅲ)记B表示“文 数 成绩大于等于120分”,C表示“理 数 成绩大于等于120分”,
由于文理 数 成绩相互独立,
所以A的概率.
考向三 回归分析
【解决法宝】回归分析问题的处理步骤 先画出散点图,利用散点图判定两个变量是否先线性相关,若不线性相关,根据散点图选择合适的拟合函数,然后对拟合函数进行变换,化为线性相关问题;第二步,若样本数据较小,选第二个公式求,若样本数据较大但与样本均值差较小用第1个公式求,再利用回归直线过样本中心点求,得到回归直线方程;第三步,利用回归方程进行预测或对回归模型进行回归分析.
例3.【湖北省荆州中 等“四地七校2018届2月联考】已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度(单位),对某种鸡的时段产蛋量(单位 )和时段投入成本(单位 万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度和产蛋量的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.
其中, .
(1)根据散点图判断, 与哪一个更适宜作为该种鸡的时段产蛋量关于鸡舍时段控制温度的回归方程类型?(给判断即可,不必说明理由)
(2)若用作为回归方程模型,根据表中数据,建立关于的回归方程;
(3)已知时段投入成本与的关系为,当时段控制温度为时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?
附 ①对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计分别为,
②
【分析】(1)由散点图可作出判断;(2)由得,令, , ,由图表中的数据可知, ,从而得到关于的回归方程;(3)根据回归直线方程得到时, , .
【解析】(1)适宜
(2)由得
令, ,
由图表中的数据可知,
∴
∴关于的回归方程为
(3)时,由回归方程得,
即鸡舍的温度为时,鸡的时段产量的预报值为515.4,投入成本的预报值为48.432.
考向四 随机变量的分布列、期望和方差
【解决法宝】1.求离散型随机变量的分布列的关键是正确理解随机变量取每一个值所表示的具体事件,然后综合应用各类求概率的公式,求出概率;
2. 求随机变量的均值和方差的关键是正确求出随机变量的分布列,若随机变量服从二项分布(或两点分布),则可直接利用公式求解.
例4【2018届北京市北京101中 3月份零模】摩拜单车和小黄车等各种共享单车的普及给我们的生活带 了便利.已知某共享单车的收费标准是 每车使用不超过1小时(包含1小时)是免费的,超过1小时的部分每小时收费1元(不足1小时的部分按1小时计算,例如 骑行2.5小时收费2元).现有甲、乙两人各自使用该种共享单车一次.设甲、乙不超过1小时还车的概率分别为1小时以上且不超过2小时还车的概率分别为两人用车时间都不会超过3小时.
(Ⅰ)求甲乙两人所付的车费相同的概率;
(Ⅱ)设甲乙两人所付的车费之和为随机变量求的分布列及数 期望
【分析】(1)同题意可知所付费用相同即为0,2,4元,即相互独立事件同时发生的概率。(2)甲乙两个所付费用之和为 可为0,2,4,6,8, 分清楚每个情况分成多少种互斥事件,再根据相互独立事件同时发生求得每一类概率。
(Ⅱ)设甲乙两个所付费用之和为 可为0,2,4,6,8,
随机变量的分布列是
数 期望.
例5 【江苏省南通、徐州、扬州等六市2018届二模】在某公司举行的年终庆典活动中,主持人利用随机抽奖软件进行抽奖 由电脑随机生成一张如图所示的33表格,其中1格设奖300元,4格各设奖200元,其余4格各设奖100元,点击某一格即显示相应金额.某人在一张表中随机不重复地点击3格,记中奖的总金额为X元.
(1)求概率;
(2)求的概率分布及数 期望.
【分析】(1)从33表格中随机不重复地点击3格,共有种不同情形,再将事件分类,根据古典概型概率公式求得概率;(2)先确定的所有可能值为300,400,500,600,700,再分别求出对应的概率,列出分布列,最后根据数 期望公式求期望.
(2)的所有可能值为300,400,500,600,700.
则, ,
, .
∴的概率分布列为
X
300
400
500
600
700
P
∴(元).
例6 【山东省聊城市2018届一模】某教育培训中心共有25名教师,他们全部在校外住宿.为完全起见, 校派专车接送教师们上下班.这个接送任务承包给了司机王师傅,正常情况下王师傅用34座的大客车接送教师.由于每次乘车人数不尽相同,为了解教师们的乘车情况,王师傅连续记录了100次的乘车人数,统计结果如下
乘车人数
15
16
17
18
19
20
21
22
23
24
25
频数
2
4
4
10
16
20
16
12
8
6
2
以这100次记录的各乘车人数的频率作为各乘车人数的概率.
(Ⅰ)若随机抽查两次教师们的乘车情况,求这两次中至少有一次乘车人数超过18的概率;
(Ⅱ)有一次,王师傅的大客车出现了故障,于是王师傅准备租一辆小客车 临时送一次需要乘车的教师.可供选择的小客车只有20座的型车和22座的型车两种, 型车一次租金为80元, 型车一次租金为90元.若本次乘车教师的人数超过了所租小客车的座位数,王师傅还要付给多出的人每人20元钱供他们乘出租车.以王师傅本次付出的总费用的期望值为依据,判断王师傅租哪种车较合算?
【分析】(Ⅰ)由统计数据可得在一次接送中,乘车人数超过18的概率为0.8,然后根据对立事件和独立事件的概率求解即可得到结论.(Ⅱ)设表示租用型车的总费用,则的所有可能取值为80,100,120,140,160,180,结合题意求得相应的概率后可得的分布列,然后求得;同样设表示租用型车的总费用,则可得,故租型车较合算.
【解析】(Ⅰ)由题意得,在一次接送中,乘车人数超过18的概率为0.8.
记“抽查的两次中至少有一次乘车人数超过18”为事件,
则 .
即抽查的两次中至少有一次乘车人数超过18的概率为0.96.
(Ⅱ)设表示租用型车的总费用(单位 元),则的分布列为
80
100
120
140
160
180
0.56
0.16
0.12
0.08
0.06
0.02
.
设表示租用型车的总费用(单位 元),则的分布列为
90
110
130
150
0.84
0.08
0.06
0.02
.
因此以王师傅本次付出的总费用的期望值为依据,租型车较合算.
【主题集训】
1.【内蒙古包头市2018届一模】某地区对一种新品种小麦在一块试验田进行试种.从试验田中抽取株小麦,测量这些小麦的生长指标值,由测量结果得如下频数分布表
生长指标值分组
频数
(1)在相应位置上作出这些数据的频率分布直方图;
(2)求这株小麦生长指标值的样本平均数和样本方差(同一组中的数据用该组区间的中点值作代表);
(3)由直方图可以认为,这种小麦的生长指标值服从正态分布,其中近似为样本平均数, 近似为样本方差.
①利用该正态分布,求;
②若从试验田中抽取株小麦,记表示这株小麦中生长指标值位于区间的小麦株数,利用①的结果,求.
附 . -
若,则,
.
【解析】(1)画图.
(3)①由(1)知,从而
.
②由①知,一株小麦的生长指标值位于区间的概率为,
依题意知,
所以.
2.【广西桂林、贺州、崇左三市2018届二联考】在创建“全国文明卫生城”过程中,某市“创城办”为了调查市民对创城工作的了解情况,进行了一次创城知识问卷调查(一位市民只能参加一次).通过随机抽样,得到参加问卷调查的1000人的得分(满分100分)统计结果如下表所示.
组别
频数
25
150
200
250
225
100
50
(1)由频数分布表可以大致认为,此次问卷调查的得分服从正态分布, 近似为这1000人得分的平均值值(同一组数据用该组数据区间的中点值表示),请用正态分布的知识求;
(2)在(1)的条件下,“创城办”为此次参加问卷调查的市民制定如下奖励方案
(ⅰ)得分不低于的可以获赠2次随机话费,得分低于的可以获赠1次随机话费;
(ⅱ)每次获赠送的随机话费和对应的概率为
赠送的随机话费(单元 元)
20
40
概率
0.75
0.25
现有市民甲要参加此次问卷调查,记 (单位 元)为该市民参加问卷调查获赠的话费,求的分布列与数 期望.
附 参考数据与公式
,若,则①;
②;③.
【解析】(1).
故, ,
∴,
.
∴
综上,
.
(2)易知
获赠话费的可能取值为20,40,60,80.
;
;
;
.
的分布列为
20
40
60
80
∴.
3.【湖南省三湘名校教育联盟2018届三联考】2016年1月1日,我国实行全面二孩政策,同时也对妇幼保健工作提出了更高的要求.某城市实行 格化管理,该市妇联在 格1与 格2两个区域内随机抽取12个刚满8个月的婴儿的体重信息,休重分布数据的茎叶图如图所示(中位 斤,2斤1千克).体重不超过9.8的为合格.
(1)从 格1与 格2分别随机抽取2个婴儿,求 格1至少一个 婴儿体重合格且 格2至少一个婴儿体重合格的概率;
(2)妇联从 格1内8个婴儿中随机抽取4个进行抽检,若至少2个 婴儿合格,则抽检通过,若至少3个合格,则抽检为良好.求 格1在抽检通过的条件下,获得抽检为良好的概率;
(3)若从 格1与 格2内12个婴儿中随机抽取2个,用表示 格2内婴儿的个数,求的分布列与数 期望.
【解析】(1)由茎叶图知, 格1内体重合格的婴儿数为4, 格2内体重合格的婴儿数为2,则所求概率.
(3)由题意知, 的所有可能取值为0,1,2.
∴, , ,
∴的分布列为
∴.
4.【云南省昆明市2018届第二次统考】在贯彻中共中央国务院关于精准扶贫政策的过程中,某单位定点帮扶甲、乙两个村各50户贫困户.为了做到精准帮扶,工作组对这100户村民的年收入情况、劳动能力情况、子女受教育情况、危旧房情况、患病情况等进行调查,并把调查结果转化为各户的贫困指标和,制成下图,其中“”表示甲村贫困户,“”表示乙村贫困户. -
若,则认定该户为“绝对贫困户”,若,则认定该户为“相对贫困户”,若,则认定该户为“低收入户”;
若,则认定该户为“今年能脱贫户”,否则为“今年不能脱贫户”.
(1)从甲村50户中随机选出一户,求该户为“今年不能脱贫的绝对贫困户”的概率;
(2)若从所有“今年不能脱贫的非绝对贫困户”中选3户,用表示所选3户中乙村的户数,求的分布列和数 期望;
(3)试比较这100户中,甲、乙两村指标的方差的大小(只需写出结论).
【解析】(1)由图知,在甲村50户中,“今年不能脱贫的绝对贫困户”有5户,
所以从甲村50户中随机选出一户,该户为“今年不能脱贫的绝对贫困户”的概率为
(2)由图知,“今年不能脱贫的非绝对贫困户”有10户,其中甲村6户,乙村4户,依题意,
的可能值为0,1,2,3.从而
, ,
, .
所以的分布列为
故的数 期望.
(3)这100户中甲村指标的方差大于乙村指标的方差.
5.【山西省平遥中 2018届高三3月考】随着 络的发展, 上购物越 越受到人们的喜爱,各大购物 站为增加收入,促销策略越 越多样化,促销费用也不断增加.下表是某购物 站2017年1-8月促销费用(万元)和产品销量(万件)的具体数据.
(1)根据数据可知与具有线性相关关系,请建立关于的回归方程(系数精确到);
(2)已知6月份该购物 站为庆祝成立1周年,特制定奖励制度 以(单位 件)表示日销量, ,则每位员工每日奖励100元; ,则每位员工每日奖励150元; ,则每位员工每日奖励200元.现已知该 站6月份日销量服从正态分布,请你计算某位员工当月奖励金额总数大约多少元.(当月奖励金额总数精确到百分位)
参考数据 , ,其中, 分别为第个月的促销费用和产品销量, .
参考公式
(1)对于一组数据, , , ,其回归方程
的斜率和截距的最小二乘估计分别为, .
(2)若随机变量服从正态分布,则, .
【解析】(1)由题可知, ,
将数据代入得
所以关于的回归方程
6.【河北省衡水中 2018届十模】一只药用昆虫的产卵数与一定范围内的温度有关,现收集了该种药用昆虫的组观测数据如下表
温度
产卵数/个
经计算得 , , , , ,线性回归模型的残差平方和
, ,其中, 分别为观测数据中的温差和产卵数, .
(1)若用线性回归方程,求关于的回归方程(精确到);
(2)若用非线性回归模型求得关于回归方程为,且相关指数.
(i)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好.
(ii)用拟合效果好的模型预测温度为时该种药用昆虫的产卵数(结果取整数).
附 一组数据, ,…, ,其回归直线的斜率和截距的最小二乘估计为, ;相关指数
【解析】(1)由题意得, ,
∴,
∴关于的线性回归方程为.
(ii)由(i)得当温度时, .
又∵,∴(个).
即当温度时,该种药用昆虫的产卵数估计为个.
7.【山西省2018届一模】某快递公司收取快递费用的标准是 重量不超过的包裹收费10元;重量超过的包裹,除收费10元之外,超过的部分,每超出(不足,按计算)需再收5元.该公司将最近承揽的100件包裹的重量统计如下
公司对近60天,每天揽件数量统计如下表
以上数据已做近似处理,并将频率视为概率.
(1)计算该公司未 3天内恰有2天揽件数在之间的概率;
(2)①估计该公司对每件包裹收取的快递费的平均值;
②公司将快递费的三分之一作为前台工作人员的工资和公司利润,剩余的用作其他费用.目前前台有工作人员3人,每人每天揽件不超过150件,工资100元.公司正在考虑是否将前台工作人员裁减1人,试计算裁员前后公司每日利润的数 期望,并判断裁员是否对提高公司利润更有利?
【解析】(1)样本中包裹件数在之间的天数为48,频率,
故可估计概率为,
显然未 3天中,包裹件数在之间的天数服从二项分布,
即,故所求概率为;
(2)①样本中快递费用及包裹件数如下表
故样本中每件快递收取的费用的平均值为(元),
故该公司对每件快递收取的费用的平均值可估计为15元.
②根据题意及(2)①,揽件数每增加1,可使前台工资和公司利润增加(元),
将题目中的天数转化为频率,得
若不裁员,则每天可揽件的上限为450件,公司每日揽件数情况如下
故公司平均每日利润的期望值为(元);
若裁员1人,则每天可揽件的上限为300件,公司每日揽件数情况如下
故公司平均每日利润的期望值为(元)
因,故公司将前台工作人员裁员1人对提高公司利润不利.
8.【北京市首师附中2018届零模】从某自动包装机包袋的食盐中,随机抽取袋作为样本,按各袋的质量(单位 )分成四组, ,相应的样本频率分布直方图如图所示.
(Ⅰ)估计样本的中位数是多少?落入的频数是多少?
(Ⅱ)现从这台自动包装机包袋的大批量食盐中,随机抽取袋,记表示食盐质量属于的袋数,依样本估计总体的统计思想,求的分布列及期望.
试卷
随机变量的分布列是
数 期望.
9.【湖南省郴州市2018届二质监】某公司想了解对某产品投入的宣传费用与该产品的营业额的影响.下面是以往公司对该产品的宣传费用 (单位 万元)和产品营业额 (单位 万元)的统计折线图.
(Ⅰ)根据折线图可以判断,可用线性回归模型拟合宣传费用与产品营业额的关系,请用相关系数加以说明;
(Ⅱ)建立产品营业额关于宣传费用的归方程;
(Ⅲ)若某段时间内产品利润与宣传费和营业额的关系为,应投入宣传费多少万元才能使利润最大,并求最大利润.
参考数据 , , , ,
参考公式 相关系数,
,
回归方程中斜率和截距的最小二乘佔计公式分别为, .(计算结果保留两位小数)
【解析】(Ⅰ)由折线图中数据和参考数据得 , ,
因为与的相关系数近似为0.99,说明与的线性相关程度相当高,从而可以用线性回归模型拟合与的关系.
10.【湖北省黄冈、黄石等八市2018届3月联考】2017年5月, 自“一带一路”沿线的20国青年评选出了中国的“新四大发明” 高铁、扫码支付、共享单车和 购。为拓展市场,某调研组对甲、乙两个品牌的共享单车在5个城市的用户人数进行统计,得到如下数据
城市品牌
Ⅰ
Ⅱ
Ⅲ
Ⅳ
Ⅴ
甲品牌(百万)
4
3
8
6
12
乙品牌(百万)
5
7
9
4
3
(Ⅰ)如果共享单车用户人数超过5百万的城市称为“优质潜力城市”,否则“非优”,请据此判断是否有85 的把握认为“优质潜力城市”与共享单车品牌有关?
(Ⅱ)如果不考虑其它因素,为拓展市场,甲品牌要从这5个城市中选出3个城市进行大规模宣传.
①在城市Ⅰ被选中的条件下,求城市Ⅱ也被选中的概率;
②以表示选中的城市中用户人数超过5百万的个数,求随机变量的分布列及数 期望.
下面临界值表供参考
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参考公式 2=,n=a+b+c+d
【解析】(Ⅰ)根据题意列出列联表如下
优质城市
单车品牌
优质城市
非优质城市
合计
甲品牌(个)
3
2
5
乙品牌(个)
2
3
5
合计
5
5
10
,
所以没有85 的把握认为“优质潜力城市”与“共享单车”品牌有关.
(Ⅱ)①令事件为“城市I被选中”;事件为“城市II被选中”,
则,
所以.
②随机变量的所有可能取值为, ;;
.故的分布列为
1
2
3
..
11.【四川省绵阳市一中2018届二模】某工厂生产不同规格的一种产品,根据检测标准,其合格产品的质量与尺寸之间满足关系式为大于
的常数),现随机抽取6件合格产品,测得数据如下
对数据作了处理,相关统计量的值如下表
(1)根据所给数据,求关于的回归方程(提示 由已知, 是的线性关系);
(2)按照某项指标测定,当产品质量与尺寸的比在区间内时为优等品,现从抽取的6件合格产品再任选3件,求恰好取得两件优等品的概率;
(附 对于一组数据,其回归直线的斜率和截距的最小二乘法估计值分别为 )
【解析】(1)对,两边取自然对数得,
令,得,
, ,
得,故所求回归方程为.
(2)由,解得, ,即优等品有3件.
记“恰好取得两件优等品”为事件,从件合格品中选出3件的方法数为,
从件合格品取3件恰好2件为优等品的取法有种,则.
12.【山东省垦利第一中 等四校2018届上 期期末】为研究某种图书每册的成本费(元)与印刷数(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.
15.25
3.63
0.269
2085.5
0.787
7.049
表中, .
(1)根据散点图判断 与哪一个更适宜作为每册成本费(元)与印刷数(千册)的回归方程类型?(只要求给出判断,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立关于的回归方程(回归系数的结果精确到0.01);
(3)若每册书定价为10元,则至少应该印刷多少册才能使销售利润不低于78840元?(假设能够全部售出,结果精确到1)
(附 对于一组数据, ,…, ,其回归直线的斜率和截距的最小二乘估计分别为, )
【解析】(1)由散点图判断, 适宜作为每册成本费与印刷册数的回归方程.
(2)令,先建立关于的线性回归方程,
由于,
∴,
∴关于的线性回归方程为,
从而关于的回归方程为.
(3)假设印刷千册,依题意, ,
即,
∴,
∴至少印刷10千册.
13.【广东省珠海市2018届3月质检】某兴趣小组进行“野岛生存”实践活动,他们设置了个取水敞口箱.其中个采用种取水法,个采用种取水法.如图甲为种方法一个夜晚操作一次个水箱积取淡水量频率分布直方图,图乙为种方法一个夜晚操作一次个水箱积取淡水量频率分布直方图.
(1)设两种取水方法互不影响,设表示事件“法取水箱水量不低于,法取水箱水量不低于”,以样本估计总体,以频率分布直方图中的频率为概率,估计的概率;
(2)填写下面列联表,并判断是否有的把握认为箱积水量与取水方法有关.
箱积水量
箱积水量
箱数总计
法
法
箱数总计
附
【解析】(1)设“法取水箱水量不低于”为事件,“法取水箱水量不低于
”为事件,
,,
,
故发生的概率为.
(2)列联表
箱积水量
箱积水量
箱数总计
法
法
箱数总计
,
∴,
∴有的把握认为箱积水量与取水方法有关.
14. 【广东广州市2018届一调】某基地蔬菜大棚采用水培、无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量(小时)都在30小时以上,其中不足50小时的周数有5周,不低于50小时且不超过70小时的周数有35周,超过70小时的周数有10周.根据统计,该基地的西红柿增加量(百斤)与使用某种液体肥料(千克)之间对应数据为如图所示的折线图.
(1)依据数据的折线图,是否可用线性回归模型拟合与的关系?请计算相关系数并加以说明(精确到0.01).(若,则线性相关程度很高,可用线性回归模型拟合)
(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪最多可运行台数受周光照量限制,并有如下关系
周光照量(单位 小时)
光照控制仪最多可运行台数
3
2
1
若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.若商家安装了3台光照控制仪,求商家在过去50周周总利润的平均值.
附 相关系数公式,参考数据,.
【解析】(1)由已知数据可得.
因为
.
所以相关系数.
因为,所以可用线性回归模型拟合与的关系.
(2)记商家周总利润为元,由条件可知至少需安装1台,最多安装3台光照控制仪.
①安装1台光照控制仪可获得周总利润3000元.
②安装2台光照控制仪的情形
当X >70时,只有1台光照控制仪运行,此时周总利润Y=3000-1000=2000元,
当3070时,只有1台光照控制仪运行,此时周总利润Y=1×3000-2×1000=1000元,
当50≤X≤70时,有2台光照控制仪运行,此时周总利润Y=2×3000-1×1000=5000元,
当30