应用统计学-qm 8页

  • 263.50 KB
  • 2022-08-13 发布

应用统计学-qm

  • 8页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
应用统计学复习题一、简答题1、简述普查和抽样调查的特点。答:普查是指为某一特定目的而专门组织的全面调查,它具有以下几个特点:(1)普查通常具有周期性。(2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。(3)普查的数据一般比较准确,规划程度也较高。(4)普查的使用范围比较窄。抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。它具有以下几个特点:(1)经济性。这是抽样调查最显著的一个特点。(2)时效性强。抽样调查可以迅速、及时地获得所需要的信息。(3)适应面广。它适用于对各个领域、各种问题的调查。(4)准确性高。2、为什么要计算离散系数?答:离散系数是指一组数据的标准差与其相应得均值之比,也称为变异系数。对于平均水平不同或计量单位不同的不同组别的变量值,是不能用方差和标准差比较离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。离散系数的作用主要是用于比较不同总体或样本数据的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。3、加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。答:加权算术平均数受各组平均数喝次数结构(权数)两因素的影响。若报告期与基期相比各组平均数没变,则总平均数的变动受次数结构(权数)变动的影响,可能不变、上升、下降。如果各组次数结构不变,则总平均数;如果组平均数高的组次数比例上升,组平均数低的组次数比例下降,则总平均数上升;如果组平均数低的组次数比例上升,组平均数高的组次数比例下降,则总平均数下降。4、解释相关关系的含义,说明相关关系的特点。答:变量之间存在的不确定的数量关系为相关关系。\n相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。通常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。5、解释抽样推断的含义。答:简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。6、回归分析与相关分析的区别是什么?(1)相关分析所研究的两个变量是对等关系,而回归分析所研究的两个变量不是对等关系;(2)对于两个变量X和Y来说,相关分析只能计算出一个反映两个变量间相关密切程度的相关系数,而回归分析可分别建立两个不同的回归方程;(3)相关分析对资料的要求是,两个变量都必须是随机的,而回归分析对资料的要求是自变量是给定的,因变量是随机的。二、计算题1、下面是20个长途电话通话时间的频数分布,计算该数据的平均数通话时间/分钟频数通话时间/分钟频数4-7420-2318-11524-27112-157合计2016-192答案:由题意:通话时间/分钟通话时间/分钟4-75.5420-2321.518-119.5524-2725.5112-1513.57合计2016-1917.52\n平均数==12.32、拥有工商管理学位的大学毕业生每年年薪的标准差大约为2000美元,假定希望估计每年年薪底薪的95%置信区间,当边际误差分别500美元时,样本容量应该为多大?()答:=61.47=623、某一汽车装配操作线完成时间的计划均值为2.2分钟。由于完成时间既受上一道装配操作线的影响,又影响到下一道装配操作线的生产,所以保持2.2分钟的标准是很重要的。一个随机样本由45项组成,其完成时间的样本均值为2.39分钟,样本标准差为0.20分钟。在0.05的显著性水平下检验操作线是否达到了2.2分钟的标准。答案:根据题意,此题为双侧假设检验问题(1)原假设:;备择假设:(2)构造统计量:,得(3)由于,则查表得:(4),,所以拒绝原假设,即在0.05的显著水平下没有达到2.2分钟的标准。4、下表中的数据是主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y表示)和他在校学习时的总评分(用x表示)的回归方程。总评分月薪/美元总评分月薪/美元2.628003.230003.431003.534003.635002.93100\n答案:2.628006.76728078400003.4310011.561054096100003.6350012.9612600122500003.2300010.24960090000003.5340012.2511900115600002.931008.4189909610000=19.2=18900=62.18=6091059870000设==581.08=18900/6-581.08*19.2/6=1290.54于是5、设总体X的概率密度函数为其中为未知参数,是来自X的样本。(1)试求的极大似然估计量;(2)试验证是的无偏估计量。答:(1)当>0时,似然函数为:\n令,即解得:是的单调函数,所以的极大似然估计量(2)因为,故是的无偏估计量。6、某商店为解决居民对某种商品的需要,调查了100户住户,得出每月每户平均需要量为10千克,样本方差为9。若这个商店供应10000户,求最少需要准备多少这种商品,才能以95%的概率满足需要?解:设每月每户至少准备ð查表得,ð\n若供应10000户,则需要准备104400kg。7、某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%,试求:(1)平均每包重量的置信区间,若总体标准差为5克;(2)平均每包重量的置信区间,若总体标准差未知;();解:n=10,为小样本(1)方差已知,由±,=(494+495+503+506+492+493+498+507+502+490)/10,计算可得平均每包重量的置信区间为(494.9,501.1)(2)方差未知,由±=(494+495+503+506+492+493+498+507+502+490)/10,s即样本方差,计算可得,平均每包重量的置信区间为(493.63,502.37)8、假定某化工原料在处理前和处理后取样得到的含脂率如下表:处理前0.1400.1380.1430.1420.1440.137处理后0.1350.1400.1420.1360.1380.140\n假定处理前后含脂率都服从正态分布,问处理后与处理前含脂率均值有无显著差异。解:根据题中数据可得:,由于<30,且总体方差未知,所以先用F检验两总体方差是否存在差异。(1)设:;则F=由,查F分布得,接受,即处理前后两总体方差相同。(2)设,则T=,T=1.26<=2.2281接受,即处理前后含脂率无显著差异。9、根据下表中Y与X两个变量的样本数据,建立Y与X的一元线性回归方程。YX51015201200081018140343010fx34111028解:设x为自变量,y为因变量,一元线性回归设回归方程为y=\n==回归方程为y=150.213-1.538x

相关文档