- 29.00 KB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计学课后作业一、名词解释题描述统计:是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。分类数据:反映事物类别的数据数值型数据:直接使用自然数或度量衡单位进行计量的具体的数值众数:样本观测值在频数分布表中频数最多的那一组的组中值方差:各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示点估计:又称定值估计,就是用实际样本指标数值作为总体参数的估计值相关系数:是研究变量之间线性相关程度的量单选1、一名统计学专业的学生为了完成其统计作用,在《统计年鉴》中找到了2006年城镇家庭的人均收入数据。这一数据属于(C)。A.分类数据B.顺序数据C.截面数据D.时间序列数据2、最近发表的的一份报告称,“由150部新车组成的一个样本表明,外国新车的价格明显高于本国生产的新车”。这一结论属于(C)A.对样本的描述B.对样本的推断C.对总体的描述D.生产成本3、为了调查某校学生的购书费用支出,从全校抽取了4个班级的学生进行调查,这种调查方法是(D)A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样4、与概率抽样相比,非概率抽样的缺点是(B)A.样本统计量的分布是确定的B.无法使用样本的结果对总体相应的参数进行推断C.调查的成本较高D.不适合做探索性研究5、对于大批量数据,最适合描述其分布的图形是( C ) A条形图 B茎叶图C直方图D根据其购买欲望所决定的购买量6、下列关于众数的叙述,不正确的是(C)A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不受极端值的影响7、如果一个数据的标准分数是-2,表明该数据(B)A.比平均数高处2个标准差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差8、对于右偏分布,平均数、中位数和众数之间的关系是(A)A.平均数>中位数>众数B.中位数>平均数>众数C.众数>中位数>平均数D.众数>平均数>中位数9、设Z服从标准正态分布,则P(0《Z《1.2)=(A)A.0.3849B.0.4319C.0.1814D.0.4147\n10、从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差(C)A.保持不变B.增加C.减少D.无法确定11、从均值为200、标准差为50的总体中抽取容量为100的样本,则样本均值的标准差为(C)A.50B.10C.5D.1512、当样本量一定时,置信区间的宽度(B)A.随着置信系数的增大而减少B.随着置信系数的增大而增大C.与置信系数的大小无关D.与置信系数的平方成反比13、从一个正态总体中随机抽取n=20的一个随机样本,样本均值为17.25,样本标准差为3.3。则总体均值u的置信区间为(C)A.(15.97,18.53)B.(15.71,18.79)C.(15.14,19.36)D.(14.89,20.45)14、一项调查表明,5年前每个家庭每天看电视的平均时间为6.7小时。而最近对200个家庭的调查结果是:每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。在95%的置信度下,检验假设H0:u《6.7,H1:u>6.7,得到的结论为,(A)。A、拒绝H0 B、不拒绝H0 C、可以拒绝也可以不拒绝H0 D、可能拒绝业可以不拒绝H0 15、在方差分析中,数据的误差用平方和来表示的。其中反映全部观测值误差大小的平方和称为( B)A.误差项平方和 B.组内平方和 C.组间平方和 D.总平方和三、简答题1一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。1)这项研究的总体是什么?参与调查的全体消费者2)“原因”是分类变量、顺序变量还是数值型变量?分类变量3)研究者所关心的参数是什么?网上购物的平均花费、网上购物的主要原因4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?统计量5)研究不同“购物原因”对平均花费的影响,用哪种统计方法比较适合?描述统计方法2概率抽样与非概率抽样各有什么样的特点?1抽样时是按照一定的概率以随机原则抽取样本;每个单位被抽取的概率是已知的,或是可以计算出来的;当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率.2操作简便,时效快,成本低,而且对抽中的统计学专业技术要求不是很高.3一组数据的特征可以从哪几个方面进行测度?一组数据的分布特征可以从以下三个方面进行测度:集中趋势的测度(众数、中位数、分位数、均值、几何平均数、切尾均值)离散程度测度(极差、内距、方差和标准差、离散系数)偏态与峰度测度(偏态及其测度、峰度及其测度)\n4什么是标准分数?有哪些用途?标准分数又称为Z分数或真分数,是以标准差为单位来表示一个分数在团体中所处位置的相对位置量数.数据经标准化后,我们便可以测度每个数据在该组中的相对位置,并可以用它来判断一组数据是否有异常值5什么是离散型随机变量的期望值?用投筛子的例子来解释。期望是算术平均值概念的推广,是概率意义下的平均.Eξ由ξ的分布列唯一确定. 随机抛掷骰子求所得点数ξ的期望6什么是中心极限定理?有何作用?是概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本的均值总是近似地服从正态分布。如果一个随机变量能够分解为独立同分布的随机变量序列之和,则可以直接利用中心极限定理进行解决1、假设检验的基本原理是什么?假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。.假设检验的基本思想假设检验的基本思想是小概率反证法思想2、要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析?作两两比较十分繁琐,进行检验的次数较多,随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加。而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。3、解释R2的含义和作用用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来度量自变量对因变量的影响效应。其中自变量平方和占总平方和的比例记为R2,即: R2=SSA(组间SS)/SST(总SS) 其算术平方根R可以用来测量自变量与因变量之间的关系强度。4、相关分析主要解决哪些问题?相关分析就是对两个变量之间线性关系的描述与变量,它要解决的问题包括: 1.变量之间是否存在关系? 2.如果存在关系,它们之间是什么样的关系? 3.变量之间的关系强度如何? 4.样本所反映的变量之间的关系能否代表总体变量之间的关系? 为解决这些问题,在进行相关分析时,对总体主要有以下两个假定: 1.两个变量之间是线性关系。 2.两个变量都是随机变量5、怎样评价回归分析的结果?\n回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行相关分析,一般要求出相关关系,以相关系数的大小来判断自变量和因变量的相关的程度1、多重共线性对回归分析有哪些影响?可能会使回归的结果造成混乱,甚至把分析引入歧途.可能对参数估计值的正负号产生影响,特别是各回归系数的正负号有可能同我们与其的正负号相反.