统计学简答题58514 4页

18.50 KB
2022-09-01 发布

统计学简答题58514

关闭预览

4页
当前文档由用户上传发布，收益归属用户

1、本文档由用户上传，淘文库整理发布，可阅读全部内容。
2、本文档内容版权归属内容提供方，所产生的收益全部归内容提供方所有。如果您对本文有版权争议，请立即联系网站客服。
3、本文档由用户上传，本站不保证质量和数量令人满意，可能有诸多瑕疵，付费之前，请仔细阅读内容确认后进行付费下载。
网站客服QQ：403074932

统计学简答题2.2什么是二手资料？使用二手资料需要注意些什么？与研究内容有关的原信息已经存在，我们只是对这些原信息重新加工、整理，使之成为我们进行统计分析可以使用的数据，则把他们称为间接来源的数据。注意二手资料也有很大的局限性，如资料的相关性不够、口径可能不一致，数据也许不准确等等，在使用二手资料前，对二手资料进行评估是必要的。2.3比较概率抽样和非概率抽样的特点以及类型？什么情况下分别适合采用？概率抽样特点：1.抽样时按一定的概率以随机原则抽取样本2.每个单位被抽中的概率是已知的3.用样本对总体目标量进行估计时，要考虑到每个样本单位被抽中的概率，也就是说，估计量不仅与样本单位的观测值有关，也与其入量概率有关。非概率抽样特点：操作简便，时效快，成本低，对抽样中的统计学专业技术要求不是很高。概率抽样类型：简单随机抽样、分层抽样、整群抽样。系统抽样、多阶段抽样；非概率抽样特点：方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样。非概率抽样适合探索性的研究，调查结果用于发现问题，也适合市场调查中的概念测试；概率抽样适合调查目的在于掌握研究对象总体的数量特征，得到总体参数的置信区间。3.1数据的预处理包括哪些内容？数据的与处理是在对数据分类或分组之前所做的必要处理，包括数据的审核、筛选、排序等。3.4直方图与条形图有何区别？直方图与条形图不同。首先，条形图是用条形的长度（横置时）表示各类别频数的多少，其宽度（表示类别）则是固定的；直方图是用面积表示各组频数的多少，矩形的高度表示每一组的频数或频率，宽度则表示各组的组距，因此其高度与宽度均有意义。其次，由于分组数据具有连续性，直方图的各矩形通常是在连续排列，而条形图则是分开排列。最后，条形图主要用于展示分类数据，而直方图则主要用于展示数值型数据。3.6饼图和环形图有什么区别？环形图中间有一个“空洞”，每个样本用一个环来表示，样本中的每一部分数据用环中的一段表示。因此环形图可显示多个样本各部分所占的相应比例，从而有利于构成的比较研究。3.7茎叶图与直方图相比有什么优点？它们适用的场合是什么？茎叶图类似于横置的直方图，与直方图相比，茎叶图既能给出数据的分布状况，又能给出每一个原始数据，即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布，但不能保留原始的数值。在应用方面，直方图通常适用于大批量数据，茎叶图通常适用于小批量数据。3.9制作统计表应该注意哪几个问题？\n首先，要合理安排统计表的结构；其次，表头一般应包括表号、总标题和表中数据的单位等内容；再次，表中的上下两条横线一般用粗线，中间的其他线要用细线，这样使人看起来清楚醒目。最后在使用统计表时，必要时可在表的下方加上注释，特别要注意注明数据来源，以表示对他人劳动成果的尊重，以备读者查阅使用。4.7标准分数有哪些用途？给出了一组数据中各数值的相对位置；并可以用它来判断一组数据是否有异常值。在对多个不同量纲的变量进行处理时，常常需要对各变量进行标准化处理。4.8为什么要计算离散系数？对于平均数不同或计量单位不同的不同组别的变量值，是不能用标准差直接比较其离散程度，为消除变量值水平高低和计量单位不同对离散程度测度值的影响，需要计算离散系数。7.2简述评价估计量好坏的标准？无偏性，指估计量抽样分布的数学期望等于被估计的总体参数；有效性，指对同一参数总体的两个无偏估计量，有更小标准的估计量更有效；一致性，随样本量的增大，点估计量的值越来越接近被估计总体的参数。7.5Za/2δ/√(n)的含义是什么?Za/2δ/√(n)是估计总体均值时的估计误差。A是事先所确定的一个概率值，也被称为风险值，它是总体均值不包括在置信区间的概率，Za/2是标准正态分布上侧面积为a/2时的Z值8.3什么是假设检验中的两类错误？一类错误是原假设H0为真却被我们拒绝了，犯这种错误的概率用a表示，也称a错误或弃真错误；另一类错误是原假设为伪我们却没有拒绝，犯这种错误的概率用β表示，所以也称β错误或取伪错误。8.7假设检验依据的基本原理是什么？它的基本思想可以用小概率原理来解释.所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的.也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件A在一次试验中是几乎不可能发一的；要是在一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设.11.8一元线性回归模型中有哪些基本的假定？因变量y与自变量x之间具有线性关系；在重复抽样中，自变量x的取值是固定的，即假定x是非随机的；误差项ε是一个期望值为0的随机变量，即E（ε）=0；对于所有的x值，ε的方差&2都相同；误差项ε是一个服从正态分布的随机变量。11.10解释总平方和、回归平方合、残差平方和的含义，并说明它们之间的关系。对一个具体的观测值来说，变差的大小可以用实际观测值y与其均差来表示，而n\n次观察值的总变差可由这些离差的平方和来表示，称为总平方和（SST）。由于自变量x的变化引起的y的变化，而其平方和反映了Y的总变差中由于x与y之间的线性关系因其的y的变化部分，它是可以由回归直线来解释的变差部分，称为回归平方和(SSR)。除了x对y眼的线性影响之外的其他因素对y变差的作用，是不能由回归直线来解释的变差部分，称为残差平方和（SSE）.关系：SST=SSR+SSE.11.11简述判定系数的含义和作用？判定系数是对估计的归回方程拟合优度的度量。判定系数R^2测度了回归直线对观测数据的拟合优度。取值范围【1,1】。越接近1，表明回归平方和占总平方和的比例越大，拟合程度越好，反之。11.14怎样评价回归分析的结果？所估计的回归系数^β1的符号是否与理论或事先预期相一致；如果理论上认为y与x之间的关系不仅是正的，而且是统计上显著的，那么所建立的回归方程也应该如此；回归方程多大程度上解释了因变量y取值的差异？考虑关于误差项ε的正态性假定是否成立。12.2多元回归模型中有哪些基本的假定？误差项ε是一个期望值为0的随机变量，即E（ε）=0；对自变量x1,x2,…，xk的所有值，ε的方差&^2都相同；误差项ε是一个服从正态分布的随机变量，且相互独立，即ε~N（0，&^2）12.3解释多重判定系数和调整的多重判定系数的含义和作用？是多元回归中的归回平方和占总平方和的比例，它是多元回归方程拟合优度的一个统计量，反映了在因变量y的变差中被估计的回归方程所解释的比例。为避免增加自变量而高估R^2，统计学家提出用样本量n和自变量的个数k去调整R^2，即调整的多重判定系数（Ra^2）。13.1简述时间序列的构成要素。成分分为四种，即趋势---是时间序列在长时期内呈现出来的某种持续向上或持续向下的变动（T）、季节性或者季节变动---是时间序列一年内重复出现的周期性波动（S），周期性或循环波动---时间序列中呈现出来的围绕长期趋势的一种波浪形或者振荡式变动（C），随机性或不规则变动（I）。13.3简述平稳序列和非平稳序列的含义。平稳序列是基本上不存在趋势的序列，这类序列中各观察值基本上在某个固定的水平上波动，虽然在不同的时间段波动的程度不同，但并不存在某种规律，波动可以看成是随机的。非平稳序列是包含趋势、季节性或周期性的序列，它可能只含有其中的一种成分，也可能是几种成分的组合。14.3拉氏指数与帕氏指数各有什么特点？拉氏指数：计算综合指数时将作为权数的同度量因素固定在基期；帕氏指数：计算综合指数时将作为权数的同度量因素固定在报告期。14.5什么是指数体系，它有什么作用？\n指数体系是指，一个总量往往可以分解成为若干个构成要素，其数量关系可以用指标体系的形式表现出来。反映了总量指标与因素指标之间的相互关系，它们之间的这种联系同样可以表现为各指标指数之间的联系。备注：11.10问题因为符号未能打出来，建议翻阅书籍进行背记，详见P315

统计学简答题58514 4页

统计学简答题58514

您可能关注的文档

相关文档

最近下载