- 18.50 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计学简答题2.2什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据,则把他们称为间接来源的数据。注意二手资料也有很大的局限性,如资料的相关性不够、口径可能不一致,数据也许不准确等等,在使用二手资料前,对二手资料进行评估是必要的。2.3比较概率抽样和非概率抽样的特点以及类型?什么情况下分别适合采用?概率抽样特点:1.抽样时按一定的概率以随机原则抽取样本2.每个单位被抽中的概率是已知的3.用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率,也就是说,估计量不仅与样本单位的观测值有关,也与其入量概率有关。非概率抽样特点:操作简便,时效快,成本低,对抽样中的统计学专业技术要求不是很高。概率抽样类型:简单随机抽样、分层抽样、整群抽样。系统抽样、多阶段抽样;非概率抽样特点:方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样。非概率抽样适合探索性的研究,调查结果用于发现问题,也适合市场调查中的概念测试;概率抽样适合调查目的在于掌握研究对象总体的数量特征,得到总体参数的置信区间。3.1数据的预处理包括哪些内容?数据的与处理是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序等。3.4直方图与条形图有何区别?直方图与条形图不同。首先,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是在连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。3.6饼图和环形图有什么区别?环形图中间有一个“空洞”,每个样本用一个环来表示,样本中的每一部分数据用环中的一段表示。因此环形图可显示多个样本各部分所占的相应比例,从而有利于构成的比较研究。3.7茎叶图与直方图相比有什么优点?它们适用的场合是什么?茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数据,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。3.9制作统计表应该注意哪几个问题?\n首先,要合理安排统计表的结构;其次,表头一般应包括表号、总标题和表中数据的单位等内容;再次,表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚醒目。最后在使用统计表时,必要时可在表的下方加上注释,特别要注意注明数据来源,以表示对他人劳动成果的尊重,以备读者查阅使用。4.7标准分数有哪些用途?给出了一组数据中各数值的相对位置;并可以用它来判断一组数据是否有异常值。在对多个不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。4.8为什么要计算离散系数?对于平均数不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。7.2简述评价估计量好坏的标准?无偏性,指估计量抽样分布的数学期望等于被估计的总体参数;有效性,指对同一参数总体的两个无偏估计量,有更小标准的估计量更有效;一致性,随样本量的增大,点估计量的值越来越接近被估计总体的参数。7.5Za/2δ/√(n)的含义是什么?Za/2δ/√(n)是估计总体均值时的估计误差。A是事先所确定的一个概率值,也被称为风险值,它是总体均值不包括在置信区间的概率,Za/2是标准正态分布上侧面积为a/2时的Z值8.3什么是假设检验中的两类错误?一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用a表示,也称a错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用β表示,所以也称β错误或取伪错误。8.7假设检验依据的基本原理是什么?它的基本思想可以用小概率原理来解释.所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的.也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件A在一次试验中是几乎不可能发一的;要是在一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设.11.8一元线性回归模型中有哪些基本的假定?因变量y与自变量x之间具有线性关系;在重复抽样中,自变量x的取值是固定的,即假定x是非随机的;误差项ε是一个期望值为0的随机变量,即E(ε)=0;对于所有的x值,ε的方差&2都相同;误差项ε是一个服从正态分布的随机变量。11.10解释总平方和、回归平方合、残差平方和的含义,并说明它们之间的关系。对一个具体的观测值来说,变差的大小可以用实际观测值y与其均差来表示,而n\n次观察值的总变差可由这些离差的平方和来表示,称为总平方和(SST)。由于自变量x的变化引起的y的变化,而其平方和反映了Y的总变差中由于x与y之间的线性关系因其的y的变化部分,它是可以由回归直线来解释的变差部分,称为回归平方和(SSR)。除了x对y眼的线性影响之外的其他因素对y变差的作用,是不能由回归直线来解释的变差部分,称为残差平方和(SSE).关系:SST=SSR+SSE.11.11简述判定系数的含义和作用?判定系数是对估计的归回方程拟合优度的度量。判定系数R^2测度了回归直线对观测数据的拟合优度。取值范围【1,1】。越接近1,表明回归平方和占总平方和的比例越大,拟合程度越好,反之。11.14怎样评价回归分析的结果?所估计的回归系数^β1的符号是否与理论或事先预期相一致;如果理论上认为y与x之间的关系不仅是正的,而且是统计上显著的,那么所建立的回归方程也应该如此;回归方程多大程度上解释了因变量y取值的差异?考虑关于误差项ε的正态性假定是否成立。12.2多元回归模型中有哪些基本的假定?误差项ε是一个期望值为0的随机变量,即E(ε)=0;对自变量x1,x2,…,xk的所有值,ε的方差&^2都相同;误差项ε是一个服从正态分布的随机变量,且相互独立,即ε~N(0,&^2)12.3解释多重判定系数和调整的多重判定系数的含义和作用?是多元回归中的归回平方和占总平方和的比例,它是多元回归方程拟合优度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例。为避免增加自变量而高估R^2,统计学家提出用样本量n和自变量的个数k去调整R^2,即调整的多重判定系数(Ra^2)。13.1简述时间序列的构成要素。成分分为四种,即趋势---是时间序列在长时期内呈现出来的某种持续向上或持续向下的变动(T)、季节性或者季节变动---是时间序列一年内重复出现的周期性波动(S),周期性或循环波动---时间序列中呈现出来的围绕长期趋势的一种波浪形或者振荡式变动(C),随机性或不规则变动(I)。13.3简述平稳序列和非平稳序列的含义。平稳序列是基本上不存在趋势的序列,这类序列中各观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,波动可以看成是随机的。非平稳序列是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。14.3拉氏指数与帕氏指数各有什么特点?拉氏指数:计算综合指数时将作为权数的同度量因素固定在基期;帕氏指数:计算综合指数时将作为权数的同度量因素固定在报告期。14.5什么是指数体系,它有什么作用?\n指数体系是指,一个总量往往可以分解成为若干个构成要素,其数量关系可以用指标体系的形式表现出来。反映了总量指标与因素指标之间的相互关系,它们之间的这种联系同样可以表现为各指标指数之间的联系。备注:11.10问题因为符号未能打出来,建议翻阅书籍进行背记,详见P315