统计学基础复习 7页

  • 83.00 KB
  • 2022-08-13 发布

统计学基础复习

  • 7页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
K统计学:是收集、汇总和分析统计数据的科学和艺术。、2、统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。3、普查:是为某一特定目的而专门组织的一次性全面调查,如人口普查、工业普查、农业普查等。4、抽样调查的特点:经济性;时效性高;适应面广;准确性高。5、调查方案:是指导整个过程的纲领性文件,其内容包括调查目的、调查对象和调查单位、调查项目和调查表等内容。6、组距分组的几个步骤:一、确定组数二、确定组距三、确定组限和进行次数分配四、绘制统计图五、分析。)7、为消除组距不同对频数分布的影响,需要计算频数密度,即频数密度二频数/组距,用频数密度才能准确反映频数分布的实际情况。8、以组中值作为代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组距中1[两侧呈对称分布。9、描述统计的内容包括频数分布但主要是关于集中趋势和离中趋势的描述问题。10、众数:是一组数据中岀现次数最多的变量值。从分布的角度看,众数是具有明显集中趋势点的数1,一组数据分布的最高峰点所对应的数值即为众数,记Mo11.众数是一组数据中心位置的一个代表值。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,实际上也可以认为有多个众数。12.协方差的大小会受到计量单位和数据均值水平的影响,从而使不同相关总体之间的相关程度缺乏可比性。13、时间系列:是反映现象随时间的变化而变化的数据系列,也称为时间数列或动态数列。14、用报告期水平减去基期水平,就等于增长量。其中,当基期水平为上期水平时,就称为逐期增长量,当基期水平为某个时期的固定发展水平时,就称为累计增长量。15、报告水平与基期水平之比,称为发展速度。其中,当基期水平为上期水平时,就称为环比发展速度;当基期水平为某个时期的固定发展水平时,就称为定基发展速度。16、序时平均数也称为动态平均数,它反映现象在一定时期内发展水平达到的一般水平。由于指标形式分绝对数、相对数和平均数等,所以对其平均的方法存在差异性。17、绝对数有时期数和时点数之分,两者的区别主要在于是否具有可加性。18、几何平均法的应用条件是要求现象呈现均匀变动。如果现象发生大起大落的变化,用几何平均法所计算的平均发展速度将失去代表性。\n19、累计法考虑各时期的发展状况,不只是受最初和最末两个极端值的影响。20、移动平均法是趋势变动分析的一种较简单的常用方法。该方法的基本思想和原理是,通过扩大原时间序列的时间间隔,并按一定的间隔长度逐期移动,分别计算出一系列移动平均数,这些平均数形成的新的时间序列对原时间序列的波动起到一定的修匀作用,削弱了原序列中短期偶然因素的影响,从而呈现岀现象发展的变动趋势。该方法可以用来分析预测销售情况、库存、股价或其他趋势。移动平均法的优点在于计算简便,运用灵活,不受现象复杂性影响。其缺点主要有三个:一是失去首尾两头的数据;二是不能较好地进行长期趋势的预测;三是对周期性处理不好就会影响数列的趋势性。21、我们应该先剔除趋势值的影响,再计算季节指数。(第一步:对原数据计算移动平均数;第二步:计算具体的季节比率;第三步:计算月平均值,消除不规则波动;第四步:计算季节比率;第五步:使用季节比率进行预测。)22、指数作为一种对比性的统计指标具有相对数的形式,通常表现为百分数。23、统计指数在经济分析上具有十分广阔的应用领域,它可以是不同时间的现象水平的对比,也可以是不同空间(如不同国家、地区、部门、企业等)的现象水平的对比,或者,是现象的实际水平与计划(规划或目标)水平的对比。24、统计指数可分为个体指数和总指数。25、总指数是考察整个总体现象的数量对比关系的指数。总指数与个体指数的区别不仅在于考察范围不同,还在于考察方法不同。26、如果一个指数的指数化指标具有质量指标的特征,也即表现为平均数或相对数的形式,它就属于“质量指标指数:物价指数、股份指数和成本指数等都是质量指标指数;如果一个指数的指数化指标具有数量指标的特征,也即具有总量或绝对数的形式,它一般就属于“数量指标指数:销售旦指数和生产指数则是数量指标指数。27、常规的综合评价方法有两种:一种是“简易计分法”,另一种是常规方法是“参数指标法:2&构建标准比值综合评价指数的步骤:1、建立综合评价指标体系;2、确定评价公式样3、确定各项指标的评价标准和权数学4、计算企业的个体指数和综合评价指数。29、概率分布是一种数学模型,它反映变量取值与其发生的概率之间的关系。其特点是:变量取值的精确度越高,相应的概率越小;变量取值的误差越大,相应的概率也越大。30、二项分布主要描述只有两种结果可能出现的事件的分布。这两种结果分别用"是'和“非”来区别。31.泊松分布是主要描述稀有事件的分布。例如,在单位时间内电话交换台收到电话呼叫的次数、来到公共汽车站的乘客人数、布上的疵点、啤酒中的杂质等,也称为计点分布或疵点分布。32、完成简单随机样本的选择过程中,当我们并不想将一个管理人员多次先入时,就可以忽略已出现过的随机数,这种选择样本\n的方式叫做“无放回抽样:33、出现过的随机数仍选入样本,则我们进行的是“放回抽样:抽样程序中,放回抽样是一种取得简单随机样本的有效途径,然而,无放回抽样更为常用。34、大样本:在抽样过程中,把抽样数目大于30的样本。而把抽样数目小于30的样本称为小样本。35、必要的抽样数目受以下因素影响:1、总体方差点;2、允许误差范围;3、置信度假4、抽样方法;5、抽样组织方式。36、分层抽样是通过分组来提高样本样本的代表性的。\n第一章:导论1、什么是统计学?统计方法可以分为哪两大类?统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。2、统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。3、举例说明总体、样本、参数、统计量、变量这几个概念。总体是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。样本是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量是说明现象某种特征的概念。比如商品的销售额是不确定的,这销售额就是变量。第二章:数据的收集1、调查方案包括哪几个方面的内容?调查目的,是调查所要达到的具体目标。调查对象和调查单位,是根据调查目的确定的调查研究的总体或调查范围。调查项目和调查表,要解决的是调查的内容。2、数据的间接来源(二手数据)主要是公开岀版或公开报道的数据;数据的直接来源一是调查或观察,二是实验。3、统计调查方式:抽样调查、普查、统计报表等。抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。除此之外,还有重点调查和典型调查。4、统计数据的误差通常是指统计数据与客观现实之间\n的差距,误差的主要类型有抽样误差和非抽样误差两类。抽样误差主要是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差是人为因素造成的(理论上可以消除)5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理和研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。6、数据的收集方法分为询问调查与观察实验。7、统计调查方案包括哪些内容?调查目的即调查所要达到的具体目标;调查对象和调查单位,调查对象是根据调查目的确定的调查研究的总体或调查范围,调查单位是构成调查对象中的每一个单位;调查项目和调查表,就是调查的具体内容;其它问题,即明确调查所采用的方式和方法、调查时间及调查组织和实施细则。第三章:数据整理与展示1、对于通过调查取得的原始数据,应主要从完整性和准确性两个方面去审核。2、对分类数据和顺序数据主要是做分类整理,对数值型数据则主要是做分组整理。3、数据分组的步骤:确定组数、组距,最后制成频数分布表统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。组中值=(下限值+上限值)/24、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图和饼图。5、直方图与条形图的差别:条形图是用条形的长度表示各类别频数的多少,宽度则是固定的,直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。第四章:数据分布特征的测度1、一组数据的分布特征可以从哪几个方面进行测度?一是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。2、简述众数、中位数和均值的特点和应用场合及关系。众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数主要作为分类数据的集中\n趋势测中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。均值是就数值型数据计算的,具有优良的数学性质,缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。关系:如果数据的分布是对称的众数、中位数和均值必定相等即Mo二Me二xbar;如果数据是左偏分布,说明数据存在极小值,三者之间的关系表现为:xbar0.8时,可视为高度相关;0.5<|r|<0.8时,可视为中度相关;0.3s|r|\n<0.5时,视为低度相关;

相关文档