统计学3(60学时用) 74页

  • 932.00 KB
  • 2022-09-01 发布

统计学3(60学时用)

  • 74页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第三章统计整理与显示教学目的和要求统计整理是统计工作过程中的中间环节,它是统计调查的继续,又是统计分析的前提。通过本章学习了解统计整理的概念和内容、统计分组、分配数列及统计表等概念和内容。要重点掌握统计分组的方法,在分组的基础上进行次数分配数列的编制,并学会用统计表来表示统计资料。\n第三章统计数据的整理与显示★§3.1统计整理与统计分组§3.2分布数列的编制§3.3统计图表\n§3.1统计整理与统计分组一、统计整理的意义和步骤二、统计整理的基本方法——统计分组★\n统计整理将统计调查得到的原始资料进行科学的分组和汇总形成综合统计资料的工作过程是统计调查的继续,统计分析的前提和基础,在整个统计工作中起着承前启后的作用。地位统计数据的处理:统计资料的分组、汇总及制表统计数据的管理:数据的传输、贮存、更新及输出内容一、统计整理的意义和步骤\n制定整理方案(纲要)对原始资料进行审核数据处理(分类汇总)制作统计表或统计图统计整理的步骤\n统计整理步骤的说明1.制定整理的纲要.(主要涉及两方面的问题:即选择分组标志和确定说明各组和总体的指标体系。)2.对调查资料进行审核。(即整理前要审核资料的完整性.准确性和及时性。)3.对资料分组或分类。这是统计整理的关键问题4.对各项指标进行汇总和必要的加工计算。这是统计整理的中心内容。5.编制统计图表。统计整理的结果。\n§3.1统计整理与统计分组一、统计整理的意义和步骤二、统计整理的基本方法——统计分组★★\n将总体中所有单位按一定的标志分为性质不同但又有联系的若干部分的过程1统计分组2、统计分组的作用:总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。划分社会经济现象的类型反映社会经济现象的内部结构和比例关系揭示社会经济现象之间的相互依存关系\n选择分组标志确定分组体系总体单位归类科学性原则:组间差异大,组内差异小。穷尽性原则:每个单位都有组可归。3、统计分组的程序与原则互斥性原则:每个单位只有一个组可归。\n对大学生月生活费支出情况进行分组研究:按家庭收入水平分组;按城乡分组;按性别分组;按年龄分组。?统计分组的程序与原则对父母亲下岗情况进行分组研究:单亲下岗; 双亲下岗; 双亲在岗。不符合科学性不符合穷尽性和互斥性城乡区别离退休 是否健在?\n\n例如,××年全国独立核算工业企业净产值如下\n\n第三章统计数据的整理与显示★§3.1统计整理与统计分组§3.2分布数列的编制§3.3统计图表★\n§3.2分布数列的编制一、分布数列的定义及种类二、变量数列的编制三、累计次数与累计频率★\n变量数列品质数列将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组在总体中所占的比重而形成的数列分布数列分类分组标志的具体表现各组的次数或频率构成要素异距数列等距数列组距数列单值数列\n§3.2分布数列的编制一、分布数列的定义及种类二、变量数列的编制三、累计次数与累计频率★★\n单值数列指每个组值只用一个具体的变量值表现的数列同时具备变量数列的编制1变量是离散变量变量的不同取值个数较少编制条件:【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。\n日产量(件)X工人数(人)f202122232425263564321合计24编制结果如下:\n组距数列指每个组的变量值用一个区间来表现的变量数列变量数列的编制2变量是连续变量;或:总体单位数较多,变量不同取值个数也较多的离散变量。编制条件:变量值变动区间的长度相等变量值变动区间的长度不完全相等等距数列异距数列\n相关概念指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限组限每组变量值变动区间的长度,为上下限之差组距对于连续组距式分组  组距=上限-下限对于间断组距式分组  组距=本组上限-本组下限+1=本组上限-前组上限=本组下限-前组下限-对于开口组的组距的确定:一般是以其相邻组的组距为准计算.\n每组变量取值范围的中点数值组中值即=(上限+下限)/2对于开口组:缺下限组组中值=该组上限-相邻组组距/2缺上限组组中值-该组下限+相邻组组距/2全距最大变量值-最小变量值组数对总体分组中分成各组的总数\n某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)\n编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某地区某年50个商店商品销售额的资料如下(单位:百万元):7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求编制组距数列。\n编制步骤:⒈求变异全距⒉确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R≤组距(d)×组数(m)编制等距数列\n计算组数(组数不宜过多,也不宜太少)上例中,取d=5,则有编制等距数列(当的结果为整数时)(当的结果为小数时)\n⒊确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;一般坚持“上组限不计入”原则;(实践中也有“下组限不计入”原则。首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法编制等距数列\n⒋计算次数编制等距数列编制结果:销售额(百万元)组中值商店数5以下5~1010~1515~2020~2525以上2.57.512.517.522.527.5410161343合计—50常用分组划记法(5+(5-5))/2=2.5(25+(25+5))/2=27.5\n§3.2分布数列的编制一、分布数列的定义及种类二、变量数列的编制三、累计次数与累计频率★★★\n次数和频率1.次数与频率次数:(频数)是每组变量值出现的次数.频率:(比重)各组次数与总次数之比.设fi为第i组频数,即第i组的频率=fi/频率是大于等于0小于等于1的数,其合计等于1。2.频数密度和频率密度异组距的分布受到组距的影响。为了消除这种影响,则要编制频数密度或频率密度才能准确地反映异组距数列的分布情况。频数密度=频率密度=\n3、累计次数(频率)从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。也称以下累计、较小制累计等。向上累计向下累计从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。也称以上累计、较大制累计等。\n销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计50100如:\n销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向上累计5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合计50100——\n销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————\n洛伦茨曲线累计频数(频率)分布曲线,可用于分析社会财富、土地和工资收入等的分配是否公平的问题。该曲线图是由美国洛伦茨博士提出,故称为洛伦茨曲线。洛伦茨曲线某国家收入所得的分配情况按收入所得水平分组人口收入累计收入的(%)人口数(万人)结构%累计%月收入额(亿美元)结构%实际累计%绝对平等绝对不平等最低中下等中等较高最高128.5348.0466.945.611.012.8534.8046.694.561.112.8547.6594.3498.91001.574.0816.337.541.8851352246518709410012.8547.6594.3498.91000000100合计1000.0100.0__31.40100______\n20406080100806040200100绝对平等线实际收入分配线绝对不平等线绝对不平等线人口(%)收入(%)洛伦茨曲线AB\n洛伦茨曲线与基尼系数20世纪初意大利经济学家基尼,根据洛伦茨曲线找出了判断分配平等程度的指标。实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B。以A除以A+B的商表示不平等程度。这个数值被称为基尼系数或称洛伦茨系数。\n洛伦茨曲线与基尼系数当A=0时,A/(A+B)=0,则基尼系数为0,收入分配完全平等;当B=0时,A/(A+B)=1,则基尼系数为1,收入分配绝对不平等;所以,基尼系数可在0和1之间取任何值。联合国有关组织规定:若低于0.2表示收入绝对平均;0.2-0.3表示比较平均;0.3-0.4表示相对合理;0.4-0.5表示收入差距较大;0.6以上表示收入差距悬殊。基尼系数还可用于财产、资本、资源、产品、市场等资源分配均衡程度的分析。\n各种不同性质的社会经济现象都有着特殊的次数分布。概括起来,主要有下列四种类型:钟形分布水平分布U形分布J形分布4、次数分布的主要类型\n1.钟形分布钟形分布的符征是“两头小、中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少。绘成曲线图,宛如一口古钟。次数分布的主要类型\n钟形分布具体可分为对称分布和非对称分布。对称分布的特征是中间变量值分布的次数最多,两侧变量值分布的次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布。次数分布的主要类型\n对称分布中的正态分布最为重要,许多社会经济现象统计总体的分布都趋近于正态分布。例如,农业平均亩产量的分布、零件公差的分布、商品市场价格的分布等。正态分布在社会经济统计学中具有重要意义。在非对称的分布中,有不同方向的偏态,如图:次数分布的主要类型\n次数分布的主要类型\n2.水平分布水平分布的特征是总体内各个变量值分布的次数大体相等,绘成图形,表现为一条平行于横铀的水平线,如图:次数分布的主要类型\n例如,某些必需而用途又比较狭窄的商品(如丧葬用品)的价格,需求弹性小,不论价格如何变化,而需求量变动不大。需求量按价格水平分组便呈现水平分布。现实生活中严格的水平分布是比较少见的,但对这种分布的研究,在统计理论上有着特殊的意义。次数分布的主要类型\n3.U形分布U形分布的待征与钟形分布恰恰相反,靠近两端的变量值分布的次数多,靠近中间的变量值分布的次数少,形成“两头高、中间低”的分布持征。绘成曲线图,象英文字母“U”字。图形如:。次数分布的主要类型\n有些社会经济现象的分布表现为U形分布,例如人口死亡率分布。由于人口总体中幼儿死亡人数和老年死亡人数均较高,而中年死亡人数最低,因而按年龄分组的人口死亡率便表现为U形分布。次数分布的主要类型\n4.J形分布J形分布有两种类型。正J形分布是次数随着变量值的增大而增多,绘成曲线图,犹如英文字母“J”字。反J形分布是次数随着变量值的增大而减少,绘成曲线图,犹如反写的英文字母“J”字,图形如下:次数分布的主要类型\n在社会经济现象中,有一些统计总体呈J形分布。例如,资本主义社会中,投资额按利润率大小分布,一般均呈正J形分布;而人口总体按年龄大小分布,则一般均呈反J分布。次数分布的主要类型\n第三章统计数据的整理与显示★§3.1统计整理与统计分组§3.2分布数列的编制§3.3统计图表★★\n§3.3统计图表一、统计表二、统计图★\n具有容量大、方便计算等特点统计表的常用结构:统计表以纵横交叉的线条所形成的表格来表现统计资料的形式总标题纵列标题横行标题数据栏宾词栏主词栏附注:如补充资料、注解、附记、资料来源、某些指标的计算方法、填表单位、填表人员以及填表日期等。\n总标题是表的名称,用以概括统计表中全部统计资料的内容。一般写在表的上端中部。横行标题是横行的名称,在统计表中通常用来表示各组的名称,它代表统计表所要说明的对象,一般写在表的左方。纵栏标题是纵栏的名称,在统计表中通常用来表示统计指标的名称。一般写在表的上方。指标数值列在各横行标题与各纵栏标题的交叉处。统计表中任何一个数字的内容由横行标题和纵栏标题所限定。统计表的构成\n统计表的内容可以分为两个组成部分:一部分是统计表所要说明的总体,它可以是各个总体单位的名称、总体的各个组,或者是总体单位的全部,这一部分习惯上称为主词。另一部分则是说明总体的统计指标,包括指标名称和指标数值,这一部分习惯上称为宾词。统计表的内容\n某地区100个百货商店月销售额与流通费用情况按销售额分组(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5宾词主词纵行标题横行标题指标数值总标题\n统计表的编制规则选择合适的总标题;主词栏与宾词栏要各归其位,相互对应;表的布局要合理(一般成长方形表格),上、下端用粗线或双线封口,左右两端一般不封口;可在各列的文字标题下面设置编号加以标识;如主词分栏用(甲)、(乙)、(丙)……宾词分栏用(1)、(2)、(3)……数据栏不能有空白。数据要对齐;当数据太小不足本表最小单位或缺乏某项资料时用“…”标明,当无法取得或没有数值时用“—”标明,当某项资料应免填时“×”标明,当数字为“0”时要填入“0”,不能空格,相同数字应如数写出,不可用“同上”或“同左”等字眼。\n统计表的加工方法对主词栏加工对宾词栏加工(对主体进行分组)单式加工复式加工(选择指标及对指标进行分组)简单分组交叉分组\n对主词栏的单式加工————\n对主词栏的复式加工\n按月工资分组按性别分(人)按级别分小计男女小计技工学徒工300以下300~400400~500500~600600~700700以上416221510516101184310124214162215105024585414181020合计724032722448对宾词栏的简单分组\n按月工资分组按级别分(人)总计技工学徒工小计男女小计男女对宾词栏的交叉分组\n§3.3统计图表一、统计表二、统计图★★\n统计图以点、线条、面积等方法描述、显示统计数据的形式具有直观、醒目、易于理解等特点组成:坐标系图形图例单式图复合图叠加图一个图只用来显示一种现象的数量特征用一个图同时显示几种数量的分布或变化情况\n几种常用的统计图条形图(Bar)用于显示离散型变量的次数分布\n几种常用的统计图条形图(Bar)用于显示离散型变量的次数分布\n几种常用的统计图条形图(Bar)用于显示离散型变量的次数分布\n条形图(Bar)用于显示离散型变量的次数分布\n直方图(Histogram)用于显示连续型变量的次数分布VAR00001174.0170.0166.0162.0158.0154.0403020100Std.Dev=4.86Mean=163.3N=83.00\n直方图条形图\n圆形图(饼图Pie)主要用于显示定类变量的次数分布\n\n\n线图(Line)主要用于显示连续型变量的次数分布和现象的动态变化\n散点图(Scatter)主要用来观察变量间的相关关系,也可显示数量随时间的变化情况

相关文档