- 3.68 MB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第1章总论\n学习目标●理解统计的涵义及研究对象和特点●掌握统计的基本概念及各概念之间的区别和联系●了解统计研究的基本方法和一般过程\n1.1统计学的研究对象1.1.1统计的涵义1.1.2统计的研究对象和特点1.1.3统计的分类\n1.1.1统计的涵义统计(statistics)一词在不同的场合有三种涵义:统计工作、统计资料、统计学。统计工作(statisticaloperation)是指具体从事统计设计、资料搜集、整理、分析预测和提供各种统计资料的实践活动的总称。像在上例中计算出反映两班成绩的各种指标,并且进行分析评价的工作过程就是统计工作。统计资料(statisticaldata)是指在统计工作过程中所获得的以统计数据表现的信息资料。例如,反映两班成绩的各种指标就是统计资料。统计学(statistics)是阐述正确指导统计活动科学原理和方法的学科体系。从广义上讲,统计学是包括自然科学和社会科学在内的统计科学理论的总和。本书则专门阐述作为社会科学分支的统计学理论和方法,也可称为社会经济统计学。主要论述对社会经济现象如何进行统计设计、统计调查、统计整理和分析统计资料的理论和方法。统计一词的三种涵义有着密切联系。统计工作与统计资料是工作过程与成果的关系;统计学与统计工作是理论与实践的关系。因此,统计一词是统计工作、统计资料、统计学的综合概括,是统计的过程与结果、理论与实践的辩证与统一。\n1.1.2统计的研究对象和特点1.数量性2.总体性3.社会性\n1.1.3统计的分类1.理论统计学与应用统计学2.描述统计学与推断统计学描述统计学是整个统计学的基础,而推断统计学是现代统计学的核心。\n1.2统计学的工作过程和研究方法1.2.1统计的工作过程统计设计统计调查统计整理统计分析1.2.2统计的研究方法1.大量观察法2.统计分组法3.综合指标法\n1.3统计学的基本概念1.3.1统计总体与样本1.3.2标志与指标\n1.3.1统计总体与样本1.统计总体●统计总体简称总体(population),是根据统计研究目的确定的所研究对象的全体。它是由客观存在的,具有某种共同性质的许多个体组成的。●总体具有三方面的特征:①同质性②大量性③差异性●统计总体的范围可大可小。●统计总体与总体单位的概念是相对而言的,随着研究目的和总体范围不同而相互变化。\n2.样本●从总体中抽取一部分个体构成的集合,称为样本(sample)。●构成样本的个体的数目,称为样本量。●样本所取自的总体又称为母体,样本又称为子样。●样本具有随机性。\n1.标志●标志(mark)是反映总体单位的属性和特征的名称。●标志可分为品质标志和数量标志。●标志还可分为不变标志和可变标志。●标志和标志表现是两个不同的概念。●一个标志当它既是数量标志又是可变标志时,我们称其为变量。●变量根据其变量值的取值情况可分为连续型变量和离散型变量。1.3.2标志与指标\n2.指标●指标是统计指标(statisticalindicator)的简称。是指用以反映统计总体数量特征的概念或范畴。一项完整的统计指标主要由四部分构成。即指标名称、指标数值、指标单位和指标条件。●统计指标可分为数量指标和质量指标。●反映总体特征的指标叫参数(Parametric),反映样本特征的指标叫统计量(statistic)。●指标和标志是既有联系又有区别的两个概念。●由一系列相互联系的统计指标所组成的有机整体,称为统计指标体系。\n1.4数据的计量尺度1.4.1定类尺度定类尺度(NominalLevel)是一种精确水平最低、最粗略的计量尺度。它仅仅是一种标志,用以区分变量的不同值,但没有次序关系。1.4.2定序尺度定序尺度(OrdinalLevel)比定类尺度的精确性要高一些,定序数据表现为各类别或各组之间有一定的顺序,数据可以排序,而且可以比较大小。1.4.3定距尺度定距尺度(IntervalLevel)是比定序尺度高一层次的定量尺度。它不仅能将总体各单位分类,并使各类型具有实质性意义的排序,而且能以确切的数值反映各单位之间间距大小。1.4.4定比尺度定比尺度(RatioLevel)是数据最高级的定量尺度。定比尺度具有定距尺度同样的特点,但定比尺度有绝对的0,并且两个数据之比是有意义的。\n1.4.5四种计量尺度的比较\n习题与实践训练1、山东省城调队2004年从全省范围内抽取了不同收入、职业、行业、文化程度的5550户城镇居民进行调查。本次调查历时半年之久。结果显示,科研技术服务行业人员对5年来的总体生活质量评价最高,尤其是年龄越低的居民对总体生活水平评价越高。 在生活质量评价方面,调查显示,四成以上的科研技术服务行业从业人员和硕士以上高学历人员认为,总体上水平高于5年前,对总体生活质量评价最高。另外,超过36%的单位或部门负责人由于在收入水平、金融资产、消费水平和社会地位等方面高于其他人,他们对生活质量的总体评价也较高。在经济收入评价方面,高收入阶层(城镇住户年收入在8万元以上)对5年来经济收入的变化评价最高,四成多的中等收入居民认为5年来的经济收入变化不大,户均年收入在1万元以下的居民半数认为经济收入下降,其中尤其是户均收入在2000元以下的居民中有43.2%的人认为收入下降很多。另外,调查显示,年龄越低的居民对总体生活水平评价越高。30岁以下的人认为生活质量提高的为30.2%,60岁以上的仅有17.3%。摘自新华网2004—12—13分析说明上述案例中什么是总体?什么是样本?什么是变量?\n2、若对校园中大学生关心的话题进行调查研究(例如,大学生上网状况调查,就业分配去向及初职预期收入调查等),你能说出统计工作中所涉及到的统计总体、样本、标志、指标、指标体系等概念吗?\n当研究下述问题时,请确定四种计量尺度中最恰当的计量尺度。1、上班采用的交通方式2、每周的学习时间3、学生乘车到学校的行驶路程4、昨晚10:00看的电视节目5、城市按照综合竞争力排名6、社会保障编号7、大学课本的价格8、校园气温9、对学校食堂的评价10、学院足球队队员的身高11、大学毕业生毕业论文质量等级12、城市进出口总额\n第2章统计调查\n●理解统计调查的意义与种类●掌握各种统计调查的基本方式的运用条件●独立设计简单的统计调查方案●了解各种统计调查方法和统计调查技巧学习目标\n2.1统计调查的意义和种类2.1.1统计调查的意义和特点2.1.2统计调查的作用和要求2.1.3统计调查的种类\n2.1.1统计调查的意义和特点统计调查(statisticalsurvey)是根据统计研究的目的和任务,采用科学的调查方法,有计划、有组织地向客观实际搜集各种原始资料或次级资料的工作过程。统计调查具有以下特点:⑴初始性⑵个体性⑶数量性\n2.1.2统计调查的作用和要求统计调查的主要作用表现在:⑴统计调查是认识社会的基本方法;⑵统计调查为国家管理和现代企业管理提供基本统计资料;⑶统计调查的资料是进行经济预测的重要依据;⑷统计调查是实施经济评价的重要基础。统计调查的基本要求是准确性、及时性、完整性、系统性和经济性。\n2.1.3统计调查的种类统计调查根据被研究总体的范围,分为全面调查和非全面调查。2.统计调查按调查登记时间的连续性不同,分为经常性调查和一次性调查。3.统计调查按搜集资料的方法不同,分为直接调查和间接调查。\n2.2统计调查方案一个完整的统计调查方案应该包括以下基本内容。1.调查目的2.调查对象和调查单位3.调查项目和调查表4.调查时间和调查期限5.调查的组织和实施\n2.3统计调查方式2.3.1普查2.3.2抽样调查2.3.3统计报表2.3.4重点调查2.3.5典型调查\n2.3.1普查●普查(census),即指普遍调查,是依据调查任务而专门组织的一次性的全面调查。●普查有三个主要特点。⑴一次性⑵时点性⑶全面性●普查的组织形式有两种。一种是自上而下组织专门普查机构,配备一定数量的普查人员,对调查单位直接进行调查登记。另一种是自下而上由被调查单位填报调查表格逐级上报来实施普查。●普查作为获取有关国情、国力资料的重要统计方法,在我国已经纳入了规范化、法制化的轨道,我国政府也制定了“以周期性普查为基础”的整体统计调查方法体系。\n2.3.2抽样调查●抽样调查(samplingsurvey)是一种非全面调查,它是按照随机原则从总体中抽出适量单位组成样本予以调查,用样本资料推算总体数量特征的一种调查方法。●抽样调查有以下几个特点。⑴它是非全面的“代表性”调查。⑵抽样调查按照随机原则取样。所谓随机性原则就是总体中调查单位的确定完全由随机因素来决定,单位中选与否不受主观因素的影响,保证总体中每一单位都有同等的中选可能性。采用随机原理抽选样本调查单位,才能保证样本的代表性。⑶抽样误差是可以控制和计算的●抽样调查法在现代统计调查中有准确性高、时效性强、经济性好、应用性广的显著优越性,它已成为统计调查方法的主体\n2.3.3统计报表●统计报表(statisticalreportforms)是按国家统一规定的调查文件,以基层统计的原始记录为依据,自下而上,逐级定期地提供统计资料的一种调查方式。●统计报表的资料来源于基层单位的原始记录。●从原始记录到统计报表,中间还要经过统计台帐和企业内部报表。●在市场经济条件下,必要的统计报表是我国统计调查方法体系的补充。统计报表经常同各种调查方法结合起来,综合运用。\n2.3.4重点调查●重点调查是在全部调查单位中选择一部分重点单位进行调查,借以了解总体的基本情况的一种非全面调查。所谓重点单位,是指这样一些单位,它们的数目在全部单位数中只占很小的比重,但它们的标志值的总和在总体的标志总量中却占很大的比重,通过对这部分单位进行调查,就能从数量上反映总体的基本情况。●重点调查在实际应用时应注意:⑴重点单位的选择不带有主观因素。⑵重点调查不能精确推断总体总量。\n2.3.5典型调查●典型调查(representativesampling)是根据调查的目的任务,在对所研究的现象总体进行初步分析的基础上,有意识地选取有代表性的典型单位而进行的非全面调查。●典型调查在实际应用时应注意:⑴典型单位的确定是人为选择的,取决于调查统计人员对调查对象全面分析基础上主观的判断选择。这与重点调查中重点单位的选取是不相同的。⑵一般说来,典型调查的目的是发现问题、观察趋势,而不能不加限制地直接以调查结果来推断总体。典型调查经常用来验证全面调查(例如普查)数据的质量,而且典型调查的深入了解也可以作为全面调查的补充说明。\n2.4统计调查的方法和技巧2.4.1传统调查方法1.观察法2.访问法3.实验法4.报告法5.文献法2.4.2网上调查1.网上直接调查2.网上间接调查2.4.3统计调查技巧1.调查问卷设计技巧2.调查谈话的技巧\n习题与实践训练1、以你所在的班级为总体进行统计调查,总体单位是每一位同学,调查的有关标志是学生的身高、体重、性别和年龄。不出现姓名。⑴请设计一个简单的统计调查方案;⑵设计一个单一调查表,包括表头、表体和表脚;每个同学将各自标志的结果写在纸条上,收集在一起,就形成了原始资料。请保存好这些资料,在后面的章节中我们会利用这些数据。\n2、你所在的学院伙食如何?大二学生每月零花钱数额为多少,来源及去向是怎样的?大学生就业初职预期薪水和地域如何?对这些问题或者你感兴趣的其他问题,进行模拟统计调查。尝试设计一份调查问卷,注意利用调查问卷设计技巧。\n第3章统计整理\n学习目标●了解统计整理的含义、内容及步骤●掌握统计分组的基本理论和方法●掌握分配数列的特性和编制方法●学会编制统计表绘制统计图\n3.1统计整理的意义和内容3.1.1统计整理的意义统计整理(statisticalTreatment)指根据统计研究的任务和要求,对统计调查所取得的原始资料进行科学的分类、汇总或对已整理过的资料进行再加工,使之系统化、条理化,以得到反映现象总体特征的综合资料的工作过程。3.1.2统计整理的内容1.拟订统计整理纲要2.审核原始资料3.进行分组汇总4.编制统计表、绘制统计图5.统计资料的保管与积累\n3.2统计分组3.2.1统计分组的概念和作用3.2.2统计分组的种类3.2.3分组标志选择及界限的确定3.2.4统计分组的方法\n3.2.1统计分组的概念和作用●统计分组(statisticalclassification)就是根据统计研究的需要和总体的内在特征,将总体按照一定的标志划分为若干个组成部分的一种统计方法。●统计分组的作用主要体现在以下三个方面:1.划分现象的类型2.反映现象总体的内部结构3.分析现象之间的依存关系\n3.2.2统计分组的种类1.按分组的作用或目的不同,分为类型分组、结构分组和分析分组。2.按分组标志的多少及其排列形式,可分为简单分组、复合分组和分组体系。3.按分组标志的性质,可分为品质标志分组和数量标志分组。\n3.2.3分组标志选择及界限的确定1.应根据研究的目的与任务选择分组标志2.选择最能体现现象本质特征的标志作为分组标志3.结合现象发展的具体历史条件和经济条件选择分组标志\n3.2.4统计分组的方法●品质标志分组的方法●数量标志分组的方法按数量标志分组的方法有两种:单项式分组和组距式分组\n3.3分配数列3.3.1分配数列的意义和种类3.3.2变量数列的编制\n3.3.1分配数列的意义和种类●在统计分组的基础上,将总体的所有单位按组进行归类整理并按一定顺序排列,计算出各组的单位数,形成了一个反映总体中各单位在各组中的分布情况的数列,这个数列称为分配数列或次数分布(frequencydistribution)。●分配数列由两要素组成,一是总体中按某标志分的组,二是各组相应的分配次数或频率或标志值。●分配数列按分组标志特征的不同,分为品质分配数列和变量分配数列。变量数列按其分组方法的不同,可以分为单项式变量数列和组距式变量数列。\n3.3.2变量数列的编制●变量数列次数分布表的编制(1)原始资料按数值大小依次排序(2)确定组距、组数和组限(3)编制组距式变量数列次数分布表●变量数列次数分布图的绘制●累计次数分布(1)向上累计(2)向下累计●次数分布的主要类型(1)钟型分布(2)U型分布(3)J型分布\n3.4统计图表3.4.1统计表3.4.2统计图\n3.4.1统计表●统计表(Statisticaltable)是用来显示经过汇总加工后的综合统计资料的一种表格形式。●统计表的结构可以从内容和形式两方面来看。(1)从内容上来看,统计表包括主词和宾词两个部分。(2)从形式上看,统计表包括总标题、横行标题、纵栏标题和数字资料四个部分。●根据不同的分类标志,可以将统计表划分不同的类型。(1)按用途不同,统计表可以分为调查表、整理表和分析表。(2)按总体分组情况不同,统计表可以分为简单表、分组表和复合表。●统计表设计一般是按宾词进行设计。为了使统计表能更好地反映被研究对象的数量特征,便于比较分析,应遵循科学、实用、简明、美观的编制原则。\n3.4.2统计图统计表的资料用几何图形或图案等形式表示即成为统计图。统计图由标题、图域、标目、尺度和图例五部分构成。统计图(Statisticalgraph)的形式多种多样(1)条形图(2)圆形图(3)曲线图\n习题与实践训练1、某班学生统计学考试成绩(分)如下:9350788566716383529578728578829080559567728577709070766958898061679989637874828898628124768673838581根据上述资料,(1)编制组距数列,说明每一组的上下限、组中值。(2)绘制次数分布的曲线图,据此分析成绩分布的特点。(3)编制累计频数分布表,并回答60分以下及80分以上的人数。\n2、利用第二章“应用能力训练题5”所搜集的资料,(1)按性别分组,编制品质分配数列(2)按年龄分组,编制单项式变量数列(3)按身高分组,编制组距式变量数列。\n第4章总量指标和相对指标\n学习目标●理解总量指标和相对指标的意义、作用、分类及运用原则;●理解各类指标之间的联系和区别,了解指标间的数量关系;●掌握各类指标的具体计算方法,并能正确熟练地加以运用。\n4.1总量指标4.1.1总量指标的意义、种类总量指标是以绝对数形式反映一定客观现象总体在具体时间和地点条件下的总规模、总水平或工作总量的统计指标,又称统计绝对数(absolutenumber)。总量指标按其反映的内容不同分为总体单位总量和总体标志总量按照总量指标反映的时间状况不同分为时期指标和时点指标4.1.2 总量指标的计量单位1.实物单位2.价值单位3.劳动量单位4.1.3总量指标的计算1.直接计量法2.推算和估算法\n4.2相对指标4.2.1相对指标的意义、种类4.2.2 相对指标的计算\n4.2.1相对指标的意义、种类●相对指标又称统计相对数(relativenumber),它是两个相互联系的统计指标对比的结果,它可以表明社会经济现象和过程所有的数量对比关系。●相对指标的表现形式有两种:一种是无名数,另一种是有名数。●相对数主要有下列几种:结构相对指标、比例相对指标、比较相对指标、动态相对指标、强度相对指标和计划完成程度相对指标。\n4.2.2 相对指标的计算1.结构相对指标结构相对指标是在分组的基础上,将总体区分为性质不同的各个部分,以各部分指标数值与总体全部数值相比所得的相对数,用以反映现象各部分在总体中所占的比重或比率,说明现象内部的组成状况与数量关系。其计算公式为:结构相对指标主要作用有:①将不同时期的结构相对指标进行对比,可以通过总体结构的变动,观察客观事物变化的进程。②可以说明总体的内部构成情况,从而揭示现象的性质和特征。③根据总体各构成部分所占比重是否合理,可以反映总体的质量或某项工作的质量好坏,反映人力、物力、财力的利用情况。\n2.比例相对指标比例相对指标是同一总体内不同组成部分的指标数值对比的结果,用来表明总体内部的比例关系。其计算公式为:比例相对数与结构相对数有着密切的联系。比例相对数也是一种结构性比例,但两者对比的方法不同。\n3.比较相对指标比较相对数又称类比相对数,是将两个同类指标作静态对比得出的综合指标,表明同类现象在不同条件(如在各国、各地、各单位)下的数量对比关系。其计算公式为:计算比较相对数时,作为比较基数的分母可以取不同的对象。一般有两种情况:(1)比较标准是一般对象。(2)比较标准(基数)典型化。\n4.动态相对指标动态相对指标是将不同时期的同类指标进行对比,反映现象在时间上的发展变化方向和变化程度,也叫动态比较相对数。其计算公式为:一般地,把用来作为对比基础的时期称为“基期”,而把同基期对比的时期称为“报告期”或“计算期”。\n5.强度相对指标强度相对指标又称为强度相对数,是两个性质不同,但有一定联系的总量指标对比的结果,用来表明现象的强度、密度和普通程度的综合指标。其计算公式为:强度相对指标一般采用有名数形式。强度相对指标有正指标和逆指标之分。但要注意的是,在实际工作中,并不是所有的强度相对指标都有正指标和逆指标之分。\n6.计划完成程度相对指标计划完成程度相对指标是实际完成数与相应的计划数对比的结果,用以表明计划完成的程度,也叫计划完成相对数或计划完成百分比(percentageofplanfulfilment)。① 计划任务数为绝对数时计算计划完成程度相对指标计算公式为:②计划任务数为相对数时计算计划完成程度相对指标。③计划任务数为平均数时计算计划完成程度相对指标。(1)计划完成程度的计算\n(2)计算和分析长期计划完成情况的方法①水平法。如果在长期计划中,只规定计划期最末一年应达到的水平,则在计划期中,哪一期达到了计划数,该期就完成了计划。用水平法检查长期计划执行情况的计算公式为:②累计法。如果在长期计划中,计划指标规定的是整个计划期内累计应达到的水平,则采用累计法,将计划期内各年实际完成累计数与长期计划规定的累计数作对比来检查计划完成情况。其计算公式为:\n(3)计划执行进度的检查在实际应用中,计划完成程度指标在检查计划执行情况时,往往有两种情况;一是检查计划执行的结果,带有总结的性质。这时公式中实际水平与计划水平所包含的时期长短是完全一致的。另一种情况是检查计划执行的进度和均衡程度,这时公式中实际水平与计划水平所包含的时期长短是不一样的。\n4.3总量指标与相对指标的应用4.3.1应用总量指标应注意的问题1.正确确定总量指标的含义和计算范围。2.计算实物总量指标时要注意产品的同类性。3.正确规定总量指标的计量单位。4.3.2 应用相对指标应注意的问题1.始终注意对比指标的可比性原则2.相对指标与统计分组法的结合运用3.各种有联系的相对指标结合起来运用4.3.3总量指标与相对指标的结合运用\n习题与实践训练1.某公司在年终统计分析报告中写道:我公司今年销售收入计划规定2500万元,实际完成了2550万元,超额完成计划2%;销售利润率计划规定8%,实际为12%,超额完成计划4%;劳动生产率计划规定比去年提高5%,实际比去年提高5.5%,完成计划110%;产品单位成本计划规定比去年下降3%,实际比去年下降2.5%,实际比计划多下降0.5个百分点。请指出上述分析报告中哪些指标计算有错误?将其改正过来。\n2.某公司产值计划完成103%,比上年增长6%,请问,计划规定比上年增加多少?又知该公司某款主要产品每台成本应在2003年1398元的水平上降低20元,实际2004年每台成本1365元,试确定降低成本计划完成情况指标。\n第5章平均指标和标志变异指标\n学习目标●理解平均指标的意义和作用●掌握数值平均数的计算方法●理解位置平均数含义及适用范围●能运用标志变异指标进行平均数代表性的对比分析\n5.1平均指标的意义和作用5.1.1平均指标的意义平均指标又称平均数,反映现象总体各单位某一数量标志值的典型水平、一般水平和代表性水平。平均指标是社会经济现象中最常用的一种综合指标。5.1.2平均指标的作用1.可以反映总体各单位分布的集中趋势。2.可以对现象在不同空间、时间上进行比较分析。3.可以分析现象之间的依存关系。4.可以作为评价事物的参考依据。5.可以进行数量上的估算。\n5.1.3平均指标的种类平均指标按其所属总体的时间范围不同分为两种:静态平均数和动态平均数。静态平均数按其计算方法的不同分为两种:数值平均数和位置平均数。凡根据总体各单位标志值计算的平均数,称为数值平均数。常见的主要有:算术平均数、调和平均数和几何平均数等凡根据总体标志值在分配数列中的位置确定的平均数,称为位置平均数。常见的主要有众数和中位数等。\n5.2数值平均数5.2.1算术平均数1.算术平均数的意义算术平均数(arithmeticmean)是总体标志总量与总体单位总量对比的结果。其基本公式为:算术平均数是分析社会经济现象一般水平和典型特征的最基本、最常用的一种平均指标。它也是平均指标中最重要的一种。一般不加特别说明时,所称的“平均数”都是指算术平均数。根据基本公式计算算术平均数时,由于依据的资料不同,计算方法有所不同,可分为简单算术平均数和加权算术平均数。算术平均数=\n2.简单算术平均数如果总体单位数不多,资料未经分组,计算算术平均数时可采用简单算术平均数的方法。计算过程是:先把总体各单位标志值相加得总体标志总量,再与总体单位总数对比,即可得到算术平均数。计算公式为:\n3.加权算术平均数如果调查所得的原始资料已经经过分组整理,形成了变量数列,则计算算术平均数要采用加权算术平均数的方法。计算过程是:将各组的变量值与各组的单位数相乘,计算出各组标志总量,各组标志总量汇总得出总体标志总量,然后除以各组单位数之和即总体单位总量,得到平均数。计算公式为:权数不但可以用次数、频数(即总体各组单位数)这种绝对数表示,还可以用比重、频率这种相对数表示。此时,加权算术平均数公式可以演化为:简单算术平均数是加权算术平均数的特例。选择权数的原则是,务必使各组的标志值与其乘积等于各组的标志总量,并且具有实际经济意义。\n5.2.2调和平均数调和平均数(harmonicmean)是各个标志值倒数的算术平均数的倒数,故又称为倒数平均数。根据给定的材料不同,调和平均数有简单调和平均数和加权调和平均数两种。1.简单调和平均数简单调和平均数是各个标志值倒数的简单算术平均数的倒数。其计算公式为:\n2.加权调和平均数加权调和平均数是各个标志值倒数的加权算术平均数的倒数。\n调和平均数与算术平均数在计算上是相通的,但各自适合不同的资料。在实际应用中,一般采用下列步骤进行计算。⑴先在给出的材料中找出x。方法是“求谁的平均数谁就是x”;⑵确定权数为f还是为m。方法是分配数列中的这栏数值若与相乘有意义,则为f,若与相除有意义,则为m;⑶写出计算公式。如何写?若权数定为f,采用算术平均数公式,若权数定为m,则采用调和平均数公式;⑷延展计算表。根据写出的公式,需要什么内容就在表格中列出什么。例如,若采用的是算术平均数公式,则表格中列出xf计算,若采用的是调和平均数公式,则表格中列出m/x计算;⑸将数值代入公式,计算得答案。\n5.2.3几何平均数几何平均数(geometricmean)是若干项变量值的连乘积开若干次项数的方根。它是计算平均数的另一种形式。它主要用于计算比率或速度的平均。当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时,就应采用几何平均法计算平均比率。因为这与几何平均数的数学性质相一致。根据所掌握的资料不同,几何平均数分为简单几何平均数和加权几何平均数。1.简单几何平均数如果资料未分组,直接将n项变量值连乘,然后对其连乘积开n次方所得的平均数即为简单几何平均数。其计算公式为:2.加权几何平均数与算术平均数一样,当资料已经经过整理,则应以各变量值出现的次数为权数,计算加权几何平均数。其计算公式为:\n5.3位置平均数5.3.1众数众数(mode)是指总体中出现次数最多的标志值,是总体各单位一般水平的代表值,反映现象的集中趋势。在资料未分组情况下,众数的确定很简单。只需找出次数最多的标志值即可。在组距数列情况下,计算众数方法是:首先在数列中找到次数最多的组;然后,用公式计算众数的近似值。计算公式为:⑴众数是根据变量值出现的次数确定的,而不是通过所有变量值计算得到的,所以,众数不受到极端变量值的影响。⑵众数是出现次数最多的变量值,如果数据分布没有明显集中趋势,众数可能不存在;如果有两个最高次数,也可以有两个众数(bimodal)。只有在总体单位比较多,而且又明显地集中于某个变量值时,计算众数才有意义。⑶众数主要用于测度定类数据的集中趋势,当然也适用于作为定序数据以及定距和定比数据集中趋势的测度值。众数是惟一一个能用在名词数据上的平均数。\n5.3.2中位数中位数(median)是指将总体各单位标志值按一定顺序排列后,处于中间位置的标志值。由于它的位置居中,其数值不受极端数值的影响,也能表明总体标志值的一般水平。在资料未分组情况下,中位数的确定比较简单。首先,把标志值按大小顺序排列起来,然后,计算中位数所在的位置找出中位数。在组距数列情况下,用公式计算中位数的近似值。⑴中位数是一种位置平均数,其大小取决于它在序列中的位置,因此它不受极端数值的影响。当存在极端数值时,中位数能比数值平均数更好地代表数据分布的一般水平。⑵中位数处于中间位置,有一半数值小于中位数,另有一半数值大于中位数,所以,它能表明数字资料的集中趋势。⑶中位数主要用于测度定序数据的集中趋势,当然也适用于定距数距和定比数据的集中趋势,但不适用于定类数据。\n5.3.3四分位数中位数是从中间点将全部数据等分为2部分,它也称二分位数。同样,可通过三个数值,将全部标志值分割成为四个相等部分。其中每部分包含25%的数据,处在分位点上的这三个分割的数值就是四分位数(quartiles)。四分位数的确定方法与中位数类似。也要分为两种情况,即未分组资料和分组资料。对于未分组资料,首先将数据按大小顺序排序,然后计算分位数所在的位置,最后确定相关的四分位数。\n5.3.4应用平均指标要注意的问题1.平均指标必须应用于同质总体。2.平均指标应与分配数列相结合。3.平均指标要与分组法相结合。\n5.4标志变异指标5.4.1标志变异指标的意义和作用1.标志变异指标的意义标志变异指标是反映总体各单位标志值差异程度的综合指标,所以又称为标志变动度。它是和统计平均指标相联系的一种综合指标。2.标志变异指标的作用⑴标志变异指标能够反映平均数代表性的大小。⑵标志变异指标可以说明现象变动的均衡性、稳定性和节奏性。⑶标志变异指标可以用来确定统计推断的准确程度\n5.4.2标志变异指标的计算及特点1.全距全距(range)是指总体各单位标志值中最大数值与最小数值之差,又称极差。用“R”表示。它表明各个数值之间最大可能的差距,是一种测量标志变动度的最简方法。对于未分组资料或单项数列资料,R=最大标志值—最小标志值对于组距数列资料,R最高组的上限—最低组的下限全距的优点是计算方法简单,意义明确。全距的缺点是易受极端数值的影响,它只能反映最大值和最小值之间的差距,而不能反映其内部各项数值的差异状况。\n2.四分位数间距四分位数间距(interquartilerange)是将总体各单位标志值按一定顺序排列后,第三个四分位数与第一个四分位数之差。用“IQR”表示。IQR=Q3—Q1第三个四分位数是处于中位数和最大数值中间的数值,第二个四分位数即中位数,第一个四分位数是处于中位数和最小数值中间的数值。四分位数间距优点是克服了全距受极端数值影响的缺点,计算简便。但是四分位数间距仍然不能反映总体内部各项标志值的差异状况,所以,它也是一个较粗糙的测定标志变动度的指标。\n3.平均差平均差(meanabsolutedeviation)是总体各单位标志值与其算术平均数离差绝对值的算术平均数,用符号“MAD”表示。平均差可分为简单平均差和加权平均差两种。其基本公式为:平均差是根据全部标志值计算出来的,反映了每个标志值与平均数的平均离散程度,与全距相比,受极端数值的影响较小,是比全距更优良的标志变异指标。但计算平均差时,须对离差取绝对值,这给平均差的代数运算带来了许多不便,从而使其应用受到了限制。\n4.标准差标准差(standarddeviation)是总体各单位标志值与其算术平均数离差平方的算术平均数的平方根。又称为均方差,用“”表示。标准差的平方称为方差(variance),用“”表示。标准差是标志变异指标中最重要,也是最常用的指标。标准差可分为简单标准差和加权标准差两种。其基本公式为:标准差反应灵敏,能准确反映总体分布的离散趋势。另外,它克服了平均差计算中用绝对值消除离差正负号带来的运算问题,在计算上比平均差更简便。标准差是实际应用最广泛的标志变异指标。但是由于标准差的大小与平均数有关,且标准差带有与标志值相同的计量单位,因此标准差不适宜用于比较平均数相差较大或计量单位不同的两总体分布的离散程度。\n5.标志变异系数标志变异系数(coefficientvariation)又称离散系数,是用标志变异指标与相应的算术平均数对比,来反映总体各单位标志值之间离散程度的指标,是以相对数表示的标志变异指标。标准差系数是无名数,在应用时不受计量单位和标志值水平限制,消除了不同总体之间在计量单位、平均水平方面的不可比性。适用于对比分析平均水平不同或计量单位不同的两组数据的离散程度的大小。标准差系数大的,说明数据的离散程度大;标准差系数小的,说明数据的离散程度小。\n习题与实践训练1.某学院工商管理系共有120名学生选修统计学,在期末考试中,男生平均成绩为77分,女生的平均成绩为81分。则:⑴若120名学生中,男女生各占一半,全体学生平均成绩为多少?⑵若120名学生中,男生80人,女生40人,全体学生平均成绩为多少?⑶若120名学生中,男生40人,女生80人,全体学生平均成绩为多少?⑷比较上述三种情况下,全体学生平均成绩的变化,解释变化的原因。\n2.一个总体各单位标志值的平均数是12.3分钟,标准差是4分钟。⑴如果给每个标志值都加上5分钟,平均数是多少?⑵如果给每个标志值都加上5分钟,标准差是多少?⑶如果给每个标志值都加上5分钟,方差是多少?⑷如果给每个标志值都加上5分钟,众数、中位数、四分位数是否发生变化,为什么?\n第6章抽样推断\n学习目标●理解抽样推断的意义与特点●掌握抽样推断的基本概念●掌握简单随机抽样形式的区间估计方法●掌握必要样本单位数的确定方法●了解抽样组织形式的概念和特点\n6.1抽样推断的基本概念抽样推断(samplinginference)是在抽样调查(samplingsurvey)的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。抽样推断具有四个特点:第一,抽样推断是由部分推算整体的一种认识方法。第二,抽样推断是建立在随机取样的基础上。第三,抽样推断是运用概率估计的方法,利用样本指标来估计总体参数。第四,抽样推断的误差是可以事先控制的。\n6.1.1总体和样本1.总体(population)也称全及总体,是指所研究现象的整体,即包括所要调查的所有单位。全及总体按其各单位性质的不同,可以分为变量总体和属性总体两类。对于一个总体来说,若被研究的单位标志属于品质标志,则该总体为属性总体,若被研究的单位标志属于数量标志,则该总体为变量总体。2.样本(sample)又称子样,它是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。作为推断对象的总体是确定的,而且是唯一的。但作为观察对象的样本不是唯一的,而是可变的。\n6.1.2参数和统计量1.参数(parameter)。根据总体各单位的标志值或标志属性计算的,反映总体数量特征的综合指标称为全及指标。全及指标是总体变量的函数,其数值是由总体各单位的标志值决定的。由于总体是唯一确定的,因此,全及指标也是唯一确定的,所以也称参数。常用的参数有总体平均数,总体成数、总体方差和总体标准差。2.统计量(statistic)。根据样本各单位标志值计算的反映样本特征的指标称为统计量,也称作样本指标。它是用来估计总体参数的。与总体参数相对应,统计量主要有样本平均数、样本成数、样本方差和样本标准差等。\n6.1.3样本容量和样本个数样本容量和样本个数是两个有联系但又完全不同的概念。样本容量是指一个样本所包含位数。样本个数又称样本可能数目。是指从一个总体上可能抽取的样本个数。\n6.1.4重复抽样和不重复抽样重复抽样又叫重置(withreplacement)抽样,是指从所研究的现象总体中,按照随机原则,抽取一个样本单位进行调查登记之后,把这个样本再放回总体中去;然后,再从所研究的总体中抽取样本单位,这样,总体单位数不变,设它为N。在进行第二次和第三次抽取样本时,已经被抽中的样本,仍然有同等的机会再被抽中。不重复抽样又叫不重置(withoutreplacement)抽样,是指从所研究的现象总体中,按照随机原则,抽取一个样本单位进行调查登记之后,不再把这个样本放回去。这样,所研究现象的总体单位数,将逐步减少,即总体单位数在不断起变化。\n6.2抽样误差6.2.1抽样误差的概念6.2.2抽样平均误差6.2.3抽样极限误差\n6.2.1抽样误差的概念抽样误差(samplingerror)是指由于随机抽样的偶然因素使各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。影响抽样误差大小的因素主要有:(1)样本单位数。(2)总体内各单位被研究标志的变异程度。(3)抽样方法。(4)抽样组织形式。\n6.2.2抽样平均误差1.抽样平均数的平均误差(1)重复抽样的抽样平均误差计算公式(2)不重复抽样的抽样平均误差计算公式2.抽样成数的抽样平均误差(1)重复抽样的抽样平均误差计算公式(2)不重复抽样的抽样平均误差计算公式\n6.2.3抽样极限误差抽样极限误差又称抽样允许误差,是指样本指标与总体指标之间产生抽样误差被允许的最大可能范围,它是根据所研究对象的变异程度和分析任务的要求来确定的可允许的误差范围,凡是在这个范围内的数字都算有效,统计上把这种可允许的误差范围称为抽样极限误差。抽样极限误差通常用样本指标可允许变动的上限或下限与总体指标的绝对离差表示。设和分别表示抽样平均数和抽样成数的抽样极限误差,则有:上式可变换为下列不等式:\n抽样极限误差也可以表示为抽样平均误差的若干倍,其倍数即是概率度t。用公式表示为:上述关系式表明,抽样极限误差Δ可以用t倍的抽样平均误差μ表示。在抽样平均误差为一定的条件下,概率度t的数值越大,则极限误差Δ越大,用样本指标估计总体指标的可靠程度也就越高,估计的精确程度就越低;反之,t的数值越小,则Δ越小,抽样估计的可靠程度也就越低,估计的精确程度就越高。\n6.3抽样推断的方法6.3.1抽样估计6.3.2样本容量的确定\n6.3.1抽样估计1.点估计。点估计(pointestimation)的基本特点是,根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值作为相应总体参数的估计值(例如以样本平均数的实际值作为相应总体平均数的估计值,以样本成数的实际值作为相应总体成数的估计值等)。点估计方法的优点是简便、易行,原理直观,常为实际工作者所采用。但也有不足之处,即这种估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度有多大。\n2.区间估计区间估计(intervalestimation)是在一定的概率把握程度下,根据样本指标和抽样极限误差去估计总体指标所在可能范围的方法。这个范围通常用一个最低限和一个最高限构成的区间来表示,并以一定的概率把握程度保证总体指标的估计值在这两个数值构成的区间之内。在总体指标的区间估计公式中,有两个要素,一个是置信区间,另一个是置信概率。总体平均数的估计.总体平均数的估计就是用抽样平均数来估计总体平均数。总体成数的估计。总体成数的估计就是用抽样成数来估计总体成数。\n6.3.2样本容量的确定决定样本容量的各种主要因素:(1)总体各单位标志变异程度。总体标志变异程度大,要求样本容量大些;反之,总体标志变异程度小,样本容量可以小些。(2)抽样方法。在其他条件相同的情况下,重复抽样要比不重复抽样多抽取一些样本单位。(3)抽样组织形式。一般来说,类型抽样和等距抽样的样本容量要小于简单随机抽样的样本容量。(4)极限误差的大小。如果允许误差大,样本容量就小;反之,如果允许误差小,样本容量就大。(5)抽样估计的可靠程度即概率F(t)的大小。如果估计的可靠程度要求越高即F(t)越大,样本容量就越多;反之,如果估计的可靠程度要求越低,即F(t)越小,样本容量就越少。\n平均数的必要样本容量的计算公式在重复抽样的条件下为:在不重复抽样的条件下为:成数的必要样本容量的计算公式在重复抽样的条件下为:在不重复抽样的条件下为:\n计算必要样本容量应注意的问题(1)根据公式计算的样本容量是最低的,也是最必要的样本容量(2)用公式计算样本容量时,一般情况下,总体方差是未知的,处理方法与“抽样平均误差计算公式”相同。(3)如果进行一次抽样调查,同时对总体平均数和成数进行估计,此时就会计算出两个样本容量,并且二者通常情况下又是不相等的。为了同时满足两个估计的要求,应该在两个样本容量中选择较大的一个进行抽样。(4)上述公式计算的样本容量不一定是整数。如果带有小数,则不允许采取四舍五入的办法化为整数。而是用比这个小数稍大的邻近整数代替。\n6.4抽样的组织形式6.4.1简单随机抽样6.4.2分层抽样6.4.3等距抽样6.4.4整群抽样6.5.5多阶段抽样\n习题与实践训练1.大华咨询公司接受调查一种新型洗衣机的销售前景。它拟通过抽样调查,了解居民在收听(看)有关广告节目后对新型洗衣机感兴趣的户数比例。据从前推销其他商品的经验,这个比例不会超过20%,若确定置信区间宽度为4个百分点,取置信水平为95%,样本容量该是多少?\n2.从一批出口产品中按不重复随机抽样方法抽选200件,检测出废品8件,又知道抽样数是该批产品总数的二十分之一,当概率为0.9545时,可否认为这批产品的废品率不超过5%?3.为了解某城市分体式空调的零售价格,随机抽取若干个商场中的40台空调,平均价格为3800元,样本标准差为400元。根据上述资料:(1)计算抽样平均误差。(2)以99.73%的可靠性估计该城市分体式空调的价格区间。\n第7章时间数列\n学习目标●了解时间数列的概念,区分时间数列的种类●掌握时间数列各种分析指标的计算方法●掌握长期趋势的测定方法●理解季节比率含义应用季节比率法测定相应的季节变动\n7.1时间数列概念作用和种类所谓时间数列(time-series),就是将某一统计指标的数值按时间的先后顺序排列起来所形成的数列,又称为动态数列。时间数列的作用(1)通过时间数列的编制和分析,可以从现象的量变过程中反映其发展变化的方向、速度和趋势,研究其变化的规律性;(2)可以为某些社会经济现象进行预测提供依据;(3)可以将不同地区或国家进行对比分析。时间数列按其统计指标表现的形式不同可分为三种。即总量指标时间数列、相对指标时间数列和平均指标时间数列。\n7.2时间数列的水平指标7.2.1发展水平与平均发展水平7.2.2增长量与平均增长量\n7.2.1发展水平与平均发展水平1.发展水平发展水平(Time-seriesdata)是时间数列中具体时间条件下的指标数值,具体反映某种社会经济现象在各个时期所达到的规模和发展的速度,它也叫时间数列水平。它是计算其它动态分析指标的基础,一般用表示。发展水平可以表现为总量指标,也可以表现为相对指标或平均指标。发展水平按在时间数列中的位置不同划分,有最初水平、最末水平和中间水平。在一个时间数列中,数列的第一项指标,叫最初水平;最后一项指标称为最末水平;其余就是中间发展水平。发展水平按在时间数列分析中的作用不同划分,有报告期水平与基期水平。在实际工作中,发展水平常用文字“增加到”、“增加为”、“降低到”、“降低为”表示。\n2.平均发展水平平均发展水平又称为序时平均数或动态平均数,它是将整个时间数列作为一个整体,反映这个整体的一般水平,即将动态数列不同时间上的发展水平加以平均而得到的平均数。(1)序时平均数与一般平均数的区别与联系序时平均数与前面所讲的一般平均数有共同之处,即都是将现象总体的个体数量差异抽象化,反映社会经济现象的一般水平。但二者却有区别。主要表现在:①序时平均数平均的是事物在不同时间上的数量差异;算术平均数平均的是总体各单位某一数量标志在同一时间上的数量差异。②序时平均数是从动态上说明某一事物在不同时间上发展的一般水平;算术平均数是从静态上说明同一事物总体不同单位在同一时间上的一般水平。③序时平均数是根据时间数列计算的;算术平均数是根据变量数列计算的。\n(2)序时平均数的作用①利用序时平均数可以反映社会经济现象在一段时间内发展变化的一般水平,并对其做出概括的说明。②利用序时平均数可以消除社会经济现象在短期内波动的影响,便于在更广泛的范围内进行对比,用来观察现象的发展趋势。③利用序时平均数还可以对某一段时间内某一事物发展达到的一般水平进行不同单位、不同地区之间的比较。\n(3)平均发展水平的计算方法①根据总量指标时间数列计算平均发展水平总量指标时间数列分为时期数列与时点数列两种。a.根据时期数列计算平均发展水平。b.根据时点数列计算平均发展水平。ⅰ.根据连续时点数列计算平均发展水平。ⅱ.根据间断时点数列计算平均发展水平。②根据相对指标时间数列计算平均发展水平\n7.2.2增长量与平均增长量1.增长量增长量又称增减量,是时间数列中报告期水平与基期水平之差,它说明社会经济现象在一定时期内增减变化的绝对量。其计算公式为:增长量=报告期水平-基期水平计算结果为正值,表示增加量;计算结果为负值,表示减少量。增长量可分为逐期增长量和累计增长量两种。逐期增长量与累计增长量之间又有一定的数量关系,即累计增长量等于相应各个逐期增长量之和。年距增长量=本期发展水平-上年同期发展水平\n2.平均增长量平均增长量,是指逐期增长量的简单算术平均数,它说明经济现象在一段较长时间内,平均每期增减变化的数量,其计算公式为:\n7.3时间数列的速度指标7.3.1发展速度与增长速度7.3.2平均发展速度与平均增长速度\n7.3.1发展速度与增长速度1.发展速度发展速度(rateofexpansion)是反映客观现象发展变化快慢程度的相对指标,它是根据报告期水平与基期水平之比求得的,表明报告期水平已发展到基期水平的若干倍或百分之几。其计算公式为:发展速度指标可分为定基发展速度和环比发展速度两种。定基发展速度等于相应时期内各个环比发展速度的连乘积\n2.增长速度增长速度(rateofgrowth)又称增减速度,是反映客观现象增长快慢程度的相对指标,它是增长量与基期发展水平之比,用以说明报告期水平比基期水平增长了若干倍或百分之几。其计算公式为:增长速度可分为定基增长速度和环比增长速度。值得注意的是,定基增长速度和环比增长速度之间没有量的乘除关系,因而不能直接进行换算。与发展速度一样,增长速度也可以计算年距增长速度,还可以计算报告期水平与历史最好水平的差异程度。\n7.3.2平均发展速度与平均增长速度平均发展速度的计算方法(1)水平法水平法又称几何平均法。平均发展速度是总速度的平均,各环比发展速度的连乘积等于总速度,因此,计算现象平均发展速度不能用算术平均法,而要用几何平均法计算。其计算公式为:用水平法计算平均发展速度具有两个特点:1是这种方法侧重于考察最末一期的发展水平。2是这种方法不能准确反映中间水平的起伏状况。(2)累积法累积法又称方程法。这种方法的特点是:从最初水平开始.每期以平均发展速度发展,从理论上计算的各期水平之和应等于实际各期水平之和。\n平均增长速度的计算方法平均增长速度等于平均发展速度减去100%,在实际工作中,平均增长速度不能根据各期的增长速度或总增长速度来计算,而是通过先计算平均发展速度,再依据两者之间关系进行换算。\n7.4时间数列趋势分析预测时间数列的构成因素按性质和作用分为四类,即长期趋势、季节变动、循环变动和不规则变动。\n7.4.1长期趋势分析预测研究现象发展的长期趋势,就须对原来的时间数列进行统计处理,一般称之为时间数列修匀,即进行长期趋势测定。测定长期趋势常用的主要方法有间隔扩大法、移动平均法、最小平方法。间隔扩大法(时距扩大法)是测定直线趋势的一种简单的方法。当原始时间数列中各指标数值上下波动,使现象变化规律表现不明显时,可通过扩大数列的时间间隔,对原资料加以整理,以反映现象发展的趋势。移动平均法(movingaverage)是对原有时间数列进行修匀,来测定其长期趋势的一种较为简单的方法。这个方法就是采用逐项递推移动的方法,分别计算一系列移动的序时平均数,形成一个新的派生的序时平均数动态数列,来代替原有的时间数列。最小平方法(Leastsquaremethod)研究现象的发展趋势,就是用一定的数学模型,对原有的时间数列配合一条适当的趋势线来进行修匀。\n7.4.2季节变动分析预测1.按月(季)平均法按月平均法亦称按季平均法。若是月资料就是按月平均;若是季资料则是按季平均。其计算的一般步骤如下:1.列表。将各年同月(季)的数值列在同一栏内;2.将各年同月(季)数值加总,并求出月(季)平均数;3.将所有月(季)数值加总,求出总的月(季)平均数;4.求季节比率(或季节指数),其计算公式为:2.移动平均趋势剔除法移动平均趋势剔除法就是按移动平均法来剔除长期趋势的影响,再计算季节变动的方法。\n习题与实践训练1.已知2004年我国国内生产总值(GDP)为136515亿元,若以平均每年增长7%速度发展,试计算到2010年将达到什么水平?2.某地区2004年第三产业增加值为100亿元,如果以后每年增长8%,试问多少年后才能达到200亿元?\n3.请从时间长短、起伏规律和形成原因等三个方面判断下面这些现象属于时间数列构成因素中的哪一个?⑴超市的顾客人数,周末达到高峰。⑵银行的活期储蓄额,发放工资前减少,发放工资后增多。⑶我国的进出口贸易额从长时间来看是不断增长的。⑷由于媒体对“苏丹红”的报道,造成部分副食品需求量的急剧下降。⑸耐用消费品如电视、冰箱周期性更新导致需求量变化。⑹铁路部门运送旅客的客运量,在一年中有几个时段为高峰,另外几个时段为低谷。⑺玩具的销售量每年在12月份达到最大额。\n第8章统计指数\n学习目标●理解指数的意义和分类●掌握总指数的两种形式及其编制方法●能运用指数体系进行因素分析●学会指数数列的编制,并能借以分析复杂现象总体发展变动的趋势\n8.1统计指数的概念、作用和种类统计指数简称指数,有广义与狭义之分。广义指数是指同类社会经济现象数量变动的相对数狭义指数是指不能直接加总、对比的复杂经济现象总体综合变动的相对数。指数主要有以下三点作用:1.用来反映复杂现象总体在数量上的变动方向和变动程度2.用来进行因素分析3.用来研究现象的发展变化趋势统计指数的种类个体指数和总指数数量指标指数和质量指标指数定基指数和环比指数综合指数和平均数指数动态指数和静态指数现象总体指数和影响因素指数\n8.2综合指数综合指数编制1.确定同度量因素,使复杂总体中不能直接加总的量过度到能直接加总2.为了反映复杂总体中指数化因素的变动,就需要将相应的同度量因素固定在某一个水平上\n数量指标综合指数的一般公式为质量指标综合指数的一般公式为一般认为:编制质量指标指数,应以报告期的数量指标作为同度量因素;编制质量指标的计划完成指数,应以计划数量指标作为同度量因素。\n8.3平均指数平均指数也称平均数指数,它是从个体指数出发,先计算质量指标和数量指标的个体指数,然后采用加权平均的方法编制总指数。平均数指数与综合指数既有区别,又有联系。两者的联系在于,在一定的权数下,平均数指数是综合指数的一种变形。但是,作为一种独立的指数形式,平均数指数在实际中不仅作为综合指数的变形使用,而且它本身也具有独特的广泛应用价值。平均指数的计算形式基本上分两种:一种是加权算术平均指数;另一种是加权调和平均指数。\n加权算术平均指数是对个体指数按加权算术平均法加以计算,即以个体指数为变量值,以—定时期的总值资料为权数,加权算术平均以计算总指数的方法。加权调和平均指数\n8.4指数体系及因素分析8.4.1 指数体系的概念作用1.指数体系的含义经济上有联系,在数量上保持一定关系的若干指数形成的整体,称作指数体系。2.指数体系的主要作用表现在两个方面:(1)进行因素分析(2)进行指数间的推算\n进行因素分析一般有四个步骤:第一步,分析被研究对象及其影响因素。这里的被研究对象是具体的统计指标,例如商品销售额、流通费用额,原材料费用总额等。当明确了被研究现象是某个统计指标时,就要分析这个统计指标含有哪些影响因素,这是因素分析的基础。第二步,建立指数体系。相对数关系式表现为现象总体指数等于各影响因素指数的乘积;绝对数关系式表现为现象总体指数分子与分母的差额等于各影响因素分子与分母差额之和。第三步,搜集资料,计算指数体系两个关系式中各项数值。按公式内容和要求,搜集有关资料,并进行整理、计算。第四步,根据计算结果,作出分析结论和简要的文字说明。8.4.2因素分析应用举例\n平均指标变动的因素分析平均指标指数分析需要编制三种平均指标指数,它们是可变构成指数,固定构成指数和结构变动影响指数。并形成如下的指数体系:可变构成指数=固定构成指数×结构变动影响指数\n习题与实践训练1、某企业某种产品生产总成本2004年为12.9万元,比2003年多9000元,单位产品成本比2003年降低3%,试确定:(1)生产总成本指数;(2)产品产量指数;(3)由于单位成本降低而节约的绝对额。2、某地区2004年社会商品零售额为2570亿元,比2003年增长9.4%,剔除零售物价上升的因素,社会商品零售额实际增长7.3%、试计算:(1)2004年与2003年比较,零售物价上升多少?(2)计算分析2004年比2003年社会商品零售额增长的数量和原因。\n3、某商店商品的价格和销售量资料如下所示:商品名称计量单位价格(元)销售量基期报告期基期报告期甲乙双件48304532300400400500要求:⑴计算某商店几种商品的价格总指数和销售量总指数;⑵指出在总销售额增长绝对值中,有多少绝对数是受价格因素影响的,有多少绝对数是受销售量因素影响的?\n第9章相关分析与回归分析\n学习目标●理解相关关系的概念与种类●掌握相关系数的理论及计算●理解相关分析与回归分析特点●掌握一元线性回归方程的确定方法及估计标准误差的计算●理解回归系数及估计标准误差的意义\n9.1相关分析9.1.1相关关系的概念9.1.2相关关系的种类9.1.3相关图表9.1.4相关系数\n9.1.1相关关系的概念相关关系(correlation)是指现象间的非确定性的数量上的依存关系。它有两个特点:⑴现象之间确实存在数量上的依存关系;⑵数量依存关系的值是不确定的。函数关系是指现象间存在的确定性的数量依存关系。函数关系与相关关系既有区别又有联系。相关关系是相关分析(correlationanalysis)的研究对象,函数关系是相关分析的工具。\n9.1.2相关关系的种类1.按相关的程度不同,可分为完全相关、不相关和不完全相关2.按相关的方向不同,可分为正相关和负相关3.按相关的表现形式不同,可分为线性相关和非线性相关4.按相关的变量多少不同,可分为单相关和复相关\n9.1.3相关图表1.相关表相关表(correlationtable)是一种反映变量之间相关关系的统计表。将其中一个变量按其取值大小顺序排列,将与其相关的另一变量数值对应列出来,便可形成简单相关表。2.相关图相关图(correlationdiagram)又称散点图(scatterplot),它是把相关表中的原始对应数据在平面直角坐标系中用坐标点描绘出来。以横轴表示自变量(dependentvariable),纵轴表示因变量(independentvariable),通过标出的每对变量值的坐标点或散布点,观察其分布状况。\n9.1.4相关系数1.相关系数的意义相关系数(correlationcoefficient)是在直线相关条件下,说明两个变量之间相关关系密切程度和方向的统计分析指标,通常用r表示。其表现形式为相对数,不受变量值水平和计量单位的影响。相关系数的取值有一个范围,即-1≤r≤+1;有二个方向,即r>0表示正相关,r<0表示负相关;有三个特殊点,即r=+1表示完全正线性相关,r=-1表示完全负线性相关,r=0表示完全不线性相关;有四个相关密切程度等级,即0<|r|<0.3为微相关,0.3≤|r|<0.5为低度相关,0.5≤|r|<0.8为显著相关,0.8≤|r|<1为高度相关。\n2.相关系数的计算在直线相关的条件下,相关系数的定义公式是通过自变量和因变量的各个离差的乘积来表明相关关系的密切程度的,所以用这种方法计算的相关系数叫积差法。相关系数的基本公式如下:计算公式为\n9.2回归分析回归分析(regressionanalysis)是指研究一个或几个变量的变动对另一个变量的变动影响程度的方法。回归分析与相关分析相比具有以下特点:⑴在相关分析中两变量是随机变量;而回归分析中,因变量是随机变量,自变量不是随机的,而是给定的数值。⑵相关分析只能计算出一个反映两个变量间相关密切程度的相关系数,且两个变量是对等关系,变量x和y位置互换不影响相关系数的数值;而回归分析所研究的两个变量不是对等关系,有时可根据研究目的不同建立两个不同的回归方程,一个是以x为自变量,y为因变量的“y对x的回归方程”;另一个以y为自变量,x为因变量的“x对y的回归方程”。⑶相关分析计算的相关系数是一个绝对值在0与1之间的抽象系数,其数值大小反映变量之间相关关系的程度;而回归分析建立的回归方程反映的是变量值之间的具体变动关系,不是抽象的系数。根据回归方程,利用自变量的给定值,可以估计或推算因变量的数值。\n9.2.3一元线性回归方程一元线性回归方程(regressionequation),亦称直线方程,是分析一个自变量x与一个因变量y之间线性关系的数学方程方程的基本形式是:yc=a+bx其中\n9.2.4估计标准误差估计标准误差(standarderroroftheestimate)是指因变量实际值与理论值离差的平均值,其计算原理与能够反映平均数代表性大小的标准差基本相同,定义公式为:经过化简,可得如下的简捷计算公式s=\n9.2.5判定系数在回归分析中,除了可用估计标准误差反映回归方程估计的准确程度及回归直线代表性的大小外,还有一个广泛应用的指标叫做判定系数(coefficientofdetermination),它通常用表示,用来测定回归方程拟合数据的好坏程度。判定系数就是相关系数r的平方。当然,判定系数有它的基本公式:判定系数的范围在0与1之间。如果为1,则表明两个变量之间有非常好的相关性,y的估计值与实际值之间没有差别,此时,估计标准误差为0;如果为0,则回归方程不能用来预测y值。此时,估计标准误差最大。\n9.3应用相关分析和回归分析应注意的问题9.3.1在定性分析的基础上进行定量分析9.3.2要注意现象质的界限及相关关系作用的范围9.3.3要将各种分析指标结合应用9.3.4要尽可能使用大样本材料\n习题与实践训练1.在某些国家和地区,在饭店就餐有给服务员小费的习惯。几乎所有人都相信,在账单的数额和小费之间存在着联系:较大的账单就会有较多的小费。现搜集到6次午餐会的成对数据如下:账单(美元)33.4650.6887.9298.8463.60107.34小费(美元)5.505.008.0817.0012.0016.00⑴是否有足够的证据判断:在账单数额和小费数额之间存在某种联系?(它们相关的程度如何?)⑵若存在某种联系,则使用这种联系来确定当账单数额为100美元时,应该留下多少小费?⑶现已知给出小费10元,请推测其消费的账单数额为多少?\n2.航空公司经过统计调查得知,波音737飞机500英里飞行成本与乘客数量之间存在相关关系,调查数据资料如下:乘客数(人)616367697074768186919597成本(千美元)4.284.084.424.174.484.304.824.705.115.135.645.56⑴建立飞行成本y依乘客数量x的直线回归方程。⑵飞行每增加一名乘客,飞行成本将增加或减少多少美元?⑶在此案例中,即使飞行时不搭载乘客,飞行500英里的飞行成本为多少美元?\n第10章Excel在统计中的应用\n学习目标●掌握用Excel进行数据收集与整理、绘制统计图表的方法●利用Excel函数描述数据集中趋势和离散程度●理解Excel在抽样推断、时间数列分析与预测、指数分析及相关与回归分析中的应用\n10.1Excel在统计数据搜集与整理中的应用10.1.1数据收集第一步:单击“工具”菜单,选择“数据分析”选项。第二步:打开“数据分析”对话框,从其对话框的“分析工具”列表中选择“抽样”。第三步:单击确定,打开“抽样”对话框,确定输入区域、抽样方法和输出区域。第四步:单击确定后,在指定位置给出抽样结果。\n10.1.2数据整理利用频数分布函数进行统计分组和计算频数,具体操作步骤如下:第一步:在选定单元格区域,单击“插入”菜单,选择“函数”选项,弹出“粘贴函数”对话框,在对话框的左侧“函数分类”中选择“统计”,在右侧的“函数名”中选择FREQUENCY。第二步:打开“FREQUENCY”对话框,输入待分组数据与分组标志。第三步:按“Ctrl+Shift+Enter”组合键,在最初选定单元格区域内得到频数分布结果直方图分析工具的统计整理功能操作过程如下:首先,先将样本数据排成一列,最好对数据进行排序第一步:单击“工具”菜单,选择“数据分析”选项,弹出“直方图”对话框第二步:打开“直方图”对话框,确定输入区域、接受区域和输入区域第三步:按“确定”,在输出区域单元格得到频数分布第四步:将条形图转换成标准直方图\n10.1.3统计图的绘制Excel提供的图形工具有:柱形图、折线图、饼图、散点图、面积图、环形图、股价图等。利用Excel制作统计图以柱形图为例的工作步骤如下第一步:创建工作表,即将统计资料输入到Excel中第二步:在想绘制图形的数据中选择任一单元格,然后在“插入”菜单中选择“图表”选项,或单击工具栏中的图表向导按钮,第三步:选定图表类型。在弹出的“图表向导-4步骤之1一图表类型”对话框中选择所需要的图表的类型,然后单击“下一步”按钮第四步:确定数据范围。在弹出的“图表向导-4步骤之2-图表数据源”对话框中规定数据区域和每一数据系列的名字和数值的区域,然后单击“下一步”按钮。第五步:选用图表选项。在弹出的“图表向导-4步骤之3-图表选项”对话框中可给图表命名、为每一个坐标轴的赋予名称等。然后单击“下一步”按钮第六步:选择图表位置并显示结果。\n10.2Excel在统计分析中的应用(一)10.2.1集中趋势描述对集中趋势的描述一般使用的特征值为:算术平均数、调和平均数、几何平均数、众数和中位数五种。在Excel中,对未分组资料计算集中趋势的值可利用Excel提供的相应函数计算;分组资料,则要借助于统计公式计算获得10.2.2离散程度描述描述离散程度的特征值有:全距、平均差、标准差、方差和离散系数。在Excel中,计算离散程度的各种特征值与计算集中趋势特征值类似,对未分组资料计算集中趋势的值可利用Excel提供的相应函数计算;分组资料,则要借助于统计公式计算获得\n10.2.2描述统计工具应用本节前两个小节是利用函数与公式来计算相应的特征值以描述数据的集中趋势与离散程度。对于统计数据的一些常用的统计量,如平均数、标准差等,Excel提供了一种更加简便的方法——描述统计工具。用Excel描述统计工具可以同时给出平均数、标准误差、中位数(中值)、众数(模式)、样本标准差(标准偏差)、方差、峰度、极差(区域)、最小值、最大值、总和、观测数和置信度等十几个常用的统计量描述数据分布规律。第一步:单击“工具”菜单,选择“数据分析”选项。打开“数据分析”对话框,从其对话框的“分析工具”列表中选择“描述统计”,单击确定,打开“描述统计”对话框。第二步:确定输入区域和输出选项1.确定输入区域2.确定输出选项3.单击确定后,在指定位置给出描述统计结果。\n10.3Excel在统计分析中的应用(二)10.3.1抽样推断10.3.2时间数列分析10.3.3统计指数10.3.4相关与回归分析\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n