- 962.56 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计学DepartmentofMathandStatistics统计学2010年8月授课教师:张彩霞E-mail:zhangcx62@yahoo.com.cn2010年8月\n目录第一章总论第二章统计调查与统计数据的整理第三章综合指标分析第四章时间数列分析第五章统计指数分析第六章抽样推断第七章相关与回归分析第八章统计综合评价第九章国民经济核算简介第十章统计分析报告写作2010年8月\n图并没有说谎,是说谎者在画图。——BenjaminDisraeli本杰明迪斯雷利统计名言2010年8月\n第二章统计调查与统计数据的整理第一节统计调查第二节统计数据的整理第三节统计数据的显示第四节统计数据质量管理2010年8月\n本章学习目的和要求本章的目的在于介绍各种调查方法及组织形式的特点、应用条件、统计分组的方法、统计资料的表现形式等。通过本章内容的学习,要求学生理解统计调查的概念和意义,深入领会各种调查方式方法的特点及适用应场合,学会根据实际选择适当的调查方式。掌握调查方案的设计、统计分组的方法,学会汇总技术和统计图表的编制,并能熟练运用。2010年8月\n重点与难点重点:统计调查方案内容的设计;各种调查方法的概念、特点及其适用场合;统计分组的方法、统计资料的表现形式等难点:根据研究目的和任务选择适当的调查方法,及多种调查方法的巧妙结合运用;统计分组和设计科学适用的统计表。2010年8月\n第一节统计调查一、统计调查的意义和种类二、统计调查方案及调查表的设计三、统计调查的组织形式四、统计调查误差2010年8月\n男学生更容易逃课吗?读完四年大学,一次课也没有逃过,这样的学生恐怕不多。2004年5月,中国人民大学财政金融学院的3名学生就逃课问题做了一次调查。调查的对象是财政金融学院的大一,大二,大三本科生。样本的抽取方式是分层抽样与简单随机抽样结合,先根据年级划分层次,然后对各个班级简单随机抽样,共抽取151名学生组成一个样本,并对每个学生采用问卷调查。问卷内容包括每周逃课次数、所逃课程的类型(选修课、专业课等)和逃课原因等。调查得到的男女学生每周平均逃课次数的汇总表如下2010年8月\n男学生更容易逃课吗?逃课情况男女合计几乎一次不逃2849771到3次2431553到5次64105次以上336其他123合计6289151你认为男学生更容易逃课吗?用哪些简单的统计描述支持你的看法?如果要用图形表现上面的数据,反映男女学生逃课方面的差异、逃课次数的构成以及男女学生在逃课方面是否具有相似性等,有哪些图形可供你选择使用呢?2010年8月\n一、统计调查的意义和种类(一)统计调查的概念和意义(二)统计调查的基本要求(三)统计调查的种类2010年8月\n(一)统计调查的概念和意义1、统计调查的概念统计调查(survey)是按照统计研究的任务和目的要求,运用科学的调查方法,有组织、有计划地向社会实际搜集统计资料的工作过程。2、统计调查的意义①统计调查是统计工作中的基础环节。②统计调查是人们认识社会的基本方式。2010年8月\n(二)统计调查的基本要求基本要求:准确性、及时性和完整性。准确性,是统计资料符合实际情况,数据真实可靠。及时性,是统计资料能够及时满足社会各方面对数据的需要和及时完成各项调查资料的上报任务。完整性,是统计资料必须包括应该调查的全部单位的资料。2010年8月\n(三)统计调查的种类1、统计调查按调查对象包括的范围不同分为,全面调查和非全面调查。2、统计调查按登记事物的连续性不同分为,经常性调查和一次性调查。3、统计调查按组织形式不同分为,统计报表和专门调查。4、统计调查按搜集资料的方法分为,直接观察法、采访法、报告法、卫星遥感法等。2010年8月\n1、全面调查和非全面调查按调查对象包括的范围不同,统计调查分为全面调查和非全面调查。全面调查是对调查对象中的所有单位逐一进行的调查。普查和全面统计报表都属于全面调查。非全面调查是对调查对象中的一部分单位进行的调查。重点调查、抽样调查、典型调查等均属于非全面调查。2010年8月\n2、分为经常性调查和一次性调查按登记事物的连续性不同,统计调查分为经常性调查和一次性调查。经常性调查是根据调查总体情况的变化和发展,连续不断地进行登记的一种调查的方法,其主要目的是为了搜集现象在一定时期上的数据资料。一次性调查是为了配合经济和社会发展的需要,每隔一段时间对现象所进行的一次性登记,其主要目的是为了搜集现象在一定时点上的数据资料。2010年8月\n3、统计报表和专门调查按调查的组织形式不同,统计调查分为统计报表和专门调查。统计报表是按照一定的表式和要求,自上而下统一布置,自下而上提供统计资料的一种统计数据采集的方式。例如,我国定期统计报表制度。专门调查是为了研究某些专门问题而专门组织的调查。例如,普查、抽样调查、重点调查、典型调查等。2010年8月\n4.直接观察法、采访法、报告法、卫星遥感法直接观察法是调查人员亲自到现场对调查对象进行观察和计量以取得数据资料的一种调查方法。采访法是调查人员面对面地向被调查者进行采访,根据被调查者的答复以取得资料的一种调查方法。报告法是以各种原始资料为基础,由调查单位按照有关规定和所属关系,逐级向上提供统计资料的方法。卫星遥感法是利用卫星的高度分辨辐射来提供地面资料。如通过地面农作物的颜色,来估计农产量等。2010年8月\n普查全面报表抽样调查重点调查典型调查周期性调查一次性调查普查抽样调查重点调查典型调查全面调查非全面调查连续(经常性)调查不连续调查定期报表专门调查调查范围调查时间组织形式统计调查形式统计调查的种类2010年8月\n二、统计调查方案及调查表的设计(一)确定调查任务和目的(二)确定调查对象、调查单位和填报单位(三)确定调查项目、调查表和调查问卷(四)确定调查时间、登记时间和调查期限(五)确定调查方法(六)确定调查的组织实施计划2010年8月\n在统计调查之前为什么要设计调查方案?统计调查是一项复杂的工作,特别是大型调查,涉及面广、涉及人员多,要使调查圆满完成,无论采用何种调查方式,在组织调查之前,首先应设计一个周密的调查方案。一个完整的统计调查方案应包括以下六方面基本内容。2010年8月\n(一)调查任务和目的确定调查任务和目的是制定统计调查方案的首要问题。它决定着调查对象、调查单位、填报单位和调查项目等问题。2010年8月\n(二)调查对象、调查单位和填报单位调查对象是根据调查目的确定的调查研究的总体或调查范围调查单位是调查对象中的具体单位填报单位则是负责上报调查资料的单位调查目的决定调查对象、调查单位和填报单位。调查单位和填报单位有时一致,有时不一致。2010年8月\n(三)调查项目、调查表和调查问卷1、调查项目:是调查的具体内容,它是由调查单位来承担的。2、调查表:将调查项目科学地排列在一张表格上就构成了调查表。调查表通常由表头、表体和表脚三部分组成。调查表有单一表和一览表两种形式单一表是指在一份调查表中只登记一个调查单位的内容,如教材表2-1。在调查项目较多时宜使用单一表。一览表是指在一份调查表中登记多个调查单位的内容,如教材表2-2。2010年8月\n3、调查问卷:就是有问有答的调查表。调查项目也可用调查问卷的形式表现。问卷是用来搜集调查数据的一种工具,是调查者根据调查目的和要求所设计的,由一系列问题、备选答案、说明及代码表等组成的书面文件。2010年8月\n例2.1问卷案例父母对子女教育方式调查问卷我们是某中学的教学研究人员,为了解父母对子女的教育方式,以便对学生更好地施教,我们向您询问一些情况,希望您能如实回答,答案没有是非好坏的分别,只要如实回答就行。我们的调查不记名,请您考虑后在您持有的看法档次中划“∨”,希望能得到您的真诚合作,谢谢!1、你父母有无酗酒、赌博、无故晚归等不良嗜好和习惯?①有②不知道③没有2、你父母是否当着你的面吵架?① 是②说不清③不是3、你向父母提出要求时,它们的回答是否一致?①不一致②说不清③一致4、你犯错误时,你父母是否对你进行批评教育?①不管不问②说不清③批评教育5、你父母是否关心你的学习?①不是②说不清③是6、你父母是否关心你的为人处世和交朋友的事情?①不过问②说不清③关心指导7、星期日或假日你是否愿意与父母一起度过?①不愿意②无所谓③愿意2010年8月\n(1)问卷的基本要素问卷的基本要素由四个部分组成:①前言。前言是给应答者的简短信函,一般写在问卷的首页或封面上。②问题和备选答案。问题,是向应答者提出要求回答的事实、态度、行为和愿望等;备选答案,它反映了研究对象的不同状况和水平。③编码。编码就是用自然数给各种答案编上号码。④资料登录地址。登录地址是指明每一项资料在汇总时,登录在什么地方,实际上起着资料索引的作用。2010年8月\n(2)设计问卷时应注意的问题①对每个问题和答案的设计,应充分考虑到问题的统计方法。②提问的问题要准确、清楚。要使用一般的语句,尽量避免使用专业术语。可使用6w(who,where,when,why,what,how)准则检验。③问题要适用于调查对象的最低文化程度。④问题应当短小,便于做明确的答复。⑤问题的排列要具有逻辑性。⑥对敏感性问题设计问卷时应遵循保密的原则。2010年8月\n(3)问卷设计的程序①确定调研目的、来源、局限②确定数据收集方法③确定问题的回答形式(开放式、封闭式、量表应答式等)④决定问题的措辞,用词清楚,避免诱导性用语,考虑应答者回答问题的能力、意愿⑤确定问卷的流程编排⑥评价问卷和编排(评价方法:问题是否必要;问卷是否太长;问卷是否回答了调研目标所应获的信息;邮寄及自填问卷的外观设计是否完美;开放式问题是否留足空间;问卷说明是否用了明显字体)⑦获得相关方面的认可⑧预先测试、修订⑨准备最后的问卷⑩实施2010年8月\n(四)调查时间和调查期限调查时间是指调查资料所属的时间。资料所属时间应明确规定所调查的是哪个时期或时点上的资料。调查期限是指调查工作从开始到结束的时间长度。如全国第二次基本单位普查的标准时间是2001年12月31日,普查年度为2001年日历年。调查期限是2001年9月至2002年6月底。又如,第五次人口普查的调查时间(标准时间)是2000年11月1日零点,登记时间是2000年11月1日至11月10日,调查期限是1998年8月至2000年12月底。2010年8月\n我国第六次全国人口普查从2010年开始至2012年完成,普查的标准时点为2010年11月1日零时,此次普查登记的对象是中华人民共和国境内居住的自然人。包括我国公民和在我国境内的境外人员,不包括定居在境外的我国公民和在我国境内短期停留的境外人员。普查采用现住地登记的原则,每个人在现住地进行登记,普查对象不在户口登记地居住的,户口登记地要登记相应信息。普查的主要内容是人口和住户基本情况,包括姓名、性别、年龄、民族、户口登记状况、受教育程度、行业、职业、迁移流动、社会保障、婚姻、生育、死亡、住房情况等。普查工作分三个阶段进行,一是准备阶段(2009年5月至2010年10月31日),二是登记和复查阶段(2010年11月1日至11月30日),三是数据整理和发布阶段(2010年12月1日至2012年)。2010年8月\n(五)调查方法确定调查方法是指选择什么样的调查组织方式和数据收集方式。关于此问题,我们将在本节“统计调查的组织方式”内容中详细讲解。2010年8月\n(六)调查的组织实施计划调查工作的组织实施计划是指对调查所涉及的人、财、物的统筹安排。包括调查机构、人员的安排及组织培训、调查经费的预算开支、资料的印刷及汇总的物质准备等问题。2010年8月\n三、统计调查的组织形式统计调查按组织形式分为统计报表和专门调查,专门调查又分为普查、抽样调查、重点调查和典型调查。我国的调查方法体系以普查、抽样调查和统计报表为主。(一)统计报表(二)普查(三)抽样调查(四)重点调查(五)典型调查2010年8月\n(一)统计报表1、统计报表的概念和特点统计报表(statisticalreportforms)是我国搜集统计资料的一种重要的组织形式。它是按照国家或上级部门统一规定的表式、统一的指标、统一的报送程序和报送时间,自下而上逐级提供基本统计资料的一种调查方式。统计报表的主要特点:第一,资料的来源是各个基层单位的原始记录。第二,逐级上报和汇总。第三,属于经常性(连续性)调查,调查项目相对稳定。2010年8月\n2、统计报表的种类①按报表内容和实施范围不同,分为国家统计报表、部门统计报表和地方统计报表。②按调查范围的不同分为全面统计报表和非全面统计报表。③按报送周期长短的不同,可分为日报、旬报、月报、季报、半年报和年报等。④按填报单位的不同分为基层报表和综合报表。⑤按报送方式的不同,可分为电讯报表和书面报表等多种形式。2010年8月\n3、统计报表制度统计报表制度是由政府主管部门根据统计法规,采用行政手段以统计表格形式自上而下布置,而后由企事业单位自下而上层层汇总上报的一种以全面调查为主的调查方式。2010年8月\n4、原始记录与统计台帐建立和健全统计的原始记录和统计台帐,是保证统计报表质量的基础。①原始记录。原始记录是基层单位通过一定表式,对生产经营活动过程和成果所做的第一手数字或文字记载,是未经过加工整理的初级资料。②统计台帐。就是将分散的原始记录资料按时间顺序进行系统登记,以积累统计资料的表册。2010年8月\n(二)普查1、普查的意义普查(census)是为了某一特定目的而专门组织的一次性的全面调查。它适宜搜集那些不能或不适宜用定期的全面统计报表来搜集的统计资料,以搞清重要的国情国力。它一般用来调查处于某一时点状态上的社会经济现象的数量。其目的是掌握特定社会经济现象的基本全貌,为国家制定有关政策或措施提供依据。2010年8月\n2、普查的特点(1)普查通常是一次性的或周期性的。(2)普查有统一规定的标准时点。(3)普查的规范化程度较高,有统一规定的项目和指标。第一,它是一次性(非连续性)的调查。第二,它是一种全面调查,可获得大量详细、全面的资料。2010年8月\n3、普查的方式普查基本上有两种方式:一种是成立专门的普查机构,派出普查人员,对调查单位进行调查。另一种是利用企、事业单位的原始资料或报表资料进行填报,或根据这些资料结合实际盘点的情况进行填报。2010年8月\n第一次人口普查,1953年6月30日24时,仅调查四项内容,即性别、年龄、民族和政治面貌。第二次人口普查,1964年6月30日24时,内容增至九项。第三次人口普查,1982年7月1日0时。第四次人口普查,1990年7月1日0时,内容有十五大项。第五次人口普查,2000年11月1日0时,长表内容有26大项,短表内容有21大项。2010年8月\n1.全国总人口:129533万人,其中,大陆人口为126583万人;香港人口为678万人(6月30日);澳门人口为44万人(9月30日);台湾人口为2228万人(12月30日)。2.人口性别构成:男性人口:65355万人,比重51.63%女性人口:61228万人,比重48.37%3.城乡人口及构成:城镇人口:45594万人,比重36.09%乡村人口:90739万人,比重63.91%2000年11月1日零时我国第五次人口普查资料2010年8月\n4.人口年龄构成:0—14岁28979万人,比重22.89%15—64岁88793万人,比重70.15%65岁及以上8811万人,比重6.96%6.家庭户数为34837户,平均每户,家庭人口为3.44人……5.民族构成:汉族,15940万人,比重91.59%少数民族,10643万人,比重8.41%2010年8月\n(三)抽样调查1、抽样调查的意义(1)抽样调查(samplingsurvey)是一种非全面调查,它是按照随机原则从总体中抽选一部分单位进行调查,并根据部分单位(样本)的指标数值对总体(相应数值)做出具有一定可靠程度的估计和推断的方法。2010年8月\n①主要适用于不可能或不必要进行全面调查的场合。②抽样调查与全面调查相结合,可以补充和修正全面调查的数据。③抽样调查常用于生产过程中的产品质量控制。④抽样调查利用小概率原理,可以对某些假设进行检验,以判断假设的真伪。(2)抽样调查的作用(适应场合)2010年8月\n(1)按照随机的原则抽选单位,完全排除个人主观意图的影响。(2)抽样调查的目的是从数量上推算总体情况。(3)抽样调查必然产生抽样误差,但此误差可以事先计算并可以控制在一定的范围内。2、抽样调查的特点2010年8月\n(1)适应面广。抽样调查可以适用于各个领域、各种问题的调查。从适用的范围来看,抽样调查既可用于全面调查能够调查的现象,也能调查全面调查所不能调查的现象,特别是适合于一些特殊现象的调查。(2)准确性高。抽样调查的数据质量有时比全面调查更高,因为全面调查的工作量大、环节多,登记性误差往往很大;而抽样调查由于工作量小,可使各环节的工作做得更细,误差往往很小。3、抽样调查与其他非全面调查的比较2010年8月\n抽样方式方法2010年8月\n(四)重点调查1、重点调查的意义重点调查(keysurvey)是在调查对象范围内,选择部分重点调查单位而进行的非全面调查。重点单位是指这些单位的标志总量在总体标志总量中占有绝大比重的单位。重点调查的意义在于通过对这部分重点单位的调查,可以从数量上说明整个总体在该标志总量方面的基本情况或基本趋势。2010年8月\n(1)调查单位少。即可以用较少的人力、物力和财力来调查较多的项目,从而了解的情况就比较详细,能够取得较好的效果。(2)适用于调查对象的标志值比较集中于某些单位的场合,且重点调查的主要目的在于了解研究对象的基本情况和基本趋势,而不要求全面准确地推算总体数字资料。2、重点调查的特点2010年8月\n主要采取专门调查的组织形式,有时也可以结合定期统计报表,由被调查的重点单位填报,定期观察这些重点单位的主要技术经济指标的完成情况及其变动。3、重点调查的方式2010年8月\n(五)典型调查1、典型调查的意义典型调查(modelsurvey)就是根据研究目的,在对调查对象充分认识了解的基础上,有意识地选取若干具有典型意义或有代表性的单位进行的非全面调查。典型调查具有以下两个突出的作用:第一,研究处于萌芽状况的新生事物或某种倾向性的社会问题。第二,分析事物的不同类型,研究它们之间的差别和相互关系。2010年8月\n(1)调查单位少,能深入实际,深入群众,搜集详细的第一手数字资料。(2)典型单位是有意识地选出的,具有一定的代表性。(3)典型调查机动灵活,可节省人力和物力,提高调查的时效性。2、典型调查的特点2010年8月\n根据不同的研究目的和要求,有以下三种选择典型的方法:(1)选择中等水平的典型单位(2)“划类选典”的方法(3)“抓两头”的方法3、典型单位的选取2010年8月\n典型调查的方式有两种:第一种是“解剖麻雀”式的典型调查第二种是“划类选典”的方法4、典型调查的方式2010年8月\n(1)选取调查单位的方式不同。抽样调查按照随机原则选取样本单位;重点调查以标志值比重大的单位为重点单位;典型调查是有意识地选择典型单位。(2)调查的目的不同。抽样调查是由样本指标推断总体相应指标;重点调查只掌握总体的基本情况;典型调查可以了解和推断同类事物总体的一般情况。(3)推断总体的准确性和可靠程度不同。抽样调查可保证推断的准确性和可靠性,可计算误差;重点调查不能推断总体情况;典型调查可以推断同类事物的总体情况,却难以保证推断的准确性和可靠性,不能计算误差。抽样调查、重点调查和典型调查的区别2010年8月\n统计调查方法体系以上各种调查方法各有其特点和适应范围,在实际工作中要多种调查方法结合运用,形成统计调查方法体系。这是因为:(1)各种调查方法有其各自特点和适用场合,但彼此并不互相排斥;(2)客观现象的复杂性决定了必须用多种调查方法才能取得所需的资料;(3)各种方法的局限性也决定了只有将多种调查方法相结合才能互相弥补。注意:目前,我国的统计调查方法体系是以周期性的普查为基础,以经常性的抽样调查为主体,辅之以统计报表和少量的其它科学推算。2010年8月\n四、统计调查误差(一)统计调查误差的概念与种类(二)防止与减少调查误差的办法2010年8月\n(一)统计调查误差的概念与种类1、统计调查误差的概念:将统计调查取得的统计数字与调查总体实际数量之间的差别,称为统计调查误差。它一般有两种表现形式,即统计误差的绝对数和相对数。2、统计调查误差的种类2010年8月\n对于代表性误差而言,应从各方面来提高样本数据的代表性,尽量缩小抽样所造成的代表性误差。而对于登记性误差而言,则应从整个调查工作的全过程来进行控制:1、调查前的误差控制:首先要设计科学的调查方案;其次要搞好调查人员的培训,提高调查人员的业务素质;再次还要搞好试点工作,特别是对普查。2、调查中的误差控制:首先要搞好宣传工作。边登记边检查的措施包括自查、互查、分级检查等。3、调查后的误差控制:统计调查结束后,应在汇总前对调查资料进行准确性、及时性、完整性检查。发现问题要及时予以订正。(二)防止与减少调查误差的办法2010年8月\n第二节统计数据的整理一、统计数据整理的意义和原则二、统计数据整理的步骤三、统计分组四、统计分组体系五、频数分布数列2010年8月\n一、统计数据整理的意义和原则(一)统计数据整理的概念统计数据整理是根据统计研究的目的,对统计调查所获得的大量原始资料,进行科学分类和汇总,使之条理化、系统化,得出能够反映现象总体特征的综合资料的工作过程。(二)统计数据整理的意义统计整理工作是统计工作过程的第三个阶段,是统计工作过程的中间环节,是统计调查的继续,统计分析的前提,起着承前启后的作用。(三)统计数据整理的原则在资料整理时应遵循目的性、联系性和简明性原则。2010年8月\n二、统计数据整理的步骤(一)统计数据整理方案的设计(二)统计数据的审核审核的内容主要包括资料的准确性、及时性和完整性。审查的重点是登记性误差。常用的方法有逻辑性检查和技术性检查两种。(三)对调查数据进行编码及录入(四)统计分组和汇总(五)统计图表的编制(六)统计资料的积累与开发2010年8月\n三、统计分组(一)统计分组的概念(二)统计分组的作用(三)统计分组的方法2010年8月\n(一)统计分组的概念统计分组是根据统计研究的任务目的要求,将总体按照一定的标志划分为若干性质不同的组成部分的一种统计方法。统计分组对总体而言是“分”,即将总体区分为各个性质不同的若干组成部分;而对总体单位(个体)而言是“合”,即将性质相同的总体单位合为一组。2010年8月\n(二)统计分组的作用1、发现现象的特点与规律2、划分现象的类型3、揭示现象的内部结构4、分析现象之间的依存关系(例见教材30-32页)2010年8月\n(三)统计分组的方法1、分组标志的选择统计分组的关键问题是正确选择分组标志和划定各组间的界限。分组标志是指用来作为分组的标准和依据。在选择分组标志时应注意以下基本原则:①根据研究目的选择分组标志。②要选择能反映事物本质特征的标志作为分组标志。③要结合现象所处的具体历史条件或经济条件来选择分组标志。2010年8月\n①按品质标志分组是指选择反映事物属性差异的标志作为分组标志,并在品质标志的变动范围内划定各组间的界限的方法。②按数量标志分组是选择反映事物数量差异的标志作为分组标志,并在数量标志的变动范围内划定各组间界限的方法。按品质标志分组简单的品质标志本身就决定了组数和组的界线。复杂的必须按照国家的有关规定去分组。因此,我们在后面重点介绍按数量标志分组。2、统计分组方法2010年8月\n四、统计分组体系(一)简单分组和平行分组体系1、简单分组:将总体按一个标志分组称为简单分组。2、平行分组体系:对同一总体采用两个或两个以上的分组标志分别进行的简单分组平行排列起来,就形成了平行分组体系。平行分组体系特点是:每一次分组只能区分一个因素对差异的影响。(见教材34页表2-6)2010年8月\n表2-6某企业职工性别情况按性别、工龄、年龄分组人数(人)比重(%)性别男女618360258100.0058.2541.75工龄(年)10年以下10~2020年以上618300180138100.0048.5429.1322.33年龄(岁)30以下31~4546以上61826028078100.0042.0745.3112.622010年8月\n(二)复合分组和复合分组体系1、复合分组:将同一总体按两个或两个以上的分组标志重叠起来进行分组称为复合分组。(见教材34页表2-7、表2-8)2、复合分组体系:对同一总体按两个或两个以上的分组标志重叠起来进行分组,形成的树型结构分组体系称为复合分组体系。复合分组体系的特点是:有几次分组就能同时区分几个因素对差异的影响。2010年8月\n图2-1考生分组体系图2-1考生分组体系图2-1考生分组体系2010年8月\n表2-7某地人口性别、民族情况按性别、民族分组人数(千人)男性汉族少数民族女性汉族少数民族5505331745043614合计1000性别汉族(千人)少数民族(千人)男女5334361714合计96931表2-8某地人口性别、民族情况2010年8月\n五、分布数列(一)分布数列的意义(二)分布数列的种类(三)变量分布数列的编制(四)次数与频率的累计分布(五)次数分布的主要类型2010年8月\n(一)分布数列的意义1、次数与频率的分布次数分布(frequencydistribution)是指在统计分组的基础上,将总体的所有单位按组归类,并按顺序排列,形成总体中各单位在各组间的分布称为次数分布,又称次数分配。分布在各组的单位数称为次数,也叫频数。2、分布数列的意义次数分布是统计整理的一种重要形式,也是统计描述和统计分析的一种重要方法,它不仅可以表明总体的分布特征及其结构情况,还可以研究总体在某一标志下的平均水平和变动规律。2010年8月\n考分人数(人)frequency比率(%)percentage60以下25.060-70717.570-801127.580-901230.090-100820.0合计40100.0某班“统计学”考试成绩次数分布2010年8月\n(二)分布数列的种类2010年8月\n单项式变量数列的编制将原始资料按数值大小排序,每个变量值代表一组列出,然后将各组的总体单位数统计出来,列在相应的组。例:表2-7某班学生年龄分布某班学生按年龄分组(岁)人数(人)20212223220212合计45组距式变量数列的编制(三)变量分布数列的编制2010年8月\n①确定全距。全距R(Range)=变量最大值-变量最小值②确定组数(numberofclasses)公式为:如例2-2资料,N=50则:③确定组距(classwidth)组距=全距÷组数④确定组限(classlimit)第一,组限是否重叠设置。对于连续变量,组限必须重叠设置,否则部分变量值将无组可归,注意“上组限不在内”原则。第二,组限是否开口设置。⑤分组归类、合计形成次数分布、制成统计表。如,表2-11所示。练习《统计学学习指南》2010年1月版27页练习题32010年8月\n499及以下500~9991000~29993000及以上500~10001000~15001500~20002000~25001)组限重叠与否:相邻两组的界限。即每组界限的两个数字。其中,每组最大变量值称为上限,每组最小变量值称为下限。工人按工资分组:(连续变量)企业按人数分组:(离散变量)(重叠组限)(不重叠组限)下限上限2)组限开口与否:通常尽可能编制封口组限,为了避免空白组出现才使用开口组限。2010年8月\n(四)次数与频率的累计分布累计分布有以下两种:向上累计是指将各组次数或频率由变量值低的组向变量高的组逐组累加。表明各组上限值及以下各组变量值共包含的次数或频率有多少。向下累计是指将各组次数或频率,由变量值高的组向变量值低的组逐组累加,表明各组的下限值及以上各组变量值共包含的次数或频率有多少。2010年8月\n考分人数(人)比率(%)向上累计向下累计人数(人)比率(%)人数(人)比率(%)60以下25.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820.040100.0820.0合计40100.0————————表2-12某班“统计学”考试成绩次数分布2010年8月\n(五)次数分布的主要类型1、钟型分布:钟型分布是以某变量值为中心,其分布次数最多,而两边变量值的分配次数逐渐减少的分布形态,即其分布曲线形如一口古钟,故称“钟型分布”。钟型分布又可分为:①正态分布;②偏态分布。2、J型分布:J型分布的特征是变量值的次数一边小一边大的单调分布,即形如字母J字。J型分布有两种类型,即正J型分布和反J型分布,如图2-2(c)。3、U型分布:U型分布与钟型分布图形相反的分布,其特点是:靠近中间的变量值分布次数较少,靠近两端的变量值分布的次数较多。见图2-2(d)所示。2010年8月\n钟型分布的形状对称分布Bell-shapeddistributionLeft-skeweddistribution左偏分布右偏分布Right-skeweddistribution2010年8月\n次数分布的主要类型图2010年8月\n第三节统计数据的显示一、统计表二、统计图2010年8月\n一、统计表(一)统计表的概念(二)统计表的构成(三)统计表的种类(四)统计表内容的设计(五)统计表的制表技术2010年8月\n(一)统计表的概念把统计数字资料,按照一定的顺序和格式列在适当的表格中,这种容载统计资料的表格就是统计表。常见的统计表包括调查表、汇总表、计算分析表等。2010年8月\n(二)统计表的构成1、统计表的外形结构:从外形上看,统计表一般由四个主要部分构成:总标题、横行标题、纵栏标题和数字资料四个部分组成。如表2-13所示。2、统计表的内容结构:从内容上看,统计表包括主词和宾词两部分。主词是指统计表所要说明的总体或总体的各组成部分,它通常使用总体或总体各组成部分的名称来表示。宾词是说明总体的统计指标,包括指标名称及相应的指标数值。2010年8月\n纵栏标题数字资料横行标题表2-132008年中国国内生产总值及其构成按产业分组国内生产总值(亿元)构成(%)第一产业第二产业第三产业34,000146,183120,48711.3148.6240.07合计300,670100.00主词宾词统计表的构成2010年8月\n(三)统计表的种类按照主词是否分组及分组的情况有三种:简单表、简单分组表和复合分组表。1、简单表:简单表是指主词未经任何分组的统计表。常见的有空间数列表和时间数列表。见表2-14、表2-15。2、简单分组表:简单分组表是指主词按一个标志分组的统计表。可以按品质标志分组,也可以按数量标志分组。如表2-10、表2-11等均为简单分组表。3、复合分组表:复合分组表是指将主词按两个或两个以上标志重叠分组形成的统计表,复合分组表能够提供更多的信息量。如表2-7、表2-8。2010年8月\n(四)统计表内容的设计统计表主词的设计可以体现在是否对总体进行分组以及分组形式的选择上,前面已经介绍过此内容,这里主要介绍宾词的设计。统计表宾词的设计,有简单设计和复合设计两种方法。1、宾词的简单设计:宾词的简单设计是指宾词指标的平行排列,本节中上述各表均为宾词指标的简单设计。见表2-16。2、宾词的复合设计:宾词的复合设计是指宾词指标的重叠排列。如表2-17。2010年8月\n表2-16×商场商品销售计划完成情况分析×年×月部门本期实际与计划离差上期本期为上期的%上年同期本期为上年同期的%计划实际计划完成%绝对数相对数(甲)(1)(2)(3)=(2)/(1)(4)=(2)-(1)(5)=(3)-100%(6)(7)=(2)/(6)(8)(9)=(2)/(8)家电部鞋帽部……服装部合计112.5689012.56135.2189.7金额单位:万元2010年8月\n某单位人员情况统计表单位人数高级职称人数(人)中级职称人数(人)初级职称人数(人)小计30岁以下31~45岁46岁以上小计30岁以下31~45岁46岁以上30岁以下031~45岁46岁以上男女男女男女男女男女男女男女男女男女数统工商...金融会计合计2010年8月\n(五)统计表的制表技术在编制统计表时应注意遵循下列规则:1、统计表的各种标题应能简明、确切地表达其内容,尤其是总标题,应十分简要地概括出统计表的基本内容和表中资料所属的时间与空间。2、一般按照先局部后整体的原则排列统计表中的主栏和宾栏。3、如果表中栏次较多,可加以编号。4、表中数字应对准位数,填写整齐,填好的统计表中不应当存在空白格。5、统计表中必须注明计量单位。6、统计表的表式,通常是左右开口的,即左右两端不画竖线;表中项目之间通常也不画横线。7、必要时,可在统计表下方加注说明。2010年8月\n二、统计图(一)统计图的概念及构成1、概念:统计图是运用各种几何图形或具体事物形象地来表示现象之间数量关系的图形。2、统计图的构成①图题是统计图的名称(标题),一般位于图下正中处;②图轴是在直角坐标上作图的纵横两轴,分别称为纵坐标和横坐标,也有少量一些统计图没有图轴;③标目是在纵横两轴上表示间距刻度的各种单位名称;④图形是用来说明图中代表不同事物的图形线条或颜色的含义;⑤图注是图形或其局部某一点需要借助文字、数字加以补充说明的内容。2010年8月\n(二)统计图的种类1、条形图(barchart)2、饼形图(piechart)3、直方图(histogram)4、折线图(frequencypolygon)5、茎叶图(stem-and-leafdisplay)6、线图(Linechart)7、雷达图(radarchart)其中条形图和饼形图,既适用于品质型数据,也可用于数量型数据,其余几种图形适用于数量型数据。2010年8月\n在平面直角坐标系中,用纵轴表示类别,横轴表示频数或频率,使用具有固定宽度的条形,并用条形的长度表示总体中各组成部分的频数或所占比重的分布,这种图形就叫做条形图。如教材图2–3所示。1、条形图(barchart)2010年8月\n图2-3居民在购房时主要影响因素的频数分布2010年8月\n饼形图主要用于表示总体中各组成部分的构成情况,用整个圆形表示总体,用圆内扇形的面积表示总体中各组成部分在总体中所占比重的图形为饼形图。圆内各个扇形面积的中心角度是按各部分百分比占360°的相应比例来确定的。例如有41.5%的居民认为价格是影响其购房的最重要因素,那么表现在饼形图中,其扇形所对应角度为0.415×360°=149.4°。如教材图2–4所示。2、饼形图(piechart)2010年8月\n图2-4居民在影响购房主要因素上的构成2010年8月\n在平面直角坐标系中,用横轴表示数据分组,纵轴表示各组对应的频数或频率,各组与其相应的频数或频率形成的矩形就是直方图。如图2–5所示。从直方图上可以直观地看出灯泡的使用寿命以及在不同使用时间上灯泡的分布状况。3、直方图(histogram)2010年8月\n图2-5灯泡使用寿命的直方图2010年8月\nCollectdata(Thereare200datapointsPrepareafrequencydistributionHowmanyclassestouse?#ofobservations#ofclassesLessthen505-750-2007-9200-5009-10500-1,00010-11Classwidth=[Range]/[#ofclasses][119.63-0]/[8]=14.9515LargestobservationLargestobservationLargestobservationLargestobservationSmallestobservationSmallestobservationSmallestobservationSmallestobservationDrawaHistogram2010年8月\n在直方图的基础上,将其矩形顶部的中点(即组中值)用直线连接起来,再将原来的直方图去掉就是折线图,又称为频数多边形图。例如,在直方图2–7基础上绘制的折线图如图2–8所示。4、折线图(frequencypolygon)2010年8月\n图2-7、图2-8灯泡使用寿命的直方图及折线图2010年8月\n直方图与折线图适用于分组数据,能够显示出一组数据的频数或频率的分布状况,但不能给出数据的具体取值。茎叶图适用于未分组数据,既能显示出数据的分布状况及离散状况,又能给出每个数据的原始数值。绘制茎叶图的关键在于树茎的设计,通常是以数据的高位数值作为树茎,将低位数值依次排列在树茎的右方作为树叶。下面我们以灯泡使用寿命一例的数据做茎叶图,见教材48页图2–9。5、茎叶图(stem-and-leafdisplay)2010年8月\n树茎(stem)树叶(leaf)频数(frequency)651826614568567134679668112333455588991469001111222334455666778888992670001122345666778889187100223356778891372012256789910733563741793图2-9灯泡使用寿命的茎叶图2010年8月\n在平面直角坐标系上,用横轴表示时间,纵轴表示指标的数值,用线段将对应的坐标点连接起来,就形成了描述现象数量变化特征和规律的统计图,即线图。线图主要用于显示时间序列的数据,用以反映现象在时间上发展变化的规律和趋势。如:图2–101988-2008年我国国内生产总值及其环比增长情况线图。6、线图(Linechart)2010年8月\n图2-101988–2008年我国国内生产总值及其环比增长情况线图2010年8月\n雷达图是多指标图示法中的一种,当研究的现象必须使用多个指标或多变量描述时,平面直角坐标系就不再适用,此时可以使用雷达图来显示数据的分布情况。设样本有n个变量,绘制雷达图的步骤为:先做一个圆,在圆周上将其n等分,将n个半径分别作为n个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示,最后将表示变量值的n个点用线段连接,所形成的多边形就是雷达图。雷达图可用于对比多个总体或样本的分布情况。如教材图2-12。7、雷达图(radarchart)2010年8月\n图2-122009年某地区城镇、农村居民家庭人均消费支出2010年8月\n第四节统计数据质量管理一、统计数据质量的概念二、统计数据质量控制三、统计数据质量评价与管理(本节内容自学)2010年8月\n国际统计数据质量标准简介为了提高统计数据质量,国际货币基金组织(InternationalMonetaryFunds,简称IMF)在1995年10月批准建立两个层次的数据标准,即数据公布通用系统(GeneralDataDisseminationSystem,简称GDDS)和数据公布特殊标准(SpecialDataDisseminationSystem,简称SDDS),为统计数据公布的国际标准。2010年8月\n数据公布通用系统(GeneralDataDisseminationSystem,简称GDDS)GDDS是国际货币基金组织(IMF)为统计基础不够健全的成员国制定了数据公布的规范。1997年12月,IMF正式通过GDDS。GDDS的成员国多为发展中国家。GDDS是IMF为其成员国的统计体制制定的一个综合框架。IMF通过技术援助帮助GDDS的参加国逐步改进现有统计体制,最终达到与国际接轨。实际上,GDDS是IMF正在推行的公布数据标准的第一个层面,适用于IMF所有成员国,特别适用于统计基础比较薄弱的发展中国家。2010年8月\n数据公布特殊标准(SpecialDataDisseminationSystem,简称SDDS)SDDS是国际货币基金组织(IMF)为统计基础较为健全的成员国制定的一套规范。适用于已经或寻求进入国际资本市场的国家,成员国多为发达国家。2010年8月\n本章小节统计调查的概念及其地位统计调查的原则要求统计调查的方式方法分类统计调查方案的设计内容各种统计调查的特点和适用条件统计分组的关键是分组标志的选择和各组界限的划分统计分组的作用分组标志的选择统计分组方法和分组体系及变量数列的编制方法统计表的构成及种类划分2010年8月\n《统计学学习指南》27页3、某车间同工种的40名工人完成生产定额百分数(%)的资料如下:97;88;123;115;119;158;112;146;117;108;105;110;107;137;120;136;125;127;142;118;103;87;115;114;117;124;129;138;100;103;92;95;113;126;107;108;105;119;127;104;要求:根据以上资料编制等距式变量数列2010年8月\n1.简述统计调查方案的主要内容。2.什么是抽样调查?它有哪些特点和作用?3.简述三种非全面调查的主要区别。4.在统计工作中为什么要强调多种调查方法的结合运用?5.统计调查误差的分类如何?思考题本章思考与练习题2010年8月\n7.什么是统计分组?它有什么作用?如何正确选择分组标志?8.简述单项式分组与组距式分组的不同应用场合?9.什么是简单分组和复合分组?10.什么是次数分配?它包括哪些要素?11.什么是变量数列?它有几种?12.简述统计表的结构和种类。13.次数分布的类型有哪几种?各有什么特点?2010年8月\n一、单项选择题(在每小题的四个备选答案中选出一个正确的答案,并将正确答案的号码填在题干后的括号内)1、某机械工业系统欲进行工业企业生产设备状况普查,要求在1月1日至20日全部调查完毕,这一时间是()A、调查期限B、调查时间C、登记期限D、标准时间2、对一批商品进行质量检验,最适宜采用的调查方法是()A、全面调查B、抽样调查C、典型调查D、重点调查练习题2010年8月\n3、对首钢、宝钢、鞍钢等十大钢铁企业进行调查,以了解我国钢铁工业生产的基本情况和问题,这种调查方式属于()A、普查B、抽样调查C、典型调查D、重点调查A、这些单位举足轻重B、这些单位是工作重点C、这些单位的数量占总体全部单位的很大比重D、这些单位的标志总量在总体标志总量中占绝大比重4、重点调查中的重点单位是指()2010年8月\n5、全面调查与非全面调查的划分是以()A、时间是否连续来划分的B、调查组织的规模大小来划分C、调查对象所包括的单位是否完全来划分的D、最后取得的资料是否全面来划分的的6、对某市全部商业企业职工生活状况进行调查,调查对象是()A、该市全部商业企业B、该市全部商业企业的职工C、该市每一个商业企业D、该市商业企业的每一个职工2010年8月\nA、作用不同B、组织方式不同C、灵活方式不同D、选取的调查单位不同7、抽样调查与重点调查的主要区别是()A、调查资料所属的时间B、进行调查工作的期限C、调查资料报送的时间D、调查工作登记的时间8、调查期限是指()2010年8月\n9、按某一标志分组的结果就表现为()A、组内差异性,组间差异性B、组内同质性,组间差异性C、组内同质性,组间同质性D、组内差异性,组间差异性10、对某班学生按考试成绩分为5组,这种分组属于()A、简单分组B、复合分组C、平行分组D、再分组2010年8月\n11、分配数列是()A、按数量标志分组的数列B、按品质标志分组的数列C、按数量标志或品质标志分组的数列D、按指标分组的数列A、组数和组距大小的确定B、分组形式的选择C、组限的确定D、分组标志的正确选择12、统计分组的关健在于()2010年8月\n13、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出哪项是正确的,()A、80-89%B、80%以下C、90%以下D、85%以下90-99%80.1-90%90-100%85-95%100-109%90.1-100%100-110%95-105%110%以100.1-110%110-120%105-110%14、在进行组距式分组时,凡遇到某单位的标志值刚好等于相邻两组上下限的数值时,一般是()A、将此值归入上限所在组B、将此值归入下限所在组C、将值归入上限所在组或下限所在组均可D、另行分组2010年8月\n15、下列分组中,哪个是按品质标志分组()16、按人记录的100名工人的日产量资料显示,最高日产量为38件,最低日产量为19件。若要对这100名工人按日产量进行等距分组,组数为5,则组距应为()A、企业按生产能力分组B、产品按品种分组C、家庭按收入水平分组D、人口按年龄分组A、3件B、4件C、8件D、10件17、简单分组与复合分组的主要区别是()A、选择分组标志的性质不同B、组数的多少不同C、总体的复杂程度不同上D、选择分组标志的多少不同2010年8月\n二、多项选择题(从每小题的五个备选答案中选出二至五个正确答案,并将正确答案的号码分别填写在题干后的括号内)1、我国第五次人口普查的标准时间是1990年7月1日零时,下列情况应统计人口数的有()A、1990年6月29日死亡的人B、1990年6月29日出生的婴儿C、1990年7月1日1时死亡的婴儿D、1990年7月2日出生的婴儿E、1990年6月30日19时出生,于7月1日6时死亡的人2010年8月\n2、普查是一种()3、在工业企业生产设备的调查中()A、专门组织的调查B、经常性调查C、一次性调查D、非全面调查E、全面调查A、全部工业企业是调查对象B、每台生产设备是调查单位C、每台生产设备是填报单位D、每个工业企业是填报单位E、工业企业的全部生产设备是调查对象2010年8月\n4、按抽样法抽取部分单位进行调查()A、部分单位是有意识抽取的B、部分单位是按随机原则抽取C、哪些单位被抽中由其代表性决定D、哪些单位被抽中纯属偶然E、总体各个单位都有同等中选的机会A、工业企业生产设备调查B、人口普查C、农产量调查D、工业企业现状调查E、城市零售商店销售情况调查5、下列情况的调查单位和填报单位不一致的是()2010年8月\n6、下列情况的统计调查,哪些属于连续性调查()A、商店的商品库存量B、运输部门的客运周转量C、企业发生的工伤事故次数D、学校年底在校生人数E、某地区年出生人数7、下列哪些分组是按数量标志分组()A、工人按产量分组D、家庭按收入水平分组B、人口按地区分组E、企业按固定资产原值分组C、学生按健康状况分组2010年8月\n8、指出下面的数列属于什么类型()按生产计划完成程度分(%)企业数80~9090~100100~11015305合计50A、品质分配数列B、变量分配数列C、组距变量分配数列D、次数分配数列E、等距变量分配数列2010年8月\n9、统计分组的作用是()A、划分社会经济类型B、说明总体的基本情况C、研究同类总体的结构D、说明总体单位的特征E、分析现象之间的依存关系10、下面哪些属于离散变量()A、进口的粮食数量B、洗衣机台数C、人均粮食产量D、城乡集市个数E、每千人口医院病床数2010年8月\n11、在分配数列中()A、各组频数之和等于100B、各组频率大于0C、总次数一定,频数和频率成反比D、频数越小,则该组的标志值所起的作用越小E、频率表明各组标志值对总体的相对作用程度12、统计分组()A、是将总体中性质不同的单位分在不同组B、是将总体中性质相同的单位分在同一组C、是在总体内部所进行的一种定量分类D、是在总体内部所进行的一种定性分类E、对总体而言是分,对个体而言是合2010年8月\n1.统计调查按调查对象所包括的范围,可分为_______调查和______调查;按调查登记的时间是否连续,可分为________调查和_______调查。2.全面调查包括_______和______;非全面调查包括____、_______和______。3.对占某市工业总产值三分之二的10个企业进行调查,这种调查方法属于_______。4.统计调查所搜集的资料包括______和______。三、填空题2010年8月\n5.要调查某地区工业企业职工的生活状况,调查对象是______,调查单位是______,填报单位是______。6.统计调查的基本要求是_______、_______、和______。7.对于连续变量划分组限时,相邻组的组限必须________。8.统计表从内容上看包括______和______两部分。9.次数分配数列是由________和_________两个要素组成。10.统计表按表的主词是否分组可分为______表、______表和_______表。2010年8月\n11.统计分组的关键在于_________。12.对总体只按一个标志进行分组称为______分组,对总体按两个或两个以上标志层叠起来进行分组称为_____分组。13.将各组标志值的频数由标志值小的组依次向标志值大的组累计,称为_________累计。14.组距式分组根据其分组的组距是否相等可以分为_______分组和_________分组。2010年8月\n结束谢谢!2010年8月