- 196.00 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
社会经济统计学的定义 社会经济统计学是研究社会经济统计活动的规律和方法的学科。社会经济统计是对社会经济现象的一种调查研究活动。它密切联系事物的质的方面,调查研究社会经济现象的数量方面,并用数字语言尽可能精确地表述出来。社会经济统计学就是研究如何进行这种调查研究活动的一门社会科学。[编辑本段]统计和统计学派的形成 在原始社会末期和奴隶社会形成过程中,已出现了统计的萌芽。在国家产生以后,统治阶级为了征兵、劳役和税收,需要了解人口、土地、粮食和牧畜等的数量。最早的统计是从人口和土地的计量开始的。在封建社会中,统计已略具规模,但总的说来发展缓慢。至资本主义上升时期,随着经济文化的发展和生产逐步社会化,统计逐渐扩大到工业、农业、商业等各个方面。在这种统计活动发展到一定阶段时,人们开始总结统计实践的经验,逐渐形成了比较系统的统计理论知识,产生了统计学。现在,一般公认的最早的统计学著作,是英国W.配第1676年所著的《政治算术》。还有差不多同时出现的德国H.康令(1606~1681)所著的《国情论》。此后,在统计学说史上形成长期并存的“政治算术学派”和“国势学派”。两大学派的共同点,在于都以社会经济作为研究对象;不同之点,在于是否把数量方面的研究作为这门学科的基本特征。经过两百年之久的争论,到19世纪中叶,统计学作为一门对社会经济现象进行数量分析的科学才得到社会的公认。在政治算术学派和国势学派的争论还没有完全解决时,比利时的L.A.凯特尔(1796~1874)在他的《社会物理学:或试论人的才能的发展》(1869)等著作中,把概率论引入了统计学,开辟了统计学的新领域,逐渐形成了一门独立的学科,即数理统计学。 目前世界上存在着多种统计学派。数理统计学派认为,统计学就是数理统计学,是现代应用数学的一个分支,是通用于研究随机的自然现象和社会现象数量特征的方法体系。数理统计学在近几十年中,在理论、方法和应用上有了很大的发展。社会统计学派则认为,统计学的研究对象是社会现象,目的在于研究社会现象内部的联系和相互关系。 K.马克思和F.恩格斯是社会主义社会经济统计理论的奠基人。他们在领导第一国际的革命运动中,提出无产阶级必须建立自己的统计,作为了解各国工人阶级状况、揭露资本主义制度的本质、制定国际工人运动战略策略的依据。列宁曾指出社会经济统计是认识社会的有力武器之一,是国家监督的重要工具之一。他为世界上第一个社会主义国家统计的理论建设、制度建设、组织建设奠定了基础。毛泽东强调实事求是、调查研究,并把“注意基本的统计”作为党委会的工作方法之一。[编辑本段]\n社会经济统计的特点和分科 社会经济统计的主要特点是:①数量性。包括社会经济现象的数量多少,现象之间的数量关系,质量互变的数量界限。社会经济统计是在与一定质的联系中,反映这些数量方面的现状和它们的发展变化过程。②总体性。即对社会经济现象总体的数量方面的认识。③具体性。指具体事物的数量方面。它研究具体事物在一定时间、地点、条件下的数量表现。因此,它总是同现象的质密切联系在一起的。④社会性。社会经济现象是人类社会活动的条件、过程和结果。它们都是人类有意识的社会活动,都和人们的利益有关。社会经济统计的认识主体也有社会性。 社会经济统计活动的成果有:①统计资料;②统计方法。在社会经济统计学的发展过程中,曾一度把这两方面的成果都包括在自己的研究范围以内。实际的发展情况表明,社会经济统计学的研究领域,逐步向后者发展。它已经成为一门认识社会经济现象数量方面的方法论学科。 社会经济统计学是一门多科性的学科。它的基本分科是:社会经济统计学原理、经济统计学、社会统计学、部门统计学及统计史。在部门统计学中,又分为人口统计学、农业统计学、工业统计学、教育统计学、文化统计学、卫生统计学等。[编辑本段]社会经济统计与其他学科的联系 除各部门统计学与相对应的部门学科联系密切外,社会经济统计学作为一个整体,与哲学、政治经济学和数学的关系最为密切。 哲学中物质是第一性的原理、事物对立统一的法则、事物普遍联系和不断发展的观点等,都是社会经济统计学中所论述的许多方法的依据。社会经济统计学也以社会经济理论科学所揭示的经济关系和经济规律作为其理论指导。例如,总产值、净产值、工资、利润、劳动生产率等具体统计指标,都反映一定的经济范畴。在确定它们的概念和计算范围时,也是以政治经济学所阐述的有关原理为依据的。社会经济统计学还运用数学方法,包括数理统计方法,以进行严密的数量描述和定量分析。在社会经济现象中,许多数量关系可以利用一定的数学模型来研究。所以,社会经济统计学不断吸收和运用现代数学方法的最新成果。\n\n 第三节统计学中的几个基本概念1、同质(homogeneity)与变异(variation)严格地讲,同质是指被研究指标的影响因素完全相同。但在医学研究中,有些影响因素往往是难以控制的(如遗传、营养等),甚至是未知的。所以,在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。例如研究儿童的身高时,要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同,而不易控制的遗传、营养等影响因素可以忽略。同质基础上的个体差异称为变异。如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。事实上,客观世界充满了变异,生物医学领域更是如此。哪里有变异,哪里就需要统计学。若所研究的同质群体中所有个体一模一样,只需观察任一个体即可,无须进行统计研究。2、总体(population)与样本(sample)任何统计研究都必须首先确定观察单位(observedunit),亦称个体(individual)。观察单位是统计研究中最基本的单位,可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。总体是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。例如欲研究山东省2002年7岁健康男孩的身高,那么,观察对象是山东省2002年的7岁健康男孩,观察单位是每个7岁健康男孩,变量是身高,变量值(观察值)是身高测量值,则山东省2002年全体7岁健康男孩的身高值构成一个总体。它的同质基础是同地区、同年份、同性别、同为健康儿童。总体又分为有限总体(finitepopulation)和无限总体(infinitepopulation)。有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个,如上例;无限总体是抽象的,无时间和空间的限制,观察单位数是无限的,如研究碘盐对缺碘性甲状腺病的防治效果,该总体的同质基础是缺碘性甲状腺病患者,同用碘盐防治;该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果,没有时间和空间范围的限制,因而观察单位数无限,该总体为无限总体。在实际工作中,所要研究的总体无论是有限的还是无限的,通常都是采用抽样研究。样本是按照随机化原则,从总体中抽取的有代表性的部分观察单位的变量值的集合。如从上例的有限总体(山东省2002年7岁健康男孩)中,按照随机化原则抽取100名7岁健康男孩,他们的身高值即为样本。从总体中抽取样本的过程为抽样,抽样方法有多种,详见第14章。抽样研究的目的是用样本信息推断总体特征。统计学好比是总体与样本间的桥梁,能帮助人们设计与实施如何从总体中科学地抽取样本,使样本中的观察单位数(亦称样本含量,samplesize)恰当,信息丰富,代表性好;能帮助人们挖掘样本中的信息,推断总体的规律性。3、资料(data)与变量(variable)及其分类总体确定之后,研究者应对每个观察单位的某项特征进行测量或观察,特征称为变量。如“身高”、“体重”、“\n性别”、“血型”、“疗效”等。变量的测定值或观察值称为变量值(valueofvariable)或观察值(observedvalue),亦称为资料。按变量的值是定量的还是定性的,可将变量分为以下类型,变量的类型不同,其分布规律亦不同,对它们采用的统计分析方法也不同。在处理资料之前,首先要分清变量类型。1)数值变量(numericalvariable):其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。如身高(cm)、体重(kg)、血压(mmHgkPa)、脉搏(次/min)和白细胞计数(×109/L)等。这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料(quantitativedata)。大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只能是正整数,如脉搏、白细胞计数等,在医学统计学中把它们也视为连续型变量。2)分类变量(catagoricalvariable):其变量值是定性的,表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类:(1)无序分类变量(unorderedcategoricalvariable)是指所分类别或属性之间无程度和顺序的差别。,它又可分为①二项分类,如性别(男、女),药物反应(阴性和阳性)等;②多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。(2)有序分类变量(ordinalcategoricalvariable)各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。例如血红蛋白量(g/L)原属数值变量,若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析。有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示,则可按数值变量资料(定量资料)分析。4、随机事件(randomevent)与概率(probability)医学研究的现象,大多数是随机现象,对随机现象进行实验或观察称为随机试验。随机试验的各种可能结果的集合称为随机事件,亦称偶然事件,简称事件。例如用相同治疗方案治疗一批某病的患者,治疗转归可能为治愈、好转、无效、死亡四种结果,对于一个刚入院的患者,治疗后究竟发生哪一种结果是不确定的,可能发生的每一种结果都是一个随机事件。对于随机事件来说,在一次随机试验中,某个随机事件可能发生也可能不发生,但在一定数量的重复试验后,该随机事件的发生情况是有规律可循的。概率是描述随机事件发生的可能性大小的数值,常用P表示。例如,投掷一枚均匀的硬币,随机事件A表示“正面向上”,用n表示投掷次数;m表示随机事件A发生的次数;f表示随机事件A发生的频率(f=m/n),0≤m≤n,0≤f≤1。用不同的投掷次数n作随机试验,结果如下:m/n=8/10=0.8,7/20=0.35,……,249/500=0.498,501/1000=0.501,10001/2000=0.5000,由此看出当投掷次数n足够大时,f=m/n→0.5,称P(A)=0.5,或简写为:P=0.5。当n足够大时,可以用f估计P。\n随机事件概率的大小在0与1之间,即0