- 2.86 MB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
MedicalStatistics医学统计学熊伟1\n引言你作为医生,怎样提高诊疗水平,平时你是怎样积累你的经验?你认为用哪种方式能最快的提高你的诊疗水平?2\n自己做实验从书中学从老师、专家那里学(传统方法)自己从文献中学答案很多:3\n自己实验,比如:如治疗胃溃疡,你觉得目前的标准方法(A法)不好,而想采用自己改进的方法(B法),请问你怎样证明你的方法好于标准方法?你需要设计实验怎样试验:选病人、病人的基本情况、样本数、其他影响治疗效果因素的排除,得出有效率、无效率。怎样分析结果:B法的有效率高于A法的有效率是否能说明B法优于A法。4\n从文献中学(个人认为最快最好)书本的更新慢专家学者的局限文献中的内容丰富,更新及时,没有时间、地域差。但文献中的内容参差不齐,水平有高有低,鱼目混珠。我们怎样从中吸取营养。这涉及怎样阅读文献,评价文献(医学论文)的水平和价值。5\n而要评价一科研论文的水平和价值,往往是看其科研设计是否合理和统计分析是否正确,这是基础。而科研设计中的内容有很大一部分是统计学的知识。最后得出的结论就是:要提高你的临床诊疗水平和科研水平,大家就得学好统计学。(循证医学)6\n学好统计学1、医学论文中的统计学问题(1)60年代到80年代,国外医学杂志调查结果:有统计错误的论文20%~72%。(2)1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。2、伪造统计数据违反科学道德,1976年NewScience杂志关于科研舞弊行为的调查(1)74%的调查表反映有不正当修改数据的情况(2)17%拼凑实验结果(3)7%凭空捏造数据(4)2%故意曲解结果7\n面对复杂的问题怎样处理?“当人类科学探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计工具可为其开辟一条前进的通道”。---英国著名遗传学家Galton(1822-1911)为何开设医学统计课?8\n“按照现代理论,自然规律的基础不是因果性,相反,本质上具有统计性质。…人们断言,一切自然规律‘在原则上’都是统计性的,只是我们观察操作不完善,我们才受骗去信仰严格的因果性。”---AlbertEinstein(1879-1955)1928年<物理学的基本概念及其最近的变化><爱因斯坦文集>第一卷P239商务出版社9\n目的要求:1、掌握统计学中的几个基本概念、统计资料的几种类型、资料间的互相转换。2、了解统计工作的基本步骤以及统计图表的编制10\n统计学的定义统计学:运用概率论和数理统计的原理和方法,研究数据资料的收集、整理、分析与推断,从而反映事物内在规律的一门学科,是认识社会和自然现象客观规律的数量特征的重要工具。医学统计学:运用概率论和数理统计的原理和方法,研究医学领域中数据资料的收集、整理、分析与推断,从而反映事物内在规律。研究对象:人以及与人的健康有关的各种影响因素11\n统计学的定义Statistics:thescienceofcollecting,analyzing,presenting,andinterpretingdata.Copyright1994-2000EncyclopaediaBritannica,Inc.(不列颠百科全书)12\n统计学的几个基本概念一、同质与变异:1、同质:指观察单位(研究个体)间被研究指标的影响因素相同。实际工作中,影响被研究指标的主要的可控制的因素达到相同或者基本相同就可以认为是同质2、变异:同质的个体间各种指标的观察值存在的差异同质是相对的,变异是绝对的统计学的任务就是在同质的基础上,对个体变异进行分析研究,揭示由变异所掩盖的同质事物内在的本质和规律。13\n统计学的几个基本概念一、同质与变异:3、变量:观察单位的某一研究特征,习惯用X表示(身高)4、变量值:变量的观察结果/测得值。(176cm)14\n统计学的几个基本概念同质与变异的例子例1:调查2007年西安市7岁男童的身高和体重同质:2007年、西安市、7岁男童变异:每个男童的身高和体重各不相同变量:身高、体重变量值:每个人的身高、体重的具体实测值(cm、Kg)例2:研究某降压药的疗效同质:用某药治疗的高血压患者变异:该药物对每个治疗对象的疗效各不相同变量:疗效变量值:每个人的疗效的具体结果(痊愈、控制、减轻、无效)15\n统计学的几个基本概念同质与变异的例子例3:2005级护理班女生《统计学与流行病学》期末成绩同质:2005级护理班女生、参加了《统计学与流行病学》考试变异:《预防医学期末》期末成绩变量:期末成绩变量值:每个人期末成绩的具体分数16\n统计学的几个基本概念二、总体与样本:1、总体(population):根据研究目的而确定同质观察单位某观察值的全体称为总体。分类:有限总体:观察单位有限、有明确的时间和空间范围(某工厂工人数)无限总体:没有时间和空间范围、观察单位数是无限的或者不易确定的(某病病人数、细菌数)17\n统计学的几个基本概念二、总体与样本:2、样本(sample):从总体中随机抽得的部分观察单位,其观察值的集合,称为样本。样本含量:样本中所包含的观察单位数,常用n表示。抽样一定遵循随机的原则,并要有足够的样本含量18\n统计学的几个基本概念随机抽取的方法:单纯随机(编号,按照随机数抽取)整群(先分群,再抽样(随机抽群))系统(先排序,分n(样本量)个组,确定一个随机数a,每隔N/n抽取一个单位)分层(先分组,在各组内随机抽取,合成样本)19\n统计学的几个基本概念抽样研究的意义:对样本进行研究,推论总体20\n统计学的几个基本概念总体与样本的例子例1:随机抽样调查2007年西安市100名7岁男童的身高和体重有限总体:2007年西安市的所有7岁男童样本:随机抽取的100名7岁男童例2:随机抽取200名服用某降压药的高血压患者以研究某降压药的疗效无限总体:服用某降压药的高血压患者样本:随机抽取200名服用某降压药的高血压患者21\n统计学的几个基本概念总体与样本的例子例3:随机抽取10名2005级护理班女生《统计学与流行病学》期末成绩有限总体:2005级护理班女生《统计学与流行病学》期末成绩样本:10名2005级护理班女生《统计学与流行病学》期末成绩22\n统计学的几个基本概念总体与样本的关系:23\n统计学的几个基本概念三、参数与统计量(parameterandstatistic)参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。为固定的常数统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。24\n统计学的几个基本概念总体样本抽取部分观察单位进行研究统计量参数推断inference统计量与参数的关系25\n统计学的几个基本概念四、误差:泛指实验数据的实测值与真实值之差。分类:1、系统误差(systemanticerror):由于仪器设备、标准试剂、判定标准等不准确,使测定结果呈倾向性的偏大或偏小,可纠正2、随机测量误差(randomerrorofmeasurement):由于各种的偶然因素造成同一受试对象多次测定结果不完全一致。这种误差没有固定的倾向性。不可避免,但可以尽量减小3、抽样误差(samplingerror):由于随机抽样所引起的样本统计量与样本统计量、样本统计量与总体参数之间以及各样本统计量之间的差异。26\n统计学的几个基本概念五、概率(probability):系描述随机事件发生可能性大小的量值,常用符号P表示,其取值范围在0~1之间,即0≤P≤1。不可能发生的事件,概率P=0;必然发生的事件,概率P=1。事件发生的可能性越大,其概率P越接近1。频率:发生某事件的次数所占的比例。频率与概率的关系:n越大,频率越趋稳定,可作为概率的估计值小概率事件:P≤0.05或P≤0.0127\n统计资料的类型1、变量:观察单位的某一研究特征,习惯用χ表示。按照在分析中的作用分类:结果反应变量/因变量(responsevariable):表示试验效应指标,如疗效、是否某病等。解释变量或自变量(independentvariable):与试验结果有关的变量,如不同用药、方法、不同病情、性别、疾病类型、年龄。2、变量值:变量的观察结果(测得值)3、统计资料(数据):由变量值构成资料。28\n统计资料的类型一、数值变量资料:又称为定量资料或计量资料,用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料为数值变量资料。变量值表现为有数字大小和单位(度量衡)的数据。连续性资料例:身高值(cm):165,170,158…..住院天数(天):15,18,10…..脉搏数(次/分):72,66,80……脑电图波形变化率%:29%,37%……29\n78938593738362779188928685827967908169828582869189787384807871748893898384758390868270838989837786938377758486938685807788847784868190788963939384768181848275888483917075878393837066768966907980627593858686708090898689797991738589858477778461828665707676816176788293899285表12003级部分学生成绩30\n统计资料的类型二、分类变量资料:又名定性资料,将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料即为分类变量资料。其观察指标为分类变量,表现为互不相容的类别或者属性。变量值没有单位,表示例数。分为:1、无序分类:各分类间有性质的不同,无程度上的差别。包括:二项分类,如:检验指标(阳性或阴性);性别(男性、女性);产品质量(合格或不合格)多项分类,如:血型(O、A、B、AB);转移部位(肺,骨,淋巴结)31\n年龄组甲厂乙厂调查人数年龄构成比/%患病率调查人数年龄构成比/%患病率20~104815.911.38112216.571.4330~103715.751.67191628.301.7040~142521.633.12167424.733.4650~168025.508.48114216.878.5850~139721.2115.5091613.5315.86合计6587100.006.616770100.005.17表2甲乙两厂某病患病率比较32\n统计资料的类型2/三、有序分类:各类别之间有程度上的差别,且排列有序,给人以半定量的感觉,又称为等级资料,如:尘肺分级:0、0+、Ⅰ、Ⅰ+、Ⅱ、Ⅱ+、Ⅲ、Ⅲ+疗效:痊愈、控制、有效、无效病人满意度:好、中、差33\n表3(单向有序资料)两种药物治疗慢性气管炎疗效组别无效好转显效控制甲组800192068060乙组10602618表4(双向有序资料)矽肺期次肺门密度级别合计++++++I4318814245II19672169III6175578合计5030114149234\n统计资料的类型三、变量间的转化:定量资料的定性化转换血压(kPa):计量资料正常、异常:二分类正常、可疑、异常:等级35\n统计资料的类型优、良、中、差4,3,2,1idgroupgenderagelos1116718211751731066174106715500752161174177116918表5定性资料的定量化转换36\n统计工作的基本步骤一、设计:明确研究目的,确定实验因素、受试对象和观察指标,确定收集资料的方式方法,如何整理资料,如何分析资料,预测统计分析的预期结果二、收集资料:取得准确可靠的原始资料;来源有:统计报表、医疗卫生工作记录、专题调查或实验研究三、整理资料:对资料进行反复核对和认真检查、改错、分类汇总,使其系统化、条理化;过程包括审核、分组、汇总四、分析资料:统计描述、统计推断37\n统计表与统计图统计表(statisticaltable)——表格代替文字描述,便于统计结果的精确、简洁的表达和对比分析统计图(statisticalchart)——用图形代替数据,获得直观、形象的效果统计表与统计图38\n\n一、统计表1、统计表的结构2、统计表的种类3、不良统计表的修改举例统计表与统计图\n1、统计表的结构检测指标1994年1998年受检人数异常人数检出率(%)受检人数异常人数检出率(%)血压心率TTTGPT5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75统计表由以下几个部分组成:①标题、②标目、③线条、④数字、⑤备注表6某省某工厂1994、1998年四项检测指标异常检出率:TTT(麝香草酚浊度试验),:GPT(谷丙转氨酶)。总标目、横标目、纵标目\n2、统计表的种类:根据分组标目的复杂程度,统计表可大致分为简单表和复合表。简单表(simpletable):只按一个特征或标志分组。复合表(combinativetable):按两个或两个以上特征或标志结合起来分组。\n3、不良统计表的修改举例\n二、统计图(statisticalchart或statisticalgraph)是用点、线、面等几何图形,直观形象地表达、描述数据或结果。1.统计图的结构2.统计图的种类与绘制注意事项统计表与统计图\n1.统计图的结构表2-172000年三大城市四苗接种率(%)地区接种率(%)卡介苗脊灰炎苗百白破苗麻疹疫苗甲99.7299.2099.2499.12乙93.5098.2098.7098.20丙99.5093.9098.7098.20统计图由以下几个部分组成:①标题、②标目、③点线条面、④刻度、⑤图例图12000年三大城市四苗接种率(%)\n用Excel绘制的图形(图2)\n2.统计图的种类与绘制注意事项⑴条图⑵圆图⑶百分条图⑷线图⑸直方图⑹散点图⑺统计地图⑻箱式图\n(1)条图(barchart)条图:用直条的长度表示相互独立的统计指标的大小,可分为:①单式(simple)条图:具有一个统计指标,一个分组标志。如图。②复式(clustered)条图:具有一个统计指标,两个分组因素。如图。③分段(stacked)条图④误差条图(error-bar)图3各式条图\n分段条图:具有两个统计指标,一个分组因素,且两个统计指标必须有隶属关系。如图4。误差条图:用条图或线图表示均数的基础上,在图中附上标准差的范围。如图5。图5四种营养素喂养小白鼠三周后所增体重(克)图4老、中、青三代的结核菌素阳性率与强阳性率(%)\n绘制条图注意事项⑴纵轴的刻度必须从“0”开始,否则会改变各对比组间的比例关系。(2)横轴各直条一般按统计指标由大到小排列,也可按事物本身的自然顺序排列。(3)各直条的宽度要一致,各直条应有相等的间隔,其宽度一般与直条的宽度相等或为直条宽度的一半。\n(2)圆图(piechart)圆图:用于表达事物内部的百分构成比大小。各个扇形面积(3.6°)的大小反映了各组成部分百分比(1%)的大小。从12点钟处开始绘制,顺时针方向排列。\n图72002年某医院1402例孕妇分娩结果分娩结果例数构成比(%)过期产211死产211早产21215足月114883总计1402100\n(3)百分条图(percentagechart)百分条图的作用与圆图相同。但更适用于多组百分比的比较。020406080100呼吸系统病脑血管病恶性肿瘤损伤与中毒心脏疾病其它图8我国部分县1988年的死因构成比\n图9不同性别某癌三种类型的构成分化型癌低分化腺癌未分化型合计男52.327.819.9100女30.218.151.7100\n(4)线图(linechart)①普通线图(linechart):用线段的升降表示某事物动态变化,或某现象随另一现象变迁的情况(绝对差)。适用于连续性资料。纵轴:算术尺度;横轴:连续性变量(时间、年龄等)②半对数线图(semilogarithmiclinechart):表示事物发展速度(相对比)。纵轴:对数尺度;横轴:连续性变量(时间、年龄等)\n绝对差与相对比的比较图10绝对差示意图(算术格纸)数值时间图11相对比示意图(半对数格纸)数值时间\n表9某市1949~1957年15岁以下儿童结核病和白喉死亡率(1/10万)年份结核病死亡率百喉死亡率194919501951195219531954195519561957150.2148.0141.0130.0110.498.272.668.054.820.116.614.011.810.76.53.92.41.3\n(5)直方图(histogram)直方图(histogram):用矩形面积表示连续变量的频数(频率)分布。1.横轴:连续变量的组段;纵轴:频数或频率,尺度从0开始。2.各矩形条之间不留空隙。3.矩形的高度为频数或频率,宽度为组距。\n\n(6)散点图(scatterdiagram)散点图(scatterdiagram):用点的密集程度和趋势表示两种现象间的相关关系。横轴:自变量X纵轴:应变量Y纵轴与横轴的起点可根据资料的情况而定。\n\n(7)统计地图(statisticalmap)统计地图(statisticalmap):用于表示某现象的数量在地域上的分布。\n(8)箱图(boxplot)箱图(boxplot)也称箱须图(box-whiskerplot),用于反映一组或多组连续型定量数据分布的中心位置和散布范围。\nTheend\n常用的统计软件(Software)65\nSASSPSS国外的统计软件66\nSTATAMINITAB67\nSTATISTICAJMP68\nS_PLUSSIGMAStat69\nNASS&PASSSYSTAT70\nMedCalcIDAMS71\nExcelGenStat72\nDPS国内的统计软件PEMS73\n课后思考:什么是同质?什么是变异?什么是总体?什么是样本?误差分为哪几类?统计资料有哪些类型?统计工作的步骤是什么?74