- 1018.50 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
系统评价Meta-分析\n为什么要进行系统评价/Meta-分析?大规模RCT消耗人力,财力和时间多数单位没有条件作大规模RCT多数单个RCT样本量小而不能得出准确可靠的结论系统评价/Meta-分析联合单个RCT增大了样本含量高质量的系统评价/Meta-分析类似于大规模多中心RCT(金标准)系统评价使证据的使用更加方便\n系统评价\n第一节概述一、定义系统评价是针对某一具体的临床问题系统全面地收集全世界所有已发表或末发表的相关的临床研究文章,用统一的科学评价标准,筛选出符合标准、质量好的文献,用定性或定量的方法进行综合,去粗取精,去伪存真,得出可靠的结论。同时,随着新的临床研究结果的出现及时更新。\n二、重要性全世界每年出版1万7干种生物医学专著3万种生物医学杂志(年增长率约7%)每天阅读19篇本专业文献才能基本掌握本学科的新进展和新研究结果。Sackett等调查一周之内内科临床医师阅读医学文献的时间,阅读时间的Md<90分钟。高年资住院医师以上的各级医师中,有15%--40%在过去一周内未阅读过任何医学文献。\n由于繁忙的临床工作或者由于缺乏查寻、评价、合成医学文献信息的技巧,要求人人都博览群书是不现实的。因此,为了能节省阅读时间和尽快获得本专业的最新进展和信息,多数临床医师喜欢阅读医学文献综述。系统评价可为某一领域和专业提供大量的新信息和新知识。\n系统综述是由已故的流行病学家Cochrane在1979年提出来的。系统综述是基于以下的事实。从1972—1979年共有7项RCT均显示用泼尼松龙治疗早产孕妇,可降低早产儿的死亡率达30%一50%,但大多数产科医师不知道该疗法有效,结果1%的早产儿由于没有得到相应的治疗而死亡。Cochrane提出“我们没有由专业人员定期对相关的RCT进行严格总结是我们职业上一个大大的失误”。他对上述的RCT做了系统综述,并建议其他专业仿效这种做法,提出各专业应将所有的RCT收集起来进行系统综述,并不断加入新的试验结果而随时更新,为临床治疗实践提供了可靠的依据。\n三、系统综述与传统综述的异同点1.相同点文献综述目的是为某一领域和专业提供大量的新知识和新信息,以便使读者在短时间内了解某一专题的研究概况和发展方向,获得解决某一临床问题的方法。传统的文献综述(叙述性的文献综述)常常就某一专题在一段时间内的文献资料进行分析研究,归纳整理,做出综合性描述,全面反映某一专题过去和现在的状况及其发展方向。选题时常围绕下列情况:①某一专题近年有较大进展;②某一专题存在较多争议,需要加以归纳整理,并提出一些作者自己的观点。\n系统综述也是一种综述,都属于回顾性、观察性的研究和评价,因此,均可存在系统偏倚和随机错误。一篇综述的质量常常取决于收集到文献的全面程度和质量,以及用于综合资料的方法,减少其可能存在的偏倚和错误的程度。\n2.不同点\n系统评价例:1.中国循证医学网站(临床证据)2.SystematicreviewofPPIandH2AinGORD3.TheEffectivenessofDiseaseandCaseManagementforPeoplewithDiabetesASystematicReview\n系统评价的方法步骤Evidence-BasedGuidetoCommunityPreventiveServices.根据指南,系统评价步骤如下:1.成立评价组(由多个学科小组组成)(1)保证个小组框架的有效性、全面性;(2)有足够的知识、经验保证最后选定的干预的有效性;(3)减少重要信息遗漏的可能性;(4)减少错误和偏倚的可能性。\n2.构成研究框架3.选择评价的干预措施4.系统寻找证据5.评价证据质量、对证据进行总结6.将效果的证据转变成建议7.评价、判断证据(而不是效果)8.鉴别和总结研究的差距\nMeta分析\n一、概述\n60年代开始,在医学文献中,陆续出现了对多个独立研究的统计量进行合并的报道。76年G.V.Glass首先将合并统计量对文献进行综合分析研究的这类方法称为“Meta-Analysis”。\n80年代末该方法传入我国,中文译名有荟萃分析,二次分析、汇总分析、集成分析等。但无论何种中文译名都有不足之处。因此,很多学者建议仍然使用“Meta分析”这一名称。\n二、Meta分析的定义\nMeta-Analysisisasystematicreviewthatusesquantitativemethodstosummarizetheresults.Meta分析是运用定量方法去概括(总结)多个研究结果的系统评价。《Evidence-BasedMedicine》--DavidSackett等,第247页的定义\nMeta-Analysisisstatisticaltechniqueforassemblingtheresultsofseveralstudiesinareviewintoasinglenumericalestimate.Meta分析是将系统评价中的多个不同结果的同类研究合并成一个量化指标的统计学方法。《TheCochraneLibrary》第3页的定义。\n三、Meta分析的统计目的\n实例一\n女童掌骨Ⅱ皮质厚度的11个研究实例二\n在医学研究中,传统的文献综述在处理同一问题的多个结果报道时,通常是平等(等权重方法)对待每个研究结果而得出结论。这种文献综述一般不进行文献评价,也不考虑文献的质量,主要是以某类结果文献数量的多少得出结论。传统文献综述的特点\n传统文献评价的结果必然存在两个问题:一是多个研究的质量不相同;二是各个研究的样本含量的大小(权重)不相等。因此,传统文献综述的方法很难保证研究结果的真实性、可靠性和科学性,尤其当多个研究的结果不一致时,让人容易产生困惑或误解。传统文献综述的主要问题\n对多个同类独立研究的结果进行汇总和合并分析,以达到增大样本含量,提高检验效能的目的,尤其是当多个研究结果不一致或都没有统计学意义时,采用Meta分析可得到更加接近真实情况的统计分析结果。Meta分析的统计目的\n在系统评价(systematicreview)中,当数据资料适合使用Meta分析时,用Meta分析可以克服传统文献综述的两大问题,其分析结果的可靠性更高;当数据资料不适合做Meta分析时,系统评价只能解决文献评价的问题,不能解决样本含量的问题,因此,对其分析结论应慎重。Meta分析与系统评价(一)\n没有按系统评价标准实施严格文献评价的Meta分析结果,其纳入文献的质量及同质性未必达到了合并统计量的条件。因此,这类研究即使用了Meta分析也不一定是系统评价的研究,更难说是高质量的研究。Meta分析与系统评价(二)\n四、Meta分析的统计分析过程\nMeta分析计算的主要步骤:1.计算每个研究的效应量及方差2.计算每个研究效应量的权重3.计算合并效应量4.异质性检验5.合并效应量的可信区间6.合并效应量的检验\n1.单个研究的统计量根据资料类型选择单个研究的统计量di:(1)分类变量可选择的统计量比值比,OR(oddsratio)相对危险度,RR(relativeRisk)率差(绝对危险度),RD(ratedifference)(2)数值变量可选择加权均数差(WMD)或标准化均数差(SMD)为统计量。用于描述单个研究的实验结果,其结果解释与常规统计描述指标相同。\n2.单个研究的方差根据资料类型选择单个研究的统计量di的方差Var(di)单个研究统计量di的计算方法确定后,其方差的计算方法也随之确定。方差可用于可信区间和假设检验的计算。\n3.异质性检验与异质性分析按统计原理,只有同质的资料才能进行合并或比较等统计分析,反之,则不能。因此,Meta分析过程需要对多个研究的结果进行异质性分析,尽可能地消除导致异质的原因,使之达到同质。\n异质性检验异质性检验(testsforheterogeneity)又称同质性检验(testsforhomogeneity)用假设检验的方法检验多个独立研究是否具有异质性(同质性)。\n若异质性检验检验结果为P>0.10时,多个研究具有同质性,可选择固定效应模型(fixedeffectmodel);若多个研究结果为P≤0.10时,多个研究不具有同质性,首先应进行异质性分析和处理,若仍无法消除异质性的资料,可选择随机效应模型(randomeffectmodel)。\nI2(I?)及计算在Revman4.2及以后的软件中,出现了新的异质性指标,即I2(I?)。其计算公式如下:式中的Q为异质性检验的卡方值2,K为纳入Meta分析的研究个数。\nI2(I?)的意义在Revman中,I2是一个衡量多个研究间异质程度大小的指标。这个指标用于描述由研究间所致的变异(而非抽样误差所引起的变异)占总变异的百分比。在Cochrane系统评价中,只要I2不大于70%,其异质性可以接受。\n异质性分析与处理的方法当异质性检验出现P≤0.10时,首先应找出产生异质性的原因,如疗程长短、用药剂量、病情轻重、对照选择等是否相同。由上述原因引起的异质性,可使用亚组分析(subgroupanalysis)、Breslow-Day法和回归近似法。\n亚组分析(subgroupanalysis)根据Cochrane系统评价要求,而在系统评价的计划书中尽可能地对一些重要的亚组间差异进行叙述。也就是说对重要的亚组分析,应在计划书中加以说明。此外,在同一个系统评价中,不提倡使用太多的亚组分析。\n4.多个实验效应的合并将多个独立研究的结果合并(或汇总)成某个单一的效应量(effectsize)或效应尺度(effectmagnitude),即用某个指标的合并统计量,以反映多个独立研究的综合效应。\n合并统计量的计算当多个独立研究的例数不等时,它们的综合效应不等于这多个单独效应的平均数。如三个均数的总均数不等于这三个均数之和除以3。所以,怎样合理的对多个独立研究效应进行合并,是Meta分析统计过程的主要问题之一。\n合并统计量的两种统计模型固定效应模型(fixedeffectmodel):若多个研究具有同质性(无异质性)时,可使用,可使用固定效应模型。随机效应模型(randomeffectmodel):若多个研究不具有同质性时,先对异质原因进行处理,若异质性分析与处理后仍无法解决异质性时,可考虑使用随机效应模型。\n(1)分类变量(category,dichotomous)固定效应模型,指标RR、OR(1)standardoddsratio法(2)Mantel-Haenzel法(3)Peto法随机效应模型,指标RR、OR如:DerSimonian&Laird(D-L)法\n(2)数值变量(continuous)固定效应模型(1)WMD,加权均数差法(WeightedMeanDifference)(2)SMD,标准化均数差法(StandardisedMeanDifference)随机效应模型,D-L法\n常用Meta分析方法一览表\n关于随机效应模型随机效应模型一种对异质性资料进行Meta分析的方法,但是,该法不能控制混杂、也不能校正偏倚或消除产生异质性的原因。目前,随机效应模型多采用D-L法(DerSimonian&Laird法)。\n关于随机效应模型D-L法是通过增大小样本资料的权重,减少大样本资料的权重来处理资料间的异质性,而这种处理存在着较大风险。通常小样本资料往往质量较差,偏倚较大,而大样本资料往往质量较好,偏倚较小。因此,经随机效应模型处理的结果,可能削弱了质量好的大样本信息,增大了质量差的小样本信息,故应谨慎使用随机效应模型,对其结论也应当较为委婉。\n5、合并效应量的检验用假设检验(hypothesistest)的方法检验多个独立研究的总效应量(效应尺度)是否具有统计学意义,其原理与常规的假设检验完全相同。两种方法:①u检验(Ztest)②卡方检验(Chisquaretest)\n根据z或(u)值或卡方值得到该统计量下概率(P)值。若P≤0.05,多个研究的合并效应量有统计学意义;若P>0.05,多个研究的合并效应量没有统计学意义。\n6、合并效应量的可信区间可信区间(confidenceinterval,CI)是按一定的概率估计总体参数(总体均数、总体率)所在的范围(区间),如:95%的CI,是指总体参数在该范围(区间)的可能性为95%。可信区间主要用于估计总体参数和假设检验。\n在Meta分析中,常用可信区间进行假设检验,95%的可信区间与为0.05的假设检验等价,99%的可信区间与为0.01的假设检验等价。此外,森林图即是根据各个独立研究的95%可信区间及合并效应量的的95%可信区间绘制的。\nOR与RR的可信区间若选择OR或RR为合并统计量时,其95%的可信区间与假设检验的关系如下:若其95%CI包含了1,等价于P>0.05,即合并统计量无统计学意义。若其95%CI的上下限均大于1或均小于1,等价于P<0.05,即合并效应量有统计学意义。\nWMD和SMD的可信区间若选择WMD或SMD为合并统计量时,其95%CI与假设检验的关系如下:若其95%CI包含了0,等价于P>0.05,即合并统计量无统计学意义。若其95%CI的上下限均大于0或均小于0,等价于P<0.05,即合并效应量有统计学意义。\n五、分类变量的实例分析\n单个分类变量的研究数据分类变量(category,dichotomous)的单个研究的统计量di,可选择OR、RR或RD,四格表数据如下表\nK研究的分类变量资料整理\n实例一\nOR和RR的森林图OR和RR的森林图(forestplots),无效线竖线的横轴尺度为1,每条横线为该研究的95%可信区间上下限的连线,其线条长短直观地表示了可信区间范围的大小,线条中央的小方块为OR值的位置,其方块大小为该研究权重大小。若某个研究95%可信区间的线条横跨为无效竖线,即该研究无统计学意义,反之,若该横线落在无效竖线的左侧或右侧,该研究有统计学意义。\n例一的Revman4.2.7森林图(M-H法)\n例一的Revman4.2.7森林图(Peto法)\n漏斗图及用途漏斗图(funnelplots)最初是用每个研究的处理效应估计值为X轴,样本含量的大小为Y轴的简单散点图(scatterplots)。对处理效应的估计,其准确性是随样本含量的增加而增加,小样本研究的效应估计值分布于图的底部,其分布范围较宽;大样本研究的效应估计值分布范围较窄,当没有发表偏倚时,其图形呈对称的倒漏斗状,故称之为“漏斗图”。\nRevMan中的漏斗图在RevMan软件中,漏斗图是采用OR或RR对数值(logOR或logRR)为横坐标,OR或RR对数值标准误的倒数1/SE(logRR)为纵坐标绘制的,然后,以真数标明横坐标的标尺,而以SE(logRR)标明纵坐标的标尺。\n漏斗图的用途漏斗图主要用于观察某个系统评价或Meta分析结果是否存在偏倚,如发表偏倚或其他偏倚。如果资料存在偏倚,会出现不对称的漏斗图,不对称越明显,偏倚程度也就越大。漏斗图的不对称性主要与发表偏倚有关,但也可能存在其他原因。\n漏斗图不对称的主要原因导致漏斗图不对称的主要原因有:选择性偏倚(Selectionbias)发表偏倚(Publicationbias)语言偏倚(Languagebias)引用偏倚(Citationbias)重复发表偏倚(Multiplepublicationbias)等等\n例一的Revman4.2.7漏斗图(FunnelPlot)\n六、数值变量的实例分析\n单个数值变量的研究数据数值变量(continuous)的单个研究的统计量di,可选择WMD和SMD法,单个研究的数据如下表\nK研究的数值变量资料整理\n女童掌骨Ⅱ皮质厚度的11个研究实例二\n1、单个效应量及方差计算目前,数值资料的单个研究,主要使用加权均数差WMD和标准化均数差SMD来描述其效应量。\nWMD和SMD的森林图WMD和SMD的森林图,无效线竖线的横轴尺度为0,每条横线为该研究的95%可信区间上下限的连线,其线条长短直观地表示了可信区间范围的大小,线条中央的小方块为WMD或SMD值的位置,其方块大小为该研究权重大小。若某个研究95%可信区间的线条横跨为无效竖线,即该研究无统计学意义,反之,若该横线落在无效竖线的左侧或右侧,该研究有统计学意义。\n例二的Revman4.2.7森林图(WMD法)\n例二的Revman4.2.7森林图(SMD法)\n例二的Revman4.2.7漏斗图(FunnelPlot)\n七、有关Meta分析的讨论\n目前,Meta分析的统计方法尚不够完善,还不能满足各种资料和设计方法合并需要,如多个均数比较、等级资料比较时,仍无成熟的Meta分析方法。此外,对Meta分析的争论也较多,如:对固定与随机效应模型的争论、权重(W)计算的不同方法等。\n虽然,这些讨论不影响它在临床医学中的应用,但是也提示我们,循证医学研究和实践工作不但需要有很好的临床医学知识,而且也需要有良好的临床流行病学、生物统计学、甚至卫生经济学的基础知识。\n八、Meta分析的软件\n1.ReviewManager(Revman):该软件是国际Cochrane协作网系统评价的标准化专用软件,其中包含了Cochrane系统评价的各项功能,也包括该组织推荐的各种Meta分析功能,具有操作简单、结果直观的特点。该软件是一个免费软件,用户可在如下网址免费下载:http://www.cc-ims.net/download/revman/revman42.exewww.cochrane.org/resources/index.htm\n2.STATA该软件是美国ComputerResourceCenter研制的统计软件,从1985年起,连续推出了多个版本。该软件可完成二分类变量和连续性变量的Meta分析,也可以进行Meta回归分析,还可以绘制Meta分析的相关图型,如森林图(Forest)、漏斗图(Funnel)和L’Abbe图。\n3.SASforwindows:国际权威的统计软件,可完成各种Meta分析(包括数值、分类资料及固定效应、随机效应模型)的统计工作。4.SPSSforWindows:该软件是一个统计专用软件,在其“Crosstable”菜单中,可完成四格表资料Fleiss法的计算工作。\n其他Meta分析软件\n谢谢!