医学统计学之生存分析 56页

  • 289.50 KB
  • 2022-09-01 发布

医学统计学之生存分析

  • 56页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第十七章生存分析 (SurvivalAnalysis)\n概述问题的提出:临床上疗效、预后的评价常用疾病的结局指标:如有效率、治愈率、死亡率指标比较,对于在短期内能明确治疗效果的疾病是适用的。但对于肿瘤和慢性疾病,其指标的评价不全面。\n例某病的疗效比较治愈率平均治愈时间甲药80%20天乙药81%12天疾病的疗效除了应评价“结局”的好坏,结局所经历的时间长短也是评价疗效重要的指标。\n随访研究资料随访资料:随访观察某事件出现“某结局”和“时间”的资料统称为随访资料,评价该资料的统计学方法为生存分析。生存分析是将“结局”与“时间”两个因素结合一起研究的统计分析方法\n起始事件(事件的特征)失效事件(结局出现的特征)如诊断、用药、手术等如疾病的死亡、复发等一、基本概念时间(t)1.生存时间(t)=失效事件日期-起始事件日期。t的单位:可用年、月、周表示。第一节生存分析的基本概念\n2.截尾数据:生存时间观察过程被人为的截止称为截尾(censored)数据。原因有:①失访,②退出研究,如其他原因死亡。③终止:研究时间结束,未出现结果事件。截尾值(censoredvalue):其生存时间记为t+。(例:10+月)\n3.生存数据的特点1.有完全观察的随访数据:研究对象在规定的研究期间提供确切的“时间”。其生存时间记为“t”。2.有截尾数据:截尾数据(t+)虽然提供的信息不完全,但提供了部分信息,如t=10+年>9年。3.生存数据的效应变量(Y)有两个:1)“时间(t)值”,(t)>02)结局状态=“如死亡或截尾值”。其他统计方法不能处理该资料\n90年91年92年93年(研究结束)死亡失访死亡一批病人不同时间进入研究的随访资料起点存活起点起点起点起点存活\n二.资料的收集(一)随访内容1.明确起始事件的特征和时间,如手术日期等。2.明确随访结局:效果的特征事件,如死亡或截尾事件。3.明确研究结束时间。4.记录影响“时间”的其他自变量。\n例:收集生存数据和影响预后的因素。某病用不同药后随访记录(天)预后因素随访记录病例性别处理开始终止是否生存号组日期日期死亡时间11A药98/07/1298/11/29Y14022B药98/07/0198/12/29Y16031A药98/08/2298/11/29仍活9942B药98/10/2098/11/25车祸死亡36\n(二)随访的方式1.全体观察对象同时接受某处理随访方式:多见于动物实验(见图17-1,a)2.观察对象在不同时间接受处理因素随访方式:多见于临床试验研究(见图17-1,b)\n起始事件时间如给药0研究结束时间t×O××O×为死亡O为截尾\n(三)生存分析主要研究的内容1.统计描述:用统计指标描述生存过程,计算不同时间点(t)的生存率2.统计推断:统计检验不同处理方式的生存过程有无差别3.自变量(x)与时间(t)的关系:影响生存时间的危险因素分析\n三、生存分析中的基本方法1.非参数法*:特点:不考虑变量的分布,采用秩次统计量。是生存资料常采用的方法。主要是单变量的统计描述和比较。2.半参数法*:如Cox模型,主要是生存时间的影响因素分析。3.参数法:特点:假定资料服从某分布。常采用指数分布和Weibull分布等。(不常用)\n讲义例:17-1某人研究手术方法治疗23位肾上腺肿瘤病人的生存时间(月)如下:1,3,5(3),6(3),7,8,10(2),14+,17,,19+,20+,22+,26+,31+,34,34+,44,59注:()括号内的数为相同时间点的人数数据特点:1.生存时间的分布为偏态分布,2.有截尾值3.每个值包含两个含义,即“t”和状态“死亡与否”\n第二节生存率的估计与生存曲线(一)描述生存资料的几个指标1.死亡概率、生存概率(275页)死亡概率(F):指死于某时段内的可能性。生存概率(S=1-F):指某时间段开始存活的个体到该时间段结束时仍存活的概率。\n例:生存期初死亡生存死亡生存生存率(年)人数人数人数概率概率S(t)0-110010900.10.90.901-29010800.110.890.802-38020700.250.750.70死亡概率F(t=1)=0.1,在1年内死亡的概率.S(t=2)表示从起始事件到2年时点仍存活的概率\n生存时间数据分析时整理示意图死亡02468101214161820年“t”表示从研究起点到结局出现时间t失访失访死亡死亡死亡\n2.生存函数:(survivalfunction),简称生存率。记为S(t)=P(X≥t)。S(t):指某观察对象从起始事件(如手术时间为0点)开始,经历了t(年或月)个单位时间后仍存活的概率。(273页)1)直接法\n生存率的计算公式2.概率乘法原理计算(275页)有截尾数据时采用S(t)也称累计生存概率,t时刻存活是t之前一直生存的累积。例:Pj为生存概率(公式17-2)\n3.生存曲线:(survivalcurve)指各时点(t)为横轴,生存率S(t)为纵轴,连接一起的曲线图。描述该组病人各时点的生存过程。(277页)4.半数生存期(中位数生存时间)生存率为0.5时对应的时间(t),表示50%的个体可生存的时间,常作为生存数据的平均指标。(278页)\n甲手术乙手术图17-2两种手术治疗方式术后病人生存曲线的比较\n(二)生存率估计的统计方法(非参数方法)1.小样本数据生存率计算。用kaplan-Meier的乘积极限法(product-limitmethod,PL法)2.大样本数据生存率计算用寿命表法(LifeTable,LT法)\n两法特点:1.均可计算有截尾和无截尾值的生存资料。2.生存率S(t)计算采用概率乘法原理。3.统计软件可计算一组生存数据各时间点的生存率S(t)、生存率的标准误Sp、中位数生存时间、绘制生存曲线。\n1.、小样本资料kaplan-Meier的乘积极限法例:表17-1资料概率乘法原理估计生存率S(t)。P(X>t)=P1×P2…..Pk×Pt(17-2)P(X>3)=S(3)=P1×P2=0.957×0.0.955=0.914P(X>5)=S(5)=P1×P2×P3=0.914×0.854=0.783Pj为生存概率\n表17-1甲种手术后病人生存率的计算方法时间(月)死亡期初死亡生存生存率T人数人数概率概率11230.0430.9570.95731220.0450.9550.91453210.1430.8570.78363180.1670.8330.65271150.0670.9330.60981140.0710.9290.565102130.1540.8460.47814+0110.0001.0000.478\n表17-1资料的统计描述指标(SPSS软件)SurvivalStandard95%ConfidenceTimeerrorIntervalMean:24.234.99(14.44,34.01)Median:10.006.96(.00,23.63)生存时间的百分位数(表示≥t的比例)Percentiles25.0050.0075.00TimeValue44.0010.006.00SE8.016.961.14\n表17-2资料乙手术方法的统计描述指标SurvivalStandard95%ConfidencTimeErrIntervalMean7.801.18(5.50,10.10)Median6.002.98(.16,11.84)生存时间的百分位数(表示≥t的比例)Percentiles25.0050.0075.00Value11.006.003.00SE1.942.98.77\n甲手术乙手术图17-2两种手术治疗方式术后病人生存曲线的比较月\n2.大样本资料的生存分析方法—寿命表法(Life-tablemethod)表17-32418例男性心绞痛病人生存率情况术后死亡截尾期初校正生存生存率年数人数人数人数人数概率(t+1)0-4560241824180.81140.81141-2263919621942.50.88370.7172-15222169716860.90980.6524校正人数=1962-39/2=1942.5例17-3\n寿命表法的区别1.计算时间段的生存率。2.寿命表方法计算死亡(生存)概率,假定有截尾事件的人在各时间组内平均生存为1/2时间。死亡概率=某时间组内死亡人数/校正观察人数校正观察人数=期初观察人数-截尾人数/2\n第三节生存曲线的统计检验目的:将生存率为整体进行曲线与曲线的比较方法:时序检验(Log-Rank),为非参数法检验,可对两组或多组做比较.检验假设:H0:两总体的生存率相同H1:两总体的生存率不同检验水准α=0.05,如P≤α,拒绝H0\nLog-rank检验检验统计量该χ2服从的自由度=(比较组数-1)Ai为某组各时间点实际死亡数(di)之和.Ti为某组各时间点的期望死亡数(Ti)合计i表示比较组,i=1,2,…k组\nLog-rank检验的基本假定时间甲法手术组乙法手术组合计t12311.6052021.395433如H0成立:χ2统计量的P>0.05表17-4按两组合计死亡率计算理论数\n两生存率曲线的检验结果表17-4资料:ν=组数-1=2-1,p<0.01结论:两生存曲线有差别.根据中位数生存时间和生存曲线的比较,认为甲手术方法生存时间长于乙法.注意:两生存曲线有交叉,可能有混杂因素,应排除后,再做结论.(讲义)\n甲手术乙手术图17-2两种手术治疗方式术后病人生存曲线的比较月\n第四节、COX比例风险回归模型COX模型用于分析多个协变量(x)与风险率(y=死亡、不死亡)的关系,以确定协变量的重要性。方法的优点:1.能处理截尾数据2.适用于分布未知的资料3.排除混杂因子,评价预后(proportionalhazardsregressionmodel,PHREG)\n一、Cox模型的基本形式h(t,x):危险(风险)率函数。表示生存到t时刻的个体死于t+△t的瞬时死亡率。h(t,x):也反映受危险因素(x)的影响,在时刻t的死亡风险率。式中:X:表示与生存率有关的危险因素β:某危险因素的回归系数公式17-15\n单个X的Cox模型及参数的意义Cox模型的表达h(t,x)=h0(t)exp(βx)h0(t):为危险因素为0时在t时刻的基础危险率。比例风险率模型(proportionhazardmodel)与时间t无关的比例因子\nh(t)01.00.20.40.60.81234时间t风险率比例风险率函数示意图\n参数β的意义h(t,x)=h0(t)exp(βx)Β=0,某危险因素(X)与死亡风险无关。Β>0,X值越大,死亡的危险性越大。Β<0,X值越大,死亡的危险性越小。\nβ的反对数值为某危险因素(X)的相对危险度(RR)如某危险因素x取值为1和0,则受x影响和不受x影响死亡的相对危险度是:\n在多变量的Cox回归模型中,βi表示其他因素固定(不变)后,某Xi的两个水平(X=1)与(X=0)相比危险率的倍数。例;讲义多变量的Cox回归模型\n例:讲义283页探讨胃癌患者的预后,X1(手术=1,否=0),X2(放射治疗=1,否=0)Β1的意义:固定放射因素后,做手术病人死亡的危险性为不做手术病人的69.76%。\nΒ1的含义:手术但不放射者相对于不手术不放射者死亡风险的69.%。\n如病人X1=1,X2=1,死亡的风险率为:如病人X1=0,X2=0者:二者的相对危险度:\n二.COX模型的参数估计与假设检验1.回归系数(b)的估计:最大似然法估计2.回归系数(βi)的检验:有Wald检验和似然比检验3.可采用逐步回归法筛选有统计意义的变量。以上计算在统计软件(SAS、SPSS等)均可完成。讲义283页-286页。\n四、COX回归方程在生存分析中 的主要应用(P286)COX模型:h(t,x)=h0(t)exp(Σβixi)1.估计协变量参数(β)和其相对危险度(RR)及可信区间。2.对影响危险率的变量进行筛选3.用预后指数(PI),对个体预后危险性做评价。\n个体预后指数(PI)X’标准化变量值Β’为标准化回归系数PI=0,表示个体危险度为平均水平。PI>0,表示个体危险度大于平均水平。PI<0,表示个体危险度小于平均水平。17-30\n五应用实例:讲义表17-5,病人结局(Y)与影响因素及量化值结果:表17-7变量βSbpRRX41.76160.547910.00135.822X50.93130.444550.03622.53895%的可信区间上限下限X41.98917.039X51.0626.066\n例2、肺癌病人生存时间与有关因素的分析记录75例肺癌病人的生存时间(月)和18个可能与预后有关的因素年龄、性别、得分、类型、分化、分期、淋巴结侵犯、CEA、P53、、P16、放疗、化疗、手术等分析目的:1.筛选出与预后有关的主要因子2.对个体预后危险性进行评价\nCOX回归多因素模型结果(逐步回归法)VariablesintheEquationBSEWaldB’Sig.Exp(B)年龄.064.01713.890.77.0001.066性别-.833.4253.839-0.35.040.435分期.266.1413.5850.51.0051.305CEA.015.0074.2640.50.0391.015NM-.360.2601.920-0.31.001.698结论:对生存时间不利的因素:年龄、分期、CEA有利因素:性别、NM\n个体预后指数估计预后指数方程或预后指数得分(PI)式中b’为标准化回归系数,x’为标准化变量值=\n年龄性别分期CEANM预后指数得分72178012.234613152-1823014152-2.585025202-1.80801613013.2256145910.007...75例肺癌病人预后的得分\n六、Cox模型应用的注意事项(讲义288页)Cox模型要求1.样本例数不能太小,样本例数为协变量个数的5-20倍。2生存资料的截尾数据不能超过20%。3.Y要有一定的死亡例数。4.死亡风险exp(βx)不随时间变化而变化。满足比例风险的要求。\n本章的要求思考题:1.什么数据资料应采用生存分析。2.生存分析的单因素分析和多因素分析各自回答什么问题?3.单因素生存分析中有常用哪几个统计指标,各自表达的含义是什么?4.Cox模型与Logistic回归模型有何不同和相同?

相关文档