- 259.66 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
小胖说统计之一八四:肿瘤临床试验中的统计学问题(一)如果问现在什么药最赚钱,我想很多人都会想到肿瘤药,没办法谁让他是救命的药呢,虽然99.99999%的肿瘤药不能最终挽救生命,而且价格高得离谱,然而人类求生的木能决定了只要你的药有那么一点疗效,他也会不断地去尝试。而抗肿瘤药也因为其新产品多、价格昂贵以及使用人群日益增多,而一举成为各治疗领域药物总销售收入的第一位,每年高达400多亿美元。面对400多亿美元这么一块大蛋糕,各大制药公司対肿瘤领域可谓寸土必争,纷纷推出自己的重磅药品,我们比较熟悉的有罗氏的美罗华、赫赛汀和阿瓦斯汀,诺华的格列卫,阿斯利康的瑞宁得,赛诺菲■安万特的泰索帝等。而研发出一种新的肿瘤药物,就意味着在这个巨大的市场上分得一杯羹,因此各大制药公司都加大了肿瘤药物的研发,现在儿乎每一个大的制药公司后期的pipeline里都可以看见肿瘤药,因此肿瘤药临床试验已成为临床试验中最活跃的领域,据ClinicalTrials.gov的统计,肿瘤领域已成为临床试验数量排名第一的治疗领域。如今,肿瘤临床试验己成为最常见的临床试验,但与别的治疗领域的临床试验相比,肿瘤临床试验在研究目的、终点的选择、数据的分析以及结果的解释等方面都有所不同,从下篇博文开始,小胖将结合口己非常有限的经验,和大家一起分享一下肿瘤临床试验中一些涉及到统计学的问题。。。小胖说统计之一八五:肿瘤临床试验中的统计学问题(二)研究目的(一)开展一项临床试验,首先我们必须有一个研究目的,也就是我们想通过临床试验要解决什么问题,对于肿瘤临床试验也不例外。对于肿瘤临床试验来说,针对疗效常见的主要研究忖的无非分为两种情况:一种情况是证实一种治疗优另一种治疗,而另一种情况是证实一种治疗非劣于另一种治疗。对此,小胖在这里不再赘述,小胖在这里重点讨论的是肿瘤临床试验中关于治疗方案的选择,这一点与很多别的治疗领域有一些不同。下边我们来看一下常见的几种情况:(1)Bvs.A:对于某一种肿瘤疾病,现已存在一种比较公认的治疗(A),我们研发出一种新的治疗(B),这种新的治疗(B)能取得更好的疗效,或者说疗效相当,但在安全性或别的方面更有优势。仮|]1:GordonAN,etal.Long-termsundvaladvantageforwomentreatedwithpegylatedliposomaldoxorubicincomparedwithtopotecaninaphase3randomizedstudyofrecurrentandrefractoryepithelialovariancancer.GynecolOncol.2004Oct;95(l):l-8.这个试验的目的是比较两种化疗药物pegylatedliposomaldoxorubicin和topotecan治疗复发性和难治性卵巢癌,研究设汁为pegylatedliposomaldoxorubicin疗效优于topotecano主要基于这个试验,FDA和EMEA批准pegylatedliposomaldoxorubicin用于钳类基础化疗后进展或复发的卵巢癌患者的治疗。例2:M.E.R.O'Brienletal.ReducedcardiotoxicityandcomparableefficacyinaphaseIIItrialofpegylatedliposomaldoxorubicinHC1(CAELY/Doxil)versusconventionaldoxoiubicinforfirst-linetreatmentofmetastaticbreastcancer.AnnalsofOncology.2004;15:440-449.这个试验的目的是比较两种化疗药物pegylatedliposomaldoxorubicin和conventionaldoxorubicin一线治疗转移性乳腺癌的疗效和安全性的研究,本研究设计为在疗效方面pegylatedliposomaldoxorubicin非劣效于conventionaldoxoiubicin,但在心脏安全性方面pegylatedliposomaldoxorubicin优于conventionaldoxorubicino主要基于这个试验,EMEA批准pegylatedliposomaldoxorubicin用于高危心脏病的转移性乳腺癌患者的单药治疗\n研究目的(二\n(2)A+Bvs.A:某种肿瘤疾病已经存在一个比较成熟标准的治疗A了,我们研发出了一种新的药物B,这种新的药物B和A联用疗效会比单纯只用A治疗更好。例:SlamonDJ,etal.UseofchemotherapyplusamonoclonalantibodyagainstHER2formetastaticbreastcancerthatoverexpressesHER2.NEnglJMed.2001Mar15;344(11):783-92.这个试验的主要目的是比较化疗+trastuzumab与单纯化疗治疗HER2过度表达的转移性乳腺癌。研究设计为化疗+trastuzumab优于单纯化疗。主要基于上述这个试验,FDA批准trastuzumab与紫杉醇联合使用作为转移性乳腺癌HER2(+)患者的一线治疗方案。(3)Surgcry+Avs.Surgery这种情况就是我们通常所说的手术后辅助治疗,即通过手术后使用辅助治疗药物对比单纯手术,来证实A用于术后辅助治疗的作用。这种开发出一种治疗用于术后辅助治疗在肿瘤领域中越来越多,原因吗,很简单,大家都知道肿瘤有相当大一部分是手术治疗,如果你的药物不仅能用于单纯化疗,而且还能用于术后辅助治疗,岂不是你的药物的使用人群大大扩展了。所以现在术后辅助治疗越来越受到重视,很多重磅药物比如格列卫,赫赛汀等都开始向这个领域扩展。例:EggermontAM,etal.Adjuvanttherapywithpegylatedinterferonalfa-2bversusobservationaloneinresectedstageIIImelanoma:finalresultsofEORTC18991,arandomisedphaseIIItrial.Lancet.2008Jul12;372(9633):117-26.这个试验的主要目的是比较III期黑色素瘤手术后使用pegylatedinterferonalfa-2b与手术后观察。研究设计为手术后使用pegylatedinterferonalfa-2b优于手术后观察。主要基于上述这个试验,FDA批准pegylatedinterferonalfa-2blll期黑色素瘤的辅助治疗。当然除了上边提及的手术后辅助治疗,还有手术前新辅助治疗,即在手术前使用化疗或其他治疗药物。小胖说统计之一八七:肿瘤临床试验中的统计学问题(四)研究目的(三)(4)Radiotherapy+Avs.Radiotherapy这种情况和第3种情况类似,在临床试验中,最常见的莫过于同步放化疗与单独放疗的比较。此外还有放疗后辅助化疗,以及放疗前化疗等。下边我们看一个例子:StuppR,etal.Radiotherapyplusconcomitantandadjuvanttemozolomideforglioblastoma.NEnglJMed.2005Mar10;352(10):987-96.在这个试验中,对替莫哇胺同步放化疗与单独放疗治疗胶质瘤进行了比较,结果替莫卩坐胺同步放化疗能取得更显著的生存收益。基于此试验的结果,FDA批准替莫卩坐胺用于同步放化疗治疗胶质瘤。以上小胖提及了儿种简单的肿瘤试验中治疗方案的设计,由于肿瘤治疗涉及到化疗、放疗和手术治疗,而化疗很多情况下都是不同的联合化疗方案,而化疗、放疗和手术治疗三者又可以相互结合,相互结合时三种不同治疗的先后顺序也有不同的组合,所有这一切都决定了肿瘤试验中研究设计特别是治疗方案设计的多样性和复杂性,英实万变不离英宗,我们需要抓住的就是你的主要研究目的是什么,而対治疗方案的不同组合,作为一个统计师也必须有所了解,这一点对你的研究设计也大有裨益。小胖说统计之一八八:肿瘤临床试验中的统计学问题(五)Endpoints(终点)(一)一项临床试验的研究FI的确定后,那么下一步就要确定能提供与研究目的相关且可信的临床证据的终点。关于肿瘤试验终点的选择,也经历了一个长期的发展过程,药物监管机构本身对此也有不同的认识,为此,FDA\n专门针对肿瘤临床试验终点的选择,起草了一个指导原则《GuidanceforIndustryClinicalTrialEndpoints\nfortheApprovalofCancerDrugsandBiologies》,大家可从以卜链接卜载:http://www.fda.gov/downloads/Dnigs/GuidanceCoinplianceRegulatoryInformation/Guidances/ucin07l590.pdf本指导原则的中文翻译版可参见以下链接:http://www.cde.org.cn/attachmentout.do?mothed=list&id=721在FDA的指导原则中,把肿瘤试验的终点分为以下四类:(1)Overallsurvival总体生存(2)EndpointsBasedonTumorAssessments基于肿瘤评估的终点(3)EndpointsInvolvingSymptomAssessment涉及症状评估的终点(4)Biomaikcrs生物标记物从下篇博文开始,小胖先简单地按照以上四个分类对主要的肿瘤试验的终点作一快速简单的介绍,然后结合实例,和大家探讨一下肿瘤试验中终点的选择。小胖说统计之一八九:肿瘤临床试验中的统计学问题(六)Endpoints(终点)(二)肿瘤试验终点一:Overallsurvival总体生存对于种肿瘤药物,病人能从其中获得最大也是最直接的临床益处是什么?当然是生存时间的延长,这也是每个肿瘤病人所苦苦追求的终极忖标。因此,对于肿瘤试验最硬性最直接,也可以说称之为goldstandard(金标准)的终点就是overallsurvival(总体生存期)。什么是Overallsurvival呢?它定义为从随机化到病人因各种原因而死亡的的时间,而且是基于ITT人群的。下边我们来看一下overallsurvival的主要优点和缺点:优点:(1)可靠:生存时间的延长本身就是最直接也是最不容置疑的临床收益。(2)易于测量:病人是生还是死,都是比较容易判断的(3)精确没有偏倚:病人死亡时我们会记录病人死亡的FI期,这一H期一般都是比较精确的,因此在终点测量时不会产生什么偏倚(4)统计学意义可被视为临床意义:生存期的延长无论多大和多少,只要有统计学意义,都可以被视为有临床意义缺点:(1)试验吋I'可比较长:我们需要观察到死亡,必然要求随访吋间要很长(2)样本量比较大:基于死亡事件的检验,死亡差异往往比其他的指标的差异要小,需要入组更多的病人,得到更多的死亡事件,才能检验出差异来(3)容易受其他非试验药物治疗的影响:病人在服用完你的药物后,在较长的生存随访期内如果疾病没有好转或恶化,就可能服用其他别的药物,特别是对于肿瘤病人来说,他是最容易换药的,你无法控制他服用其他的药物,因此对于生存期这种长期随访的评价,很容易受到其他药物的影响。(4)非肿瘤死亡:因为overallsundval中的死亡包括各种原因的死亡,这就意味着一些不是山于肿瘤造成的死亡比如车祸等也被包括在内了,自然对最终的评价也会产生影响。总之,一句话,ovendlsurvival是肿瘤试验的金标准终点,如果条件允许,它应该是我们首选的终点,但我们不得不接受这样一个现实,一旦你选择了ovendlsurvival,就意味着你样本量的增加和试验时间的延长,也就是试验规模的扩大,当然这一切都意味着你成本的增加,这种成本不仅是物力成本,更多的是时间成本,但一切都最终意味着你要付出更多的moneyooo\n歿占(二)\n肿瘤试验终点二:EndpointsBasedonTumorAssessments基于肿瘤评估的终点1.PFS(Progression-Free-Survival,无进展生存期)和TTP(Time-to-Progression,至肿瘤进展吋间)除了overallsurvival,PFS和TTP己成为肿瘤试验中最为常见的主要终点。PFS定义为从随机化到病人出现肿瘤进展或死亡的时间,而TTP则定义为从随机化到病人岀现肿瘤进展的时间。从两者的定义可以看出,两者类似,唯一不同的在于PFS包括死亡,而TTP不包插死亡。在这个意义来说,PFS包押i死亡,更能预测和反应临床收益,因此相比TTP,PFS是首选的终点。PFS作为肿瘤试验的终点有什么主要优点和缺点呢?优点:(1)PFS反应了肿瘤的增长,而肿瘤的增长在很大程度上是造成肿瘤相关死亡的原因,因此具有一个作为替代终点很好的特性。(2)PFS无需非要等到出现死亡事件,因此随访时间会大大缩短(3)相比较overallsurvival,PFS的magnitude会更大,意思是什么呢?同样的两组治疗,两组间PFS的差异往往会比两组间overallsurvival的差异更大,也就是说我们需耍更少的事件数来检验出差异来,这也就意味着病例数的大大缩减。(4)较少受非研究药物治疗的影响。因为病人往往是在药物治疗无效即疾病出现进展的情况后才开始考虑换药,因此对于PFS的测量往往是在病人换药之前,这就使得PFS不像overallsurvival那样容易受非研究药物治疗的影响。缺点:(1)PFS的确认对于许多种类的肿瘤比较困难(2)PFS的测量不如OS精确,因为PFS的测量主要依赖于一些放射学检查,某个病人在某次放射学检查时出现进展,那么它的进展FI期就记录为放射学检查的这一天,其实很可能病人在这次放射学检查前早就出现进展了,只是没有进行放射学检查确定而已,因此在时间精度方面肯定不如死亡时间那么精确,特别是当放射学检查时间隔的比较长时(3)主观偏倚,因为进展与否最终还是由研究者根据放射学检查主观判定的(4)频繁的放射学检查,这一点就不用做过多解释了小胖说统计之一九一:肿瘤临床试验中的统计学问题(八)终点(四)2.DFS(Disease-FreeSurvival,无病生存期)DFS通常定义为从随机化到病人出现肿瘤复发或任何原因死亡的吋间。DFS最常用于手术治疗或放疗后辅助治疗的终点。DFS的主要优点是与OS相比,其病例数和试验时间都会大大减少,主要缺点一是不是精确测量,会产生偏倚;二是其定义在不同的情况下各异。3.ORR(ObjectiveResponseRate,客观缓解率)ORR是指肿瘤大小缩小到预先规定值并能维持最低时限的病人的比例。FDA通常把ORR定义为完全缓解(CR,completeresponse)和部分缓解(PR,partialresponse)的总和。ORR可以测量药物的抗肿瘤活性。当然对于英评价标准,要尽可能地标准化,现在比较通用的是RECIST标准。在使用ORR作为终点时,往往同时汇报缓解持续时间以及完全缓解率的结果。ORR最大的优点在于它可以在单组试验中作为终点。山于ORR不能直接反应临床收益,只能反应少数病人中的抗肿瘤活性,因此缺点就自不必说了。4.TTF(TimetoTreatmentFailure,治疗失败时间)TTF是一个复合终点,定义为从随机化到因任何原因而终止治疗的时间,其中的任何原因包括疾病进展、治疗毒性以及死亡。由于它把疗效和毒性结合在一起,分不清到底是疗效还是毒性的原因导致终止治疗,因此一般不推荐作为药物批准的终点。\n终点(五)\n肿瘤试验终点三:EndpointsInvolvingSymptomAssessment涉及症状评估的终点症状的改善通常被认为是一种临床收益(clinicalbenefit),也确实有很多肿瘤药物的批准使用病人症状的评估来显示症状的改善,从而作为疗效的主要依据。涉及症状评估的终点分为特定症状终点(specificsymptomendpoint)和复合症状终点(compositesymptomendpoint)o特定症状终点如至肿瘤症状进展时间,就是一个直接测量临床收益的终点。而复合症状终点即不是一个症状,而是多个症状的综合,基于复合收益。对于涉及症状评估的终点最大的优势当然是它是直接测量临床收益,缺点也不少,比如肿瘤试验中无法实行盲法,缺失数据较多,测量工具的validation问题等。肿瘤试验终点四:Biomarkers生物标记物什么是biomarkers呢?Acharacteristicthatisobjectivelymeasuredandevaluatedasanindicatorofbiologicprocesses,pathogenicprocesses,orpharmacologicresponsestotherapeuticinlcrvcnlion.比女口常见的前歹U腺癌中的PSA,卵巢癌中的CA125等。但生物标记物可以作为复合终点中的一个组成部分,很少单独作为药物批准依据的终点。以上小胖就肿瘤临床试验中的常见终点做了一简单介绍,从卞篇博文开始,小胖将结合实例和大家一起探讨一下各个终点在肿瘤临床试验特別是作为药物批准依据的试验中的应用。小胖说统计之一九三:肿瘤临床试验中的统计学问题(十)终点(六)上儿篇博文,小胖简要介绍了肿瘤试验中终点的定义和优缺点,下边我们将结合实例和大家探讨一下作为药物审批依据的肿瘤临床试验中终点的选择。说起肿瘤药物审批依据的终点,首当英冲的便是OverallSurvival,它被称为肿瘤试验的金标准终点,如果能显示岀生存的情况,OverallSumval是药物审批的主要依据。意思是说,如果你有条件的话,OverallSurvival是你不二的选择,OverallSurvival对死亡事件可以100%地准确测定,对死亡时间也近乎100%准确测定。尽管OverallSurvival是这么的金标准,但这也并不意味着只有你的药显示出生存情况的改善才能批准你的药物。但据FDA从1990年1月到2002年12月的统计,在所有57个常规审批的药物屮,有近70%的药物是通过其他终点而批准的。当然,小胖在这里需耍说明的是,这只是以前的统计数字,现在对药物的审批越來越严,FDA要求越來越多的试验都要把overallsurvival作为其主要获批终点,但这也不妨碍我们下边对一些非OverallSurvival终点而最后获批的例子的讨论。需要提醉大家的是,很多例子都是casebycase的,并不一定代表普遍性,可能例子中获批的药物,同样的情况放在现在,由于各种政策环境的影响也不一定会获批,因此不能作为大家选择终点的依据,只能供大家参考,关于肿瘤试验终点的选择,涉及的东西比较多,特别是和你是什么肿瘤,是什么治疗情况等都有关,因此最好的办法是和当地的药监部门进行咨询,并征求临床医生的意见,最终确定一个合理的可以接受的终点。对于根据OverallSurvival而批准的药物的情况,小胖就无需进一步举例说明了,下边小胖重点介绍一下其他主要根据非OverallSurvival终点而最后获批的情况。小胖说统计之一九四:肿瘤临床试验中的统计学问题(十一)终点(七)例1:2009年7月31R,FDA批准Avastin联合干扰素alpha治疗转移性肾癌。而此批准的主要依据为BO17705研究的结果,在这项结果中,Avastin治疗的病人的中位PFS延长了5个月。BO17705是一项随机、双盲、安慰剂对照治疗肾切除术的转移性肾癌。试验组和对照组分别为Avastin加"T扰素alpha-2a,以及T扰素alpha-2a加placebo0本研究的主要终点是PFS,分别由研究者以及independentreviewcommittee做出评价。总共入组了649例病人(Avastin加干扰素alpha-2a组327例,干扰素alpha-2a加placebo组322例)。结果发现,Avastin加干扰素alpha-2a组和干扰素alpha-2a加placebo组的中位PFS分别为10.2个月和5.4个月,HR二0.60(95%CI:0.49,0.72),p<0.000l。而independentreviewcommittee的分析结果也类似,分别为10.4个月和5.5个月,HR=().57(95%CI:0.45,0.72)0研究结果并未显示出Avastin加T就素alpha-2a组对比T就素alpha-2a加\nplacebo组在overallsurvival上的显著差异,HR二0.86(95%CI:0.72,1.04),p=0.13.以上这个例子就是一个典型的通过PFS作为主要终点而最后获批的例子。其实在一些肿瘤的二线治疗中,山于这时疾病已经比较严重了,往往会阻止检验出治疗対OS的显著影响,此时PFS可以是一个可以接受的终点。事实上大家会发现,PFS作为主要终点很多的情况是用于一些肿瘤的二线甚至三线治疗的试验中。而一旦PFS选作主要终点,那么OS应该作为次要终点,对其结果进行汇报。从上边这个试验,大家还可以看出一点,就是一旦PFS作为主要终点,我们必须考虑到PFS的偏倚,因此试验屮加入了一个independentreviewcommittee对PFS的评估进行确认,而其他如盲态试验或者盲态核查也是最好推荐使用的。小胖说统计之一九五:肿瘤临床试验中的统计学问题(十二)终点(八)例2:2004年8月18日,FDA批准docetaxel(Taxotere)联合doxorubicin和cyclophosphamide用于可手术的淋巴结阳性的乳腺癌的辅助治疗。在其pivotal试验中,主要终点为DFS,包括局部或远处复发,对侧乳腺癌及任何原因的死亡。其批准的主要依据在于,包含docetaxel的TAC方案在DFS方面显著优于FAS方案,HR=0.74(95%CI:0.60,0.92),P=().0()47。例32004年12月5日,FDA批准ELOXATIN联合5-FU/LV用于完全切除术后的111期结肠癌的术后辅助治疗。FDA批准的依据为MOSAIC研究,这项146个中心2246例病人参加的随机Ill期研究的主要终点为DFS。研究结果发现,与5-FU/LV相比,ELOXATIN联合5-FU/LV能显箸改善PFS,4年DFS分別为61%和70%,p=0.002o以上这两个例子,就是典型的基于DFS来批准药物的例子。DFS的应用最常见于手术或放疗后的辅助治疗,特别是在乳腺癌辅助治疗以及结肠癌辅助治疗中,DFS已经成为药物审批的主要依据和基础。例如在乳腺癌的辅助治疗中,我们耳熟能详的一些肿瘤药物如paclitaxeKTrastuzumabsDoxorubicin、Epirubicin、Tamoxifen>Anastrozole>Letrozole^Exemestane等都是主要依据DFS而获批的。小胖说统计之一九六:肿瘤临床试验中的统计学问题(十三)终点(九)例4:2000年9月26R,CellTherapeutics公司宣布其新药Trisenox(arsenictrioxide)被FDA批准用于复发或标准治疗无效的急性早幼粒细胞白血病。而此审批的pivotal试验为一项在9个中心进行的Trisenox治疗40例复发/难治的急性早幼粒细胞白血病的研允。试验结果发现,70%的病人达到了完全缓解,而且平均在廿始服用Trisenox两个月内便达到完全缓解,并且大多数达到完全缓解的病人在中位期为16个月的随访时间内仍无进展。上边这个例子便是根据肿瘤应答情况(objectiveresponse)即完全缓解来批准药物的一个例子,其实分析起来,有以下儿个原因:(1)研究疾病是非常严重的疾病,目前缺乏有效的治疗,比如复发或其他标准治疗无效的疾病。在这个例子屮,研究的疾病就是复发或标准治疗无效的急性早幼粒细胞白血病,其目前的治疗一般是毒性较高和很少有效的。(2)对于白血病来说,完全缓解与减少感染、出血和血制品的支持疗法有关,所以完全缓解被认为是一种可以接受的临床获益终点而从上例中,大家也会发现其pivotal试验只是一个singlearm试验,这便是前边小胖提及的用Objectiveresponserate作为终点的一大优点,便是可接受单组试验中的缓解率作为审批的依据。其实上边这个例子比较具有代农性,即有时在一些难治或复发的恶性血液肿瘤中,完全缓解可以作为药物审批的依据。小胖说统计之一九七:肿瘤临床试验中的统计学问题(十四)终点(十)\n关于肿瘤试验终点的选择,始终是肿瘤试验研究设计中一项颇具挑战和争议的问题,为此FDA开展一系列项目来评估肿瘤试验的终点,这些项目包括了最为常见的一些肿瘤,如卵巢癌、肺癌、前列腺癌、脑肿瘤、结肠癌、多发性骨髓瘤、急性白血病等。对于每种肿瘤,FDA都将召开一个公开的workshop,提出一些相关的问题,并再ODAC会议上进行讨论,然后形成比较统一的意见或指导。会议参加者包括肿瘤专家、放射学家、统计师、制药公司代表以及病人代表等。关于这些workshop和会议的相关资料,大家可参加卞边这个链接:http://www.fda.gov/Drugs/DevelopmentApprovalProcess/DevelopmentResources/CancerDrugs/ucm094586.htm最后小胖以一句话结束关于肿瘤试验终点的介绍:"Theselectionofanendpointshouldattempttominimizesubjectivityandbiasandpreserveclinicalbenefitobservedinearlierdrugapprovalsfortheindication.''小胖说统计之一九八:肿瘤临床试验中的统计学问题(十五)生存分析(一)前边小胖提到了很多肿瘤试验的endpoints,如overallsurvival,PFS,DFS等,从这些endpoints的定义,我们可以发现它们都有一个特性,就是它们都是研究一种事件(死亡、疾病进展、复发等)所经历的时间,也就是我们常说的timeuntilaneventoccurs,这种数据或变量,我们有一个称呼叫time-to-event,或直接称呼生存数据。怎么对这种数据进行分析呢?我们以前提到的那些常规的统计方法能不能解决呢?我们通过下边这个简单的例子来看一下:对分别接受A和B治疗的1000例肾癌病人迹行5年的随访,研究一下不同的治疗以及一些预后因素(如年龄、性别、病情等)对其存活状况的影响。对于这个数据分析,冇人可能会想到以下的常规的统计方法:(1)Logistic冋归,应变量为两分类变量:生或死(2)线性冋归:把病人从治疗到死亡的时间作为应变量如果采取(1)的方法,那么我们就忽略了病人死亡时间这个重要的信息,如果A组和B组到5年随访结朿时差不多都有80%的病人都死亡,但A组病人大多数都是在1—2年吋死亡,而B组大多数是在4—5年吋死亡,显然B治疗优于A治疗,但采取logistic回归却忽略了这些信息,无法做出精确的估计如果采取(2)的方法,那怎么来处理那些5年随访后还存活的病人呢?如果你把这些病人都排除掉,那么就有可能会丢弃大量数据,导致结果的偏倚,如果你给这些病人赋予一个替代值,比如说都算5年,但毕竟不是真实的数据,那么也会产生偏倚。因此,对于生存数据的分析,常规的统计方法都无法解决,而我们必须引进一种新的统计方法,即专门來对这种occurrenceandtimingofevents进行分析的方法,这就是小胖在下边几篇博文要介绍的生存分析(survivalanalysis)o小胖说统计之一九九:肿瘤临床试验中的统计学问题(十六)生存分析(二)正如小胖在上文中提出的,生存数据的本质是timeuntilaneventoccurs.那么对于生存数据來说,主要由两个要素构成,即event和time。什么是event呢?对于生存分析來说,我们笫一想到的便是死亡,这是一个最常见也是最标准的event。其实event有很多,比如疾病进展、复发、疾病缓解等等。如果真要给event—个定义的话,我想我们可以定义为在某个吋间能发生的质的改变,也就是所谓的qualitativechange,即从〜个离散状态转变为另」个离散状态。比如死亡,是从生的状态转变为死的状态,疾病进展是从未进展到进展的转变。所谓time,是指从病人随访开始直到发生event的时间(年、月、周、天等)。在这里有两个时间点:theoriginoftime即随访开始时间,thetimeofeventoccurrence即event发生的时间,而time则是这两个时间点的差值。对于theoriginoftime,即我们常说的随访开始的时间,在肿瘤临床试验中,这个时间往往是指随机治疗的时间。而对于thetimeofeventoccuiTence,当然最理想的情况是,event—发生你就得知其确切时间,比如死亡,\n一般都能得知其准确时间,但有时其event确切时间可能是未知或模糊的,比如在PFS中,对于疾病进展的判断往往需要一些放射学检查,而放射学检查不是随时随地的,因此实际的疾病进展确切时间和临床判断的疾病进展时间往往是不同的。在简单介绍了,生存数据的定义后,下边小胖将简单介绍一下生存分析中的几个基本概念。小胖说统计之二零零:小胖说统计系列二百篇纪念这是小胖说统计系列的第二百篇,特此纪念!不确定中,蛰伏中。。。这是小胖说统计系列的第二百篇,特此纪念!不确定中,蛰伏中。。。这是小胖说统计系列的第二百篇,特此纪念!不确定中,蛰伏中。。。小胖说统计之二零一:肿瘤临床试验中的统计学问题(十七)在一个肿瘤试验中,每个病人的生存时间可能不尽一致,有的可能一年就死亡了,有的两年死亡,有的五年、十年甚至更长,作为一个临床试验,我们不可能在等待所有病人都死亡后再进行分析,这时就势必会出现一些病人在试验结束时还没有死亡,这样我们在分析时就无法得知这个病人确切的生存时间,这时就会出现我们生存分析中的CensoringoCensoring,国内一般翻译为截尾,通常发生在对于生存时间数据不完全的情况下,即我们无法得知确切的生存时间。通常来说,censoring-般会发生在以下几种情况下:(1)病人在试验结束时还没有发生event(2)病人在试验期间失访(3)病人在试验期间由于别的原因诸如不良反应等退出试验下边小胖通过一个简单的例子,给大家简单介绍一下几种常见的生存情况:研究时间(年)123456AT=3_XBT=6试验结束CT=2退出DT=3试验结束ET=1失访\nFT=2Xa:x代表死亡(1)A病人从研究开始时入组,在3年时死亡,因此A病人生存时间为3年(2)B病人从研究开始时入组,到6年研究结束时仍存活,因此B病人censoring,censoring时间为6年(3)C病人1年时入组,在3年时由于不良反应退出,因此C病人censoring,censoring时间为2年(4)D病人3年时入组,到6年研究结束时仍存活,因此D病人censoring,censoring时间为3年(5)E病人2年时入组,在3年时失访,因此E病人censoring,censoring时间为1年(6)F病人3年时入组,5年时死亡,因此F病人的生存时间为2年小胖说统计之二零二:肿瘤临床试验中的统计学问题(十八)生存分析(四)上篇博文,小胖主要介绍了生存分析中censoring的几种常见原因,并结合例子进行了进一步的介绍,大家可能会发现,在上文中的例子中,所有4个censoring病人都是在随访期开始后由于失访、退出或试验结束导致没有观察到死亡事件,即所有病人的生存时间数据都是在随访开始时间的右侧开始变得不完整的。我们通常把这种类型的censoring叫做rightcensoringo人多数生存数据的censoring都属于rightcensoringo与rightcensoring相对应的便是leftcensoring了,那什么是leftcensoring呢?一句话就是当你开始观察某个对象时,他已经发生eventTo比如,你想研究女孩的月经发生时间,你从女孩12岁时开始随访,可能你会发现有些女孩在你开始随访时,就己经有月经了,那么这就是leftcensoringo生存分析censoring通常都属于rightcensoring,我们对censoring的介绍也主要基于rightcensoring,对leftcensoring,小胖在这里就不做过多解释了。生存分析中的censoring又可以分为TypeIcensoring和TypeIIcensoringo(1)TypeIcensoring:有人称其为fixedtimecensoring,指在临床试验中预先指定一个时间点终止试验,此时产生的censoring即为TypeIcensoringo例如一项随访5年的肺癌临床试验,即到5年时试验结束,由此产生的censoring就是TypeIcensoringo(2)TypeIIcensoring:有人称其为fixedeventcensoring,指在临床试验中预先指定一个evenf数量,如果临床试验中观察到的event达到这个数量即终止试验,此时产生的censoring即为TypeIIcensoringo例如一项1000人参加的肺癌临床试验,我们规定只要观察到600例病人死亡即终止试验,宙此产生的censoring就是TypeIIcensoringo上边小胖主要向大家简单介绍了生存分析中一个最重要的概念之一的censoring,下篇博文开始小胖将简单介绍一下生存分析中的儿个基本的术语。小胖说统计之二零三:肿瘤临床试验中的统计学问题(十九)小胖首先来介绍一下生存分析中的几个基本概念和术语:1.生存函数T:病人生存时间\nt:某个规定的时间那么我们可以得出生存函数S(t)S(t)=P(T>t)生存函数S(t)给岀了病人存活长于某个规定时间t的概率:即S(t)给岀了随机变量T大于规定时间t的概率。t(年)S(t)=P(T>t)1S(1)=P(T>1)2S(2)=P(T>2)3S(3)=P(T>3)上表中S(1)=P(T>1)就表示病人存活长于1年的概率,而S(2)=P(T>2)就表示病人存活长于2年的概率。TheoreticalS(f):S(f)生存函数S(t)=P(T>t),当t=0时,S(0)=P(T>0)=1,因为试验刚开始时病人都活着,因此生存的概率为1;当t=8时,S(co)=p(T>oo)=0,因为如果时间无限拉长,病人终究会死亡的,因此最后生存的概率为0。而且随着t从0到8,S(t)会越来越小,上图就是一个理论的生存函数S(t)o生存分析(六)\n1.风险函数(hazardfunction)风险函数(hazardfunction,h(t))的冃的是确定在t时间发生event的瞬间风险。为了方便大家的理解,下边小胖简单介绍一下这个公式的基本思路:第一步:由于吋间是连续性数据,那么在精确的吋间点t发生事件的概率几乎为0。但是我们可以讨论在一个小的时间间隔t至ijt+At之间发生event的概率,即P(t<=T=t)o第三步:对于p(t<=T=t),At越长,那么在这个间隔内发生event的可能性越大,因此我们需要调整一下,即把它除以At,这时出现的一个重大变化是这时的P(t<=T=t)/At就不再是一个probability,变化前的取值为0—1,而变化后取值可以根据时间刻度的不同为0到无穷。第四步:由于我们确定的是在t时间发生event的瞬间风险,而不是在t到t+At间隔时间,因此我们让At越来越小,直到极限,这就是公式中的limAt0,因此最后形成了上边这个h(t)函数公式人S(t)inpractice:1—0t但在我们实际的临床试验中,实际的曲线不会那么平滑,可能会像上图中的那样呈step状,而且我们的临床试验也不是无限期进行卞去的,因此不是每个研究病人都能观察到死亡的,因此在试验结束时,曲线不会一直下降到0。小胖说统计之二零五:肿瘤临床试验中的统计学问题(二十一)生存分析(七)为了便于大家对hazmxlfunctionh⑴的理解,小胖举个例子。如果你正在驾驶一辆汽车,车速仪上显示60公里/小时,这意味着什么呢?如果你在下一个小时,还是按照现在的情况这样驾驶,即车速仪准确保持60公里/小时,那么你会行驶60公里。当然,在下一个小吋内你可能加速,也可能减速,甚至可能停车,车速仪上显示的60公里/小吋不会告诉你你在下一个小吋内实际能行驶的里稈。它只是告诉你在你看车速仪的那一刻,车有多快。\n和上边例子中的速度类似,hazardfunctionh(t)告诉你的是在t这个时间点发生event的瞬间风险。因此,从这个意义上来说,hazaid有时会被称作rate。在解释hazard值时,你应该知道它测量的时间单位。例如,假设我在某个时间点患感冒的hazard是0.2,测量单位是月,那么就意味着如果我的风险在下一个月保持在这个值的话,预期我会患感冒0.2次;而如果我的风险是2.0测量单位是年,那么假设hazard保持不变,则在下一年预期感冒2次。从上边的解释,我们可以看出可以把hazard解释为每单位时间cvcnl的数量。我们把h⑴取一下倒数,即1/h⑴,即告诉我们在h⑴不变的情况下,到出现event需要的时间。例如这一刻我死亡的hazard是0.0⑹年,那么预期我将还能存活1/0.016=60年,当然这个估计是基于所有关于我的情况都完全保持一致的情况。实际上随着年龄的增加,这个hazard肯定会增加。同样的,上边那个例子,患感冒的hazard是0.2/月,那么估计下次患感冒会是1/0.2=5个月后。小胖说统计之二零六:肿瘤临床试验中的统计学问题(二十二)生存分析(八)与survivalfunction从1开始向0不断下降的图示不同,hazardfunction可以从任何地方开始,并向上向下向任何方向发展,如下图。不难看出hazard有以下两个特点:(1)它总是大于等于0的(2)它没有上限而具体到hazardfunction,如上图,我们一般有以下几种情况:(1)hazard保持不变(constanthazard)当hazard保持不变时,我们称这时的生存分布为指数分布(exponential),指数分布是生存分布中最简单、最重要的分布,其重要性类似于正态分布在其他统计领域中的应用。(2)hazard随着时间而上升当hazard随着时间而上升,我们称这时的生存分布为IncreasingWeibull分布。举个例子,一些治疗无效的肿瘤病人可能随着时间的增加,其疾病会逐渐恶化,因此死亡的可能越来越大。(3)hazard随着时间而下降当hazard随着时间而下降,我们称这时的生存分布为DescreasingWeibull分布。举个例子,某生命危重的病人经过手术后慢慢恢复,手术后随着时间延长,其死亡的风险可能会降低(4)hazard随着时间先增加后下降当hazard随着吋间先增加而后下降,我们称这吋的生存分布为lognormal分布,比如结核病人死亡风险早期先增加,而后便下降。上面小胖主要介绍了生存分析屮的两个function,即survivalfunctionS(t)和hazardfunctionh(t)0对于生存分析来说,S⑴比较简单,能直接描述受试者的生存状况,应用比较广泛,而h(t)本身也有很多优势,如他以川來确定某些特定的模型比如前边提及的指数分布、Weibull分布、lognormal分布等,另外生存分析的模型一般也是hazardfunction为基础的。当然h(t)和S(t)两者之间也是可以转化的,即通过一个可以计算另一个,具体的公式,小胖就不在这里做过多解释了,在实际的分析过程中,电脑程序会帮你进行转换,我们这里需要记住的一点就是,h⑴和S⑴两者中,你只要知道一者,就可以直接得出另一者。小胖说统计之二零七:肿瘤临床试验中的统计学问题(二十三)上几篇瞎文,小胖主要介绍了生存分析中的两个基本术语和概念survivalfunctionS(t)和hazardfunctionh(t),下边我们正式进入生存分析的核心内容。\n一提到肿瘤试验的统计分析方法或者说一提到牛存分析的方法,很多人的第一反应会出现两个名词,Kaplan-Meier和log-rank检验。确实这两个词是在肿瘤试验结果报告中出现频率最高的两个词。那到底什么是Kaplan-Meier和log-rank呢?首先我们开始从Kaplan-Meier讲起。Kaplan-Meier是临床试验中应用最为广泛的用来估计survivalfunction的方法,其实质叫product-limit法(PL法),由于是Kaplan和Meier这两个人提出的,因此后人一般都叫它Kaplan-Meier法。下边小胖结合一个例子,给大家简单介绍一下Kaplan-Meier法。例:A和B两种药物治疗白血病,生存状况如下(月)结果如下:A组:10,2,12+,13,18,6+,19,24+,9+,8B组:2+,13,7,11+,6,1,11,2,4+,6+代表censored首先我们把上边这个数据,整理成生存分析的基本数据结构,这个基本数据结构也是SAS数据库中的生存分析的基本数据库。PATINETMONTHSTATUSTREAT001101A00220B00321A004131B00571B006120A007110B008131A009181A01061B01160A\n012191A01311B014111B015240A01621B01740B01890A01961B02081A小胖说统计之二零八:肿瘤临床试验中的统计学问题(二十四)下边我们来看一下Kaplan-Meier法的貝体思路:我们先以A组为例,10,2,12+,13,18,6+,19,24+,9+,8首先按大小排序:2,6+,8,9+,10,12+,13,18,19,24+形成下边这个表格:t(j)Numberofsubjectsleftatleasttotimet(j):njNumberoffailuresmjNumberofcensoredqj210106901\n88109701106101250113410183101921024101说明:(1)第一列t(j),是根据进行排序后的所有时间点(2)第二列nj在t(j)前至少还剩下的病人数量,比如刚开始2个月前都在试验屮,那么剩余10人;比如到8个月开始时,由于前边1个人在2个月时死了,1个人在6个月时censored,那么在8个月前还剩下8个人(3)第三列mj为这个时间死亡的病例数(4)第四列qj为这个时间censoring的病例数上边这个表格就是Kaplan-Meier法计算survivalfunction的基本要素,下一篇博文,小胖将介绍如何通过这个表格计算survivalfunction。小胖说统计之二零九:肿瘤临床试验中的统计学问题(二十五)上篇博文中,小胖根据数据形成了以下表格:t(j)Numberofsubjectsleftatleasttotimet(j):njNumberoffailuresmjNumberofcensoredqj21010\n690188109701106101250113410183101921024101下边我们开始计算S(t):t(j)Numberofsubjectsleftatleasttotimet(j):njNumberoffailuresmjNumberofcensoredqjS(t(j))210101x9/10=0.969010.9x9/9=0.988100.9x7/8=0.787597010.7875x7/7=0.7875106100.7875x5/6=0.6563125010.6563x5/5=0.6563134100.6563x3/4=0.4922183100.4922x2/3=0.3281192100.3281x1/2=0.1641241010.1641x1/1=\n0.1641小胖说统计之二一零:肿瘤临床试验中的统计学问题(二十六)生存分析(十二)上一篇陣文,小胖计算岀了各个死亡时间点的S(t),这时我们就可以时间点为横坐标,以S⑴为纵坐标绘制K・M生存曲线了。上图就是小胖手绘的一个粗略的K・M生存曲线。从上边这个曲线,其实你可以看出中位生存期,以及诸如12个月生存率,24个月生存率等数据,只要你根据横纵坐标的对应关系就可以得出,比如上例中,中位生存期为13个月,12个月生存率为0.6563,24个月生存率为0.1641,当然这些数据的值都可以直接通过SAS程序从SASoutput中可以得出。而这些变量或指标也是我们常见的在肿瘤临床试验结果报告中对生存情况的常见描述。同样的方法,我们可以得出本例中B组的K・M曲线以及一些参数值。在这里小胖就不再赘述了。上边,小胖向大家介绍了Kaplan-Meier方法及生存曲线,而Kaplan-Meier则是肿瘤临床试验中对生存时间描述性统计方法,那有了对生存时间的描述,那怎么來比较治疗组间生存时间是否有差异呢,这就要涉及到另一个我们耳熟能详的方法Log-rank检验,下一篇博文,小胖将简单介绍一下Log-rank检验。小胖说统计之二一一:肿瘤临床试验中的统计学问题(二十七)上边小胖简单介绍了Kaplan-Meier法,下图是上边那个实例最后形成的两组A和B组病人的KM曲线如下:那么A组和B组牛存时间到底有没有差别呢?这时我们最常用的统计方法便是Log-rank检验。我们首先来看一下Log-rank检验的检验假设:HO:SA(t)=SB(t)H1:SA(t)*SB(t)即检验A组和B组的生存分布是否相同,即检验上边图中的两个生存曲线的分布是否相同。Log-rank检验通常也被人称为Mantel-Haenszel检验,具实Log-rank检验其实就是Mantel-Haenszel的应用,下边我们结合上边这个例子,来对Log-rank检验的具体方法作一简单介绍。原始数据:\nB组:2+,13,7,11+,6,1,11,2,4+,6(1)两组合并进按时间进行排序,得出时间点:1,2,4,6,7,8,9,10,11,12,13,18,19,24(2)根据时间点形成下列表格时间期初总数死亡Censoring生存期初总数死亡Censoring生存11000101010921010991174900970166901862047800841038810730039701630031061053003115005311112501410011341031100183102000019210100002410100000\n小胖说统计之二一二:肿瘤临床试验中的统计学问题(二十八)生存分析(十四)\n上篇对于log-rank检验方法的介绍中,我们已经根据吋间点把生存数据转换成了多个2x2表了,下一步就开始按照Mantel・Haenszel方法继续了…(1)对每个2X2表中的(1,1)格子计算其总观察数(0),即把每个2X2表中的(1,1)格子中的数值相加得总观察数(0):0=0+14-0+0+0+1+0+1+4-0+0+1+1+1+0=6(2)对每个2X2表中的(1,1)格子计算其期望数第一个表格:E1=(10X1)/20=0.5第二个表格:E2=(10X2)/9=2.22依次类推。。。得到剩下的表格的(1,1)格子期望数分别为0,1.2,0.67,0.73,0,0,0.63,0,1.6,1,1,0(3)求以上期望数的总和EE=9.55(4)计算每个表中的(1,1)格子观察数的方差,然后把所有方差相加得到总观察数0的方差每个表中的方差计算方法是:(a+b)*(c+d)*(a+c)*(b+d)/[n*n*(n-1)]例如第一个表格为10X10X1X19/【20X20X(20-1)]=0.25依次类推得岀每个表格的方差,然后加起来得岀总的方差记作V(5)形成检验统计量卡方值=(OE)的平方除以V即X2=(0-E)2/V这里需要说明的一点是,在-•般的Mantel-Haenszel检验中,対卡方进行了较正,即分子为(0・E)的绝对值再减去个0.5后的平方值,而在Log-rank及SAS程序PROCLIFEFEST'p未进行校正,及没有减0.5。(6)最后根据卡方值来确定p值如小胖前边介绍的,log・rank其实就是采用了Mantel-HaenszeI的方法,从这个意义上来说log-rank也可以被叫做Mantel・Haenszel法。小胖说统计之二一三:肿瘤临床试验中的统计学问题(二十九)生存分析(十五)上几篇博文中,小胖简单介绍了Log-rank检验,它主要用来检验治疗组间S(t)是否相同,是生存分析中最为常见的统计方法之一。那么除了Log-rank检验外,还有什么其他方法可以检验治疗组间S(t)是否相同呢?其中最为常见的一种便是Wilcoxonl^st。在上篇博文对log-rank检验方法的介绍中,大家可能会发现,log・rank检验是把每个时间点四格表中的观察数相加得出总的观察数0,然后每个时间点四格表中的期望数相加得出总的期望数E,然后形成卡方统计量。这种简单的把每个时间点四格表中观察数和期望数的相加,其实是赋予每个四格表同等的权重,即每个时间点地位是一样的。而WilcoxonTest则対不同的时间点赋予不同的权重,它更重视生存曲线开始时的时间点,赋予前边的时间点更多的权重。因此,从这个意义上来说,WilcoxonTest可以用来评价某种治疗是不是在治疗早期疗效比较强,而随着时间的延长疗效会变弱。具体关于WilcoxonTest的计算方法,小胖就不在此做进一步的介绍了。无论是log-rank还是Wilcoxonlest,都可以通过SAS程序PROCLIFETEST来实现,而通过PROCLIFETEST,我们可以对S(t)进行估计和比较。PROCLIFETEST程序如下:PROCLIFETESTPLOTS=(S);TIMEMONTH*STATUS(0);\nSTRATATREAT;RUN;在SASOUTPUT中,会产生两组的KM生存曲线,并列djlog-rank和WilcoxonTest的结果。细心的同学可能还会发现,除了log・rank和WilcoxonTest的结果,在output中还有一项是一2log(LR),其实它是另一种检验方法即likelihoodratiotest。具体说来,log・rank和WilcoxonTest都属于非参数检验,即对数据分布没有任何假设要求,而likelihoodratiotest则属于参数检验,它要求生存概率在整个研究时间内保持不变,即所谓的exponential分布,而这一点是比较难以达到的,总之,我们现在应用最多的还是log-ranktesto小胖说统计之二一四:肿瘤临床试验中的统计学问题(三十)生存分析(十六)对于S(t)的估计,除了KM法外,还有life-table法与KM法把所有eventtimes都列出不同的是,life-table法可以把eventtimes分成不同的interval,当然这个interval4以根据你的需耍可长可短。但是interval的选择却是个问题,这样就会带來很多的不确定性。另外,需要指出的一点是,对于同一个interval内censored的病人,life・table法把他们都视作在interval的中间那个时间点censored»即它假设同一个interval内的censoredtime是一致的。对于life-table法的SAS实现,只需在PROCLIFETEST后加method=life选项,而如果你要自己规定interval的长度,可以通过以下两种方法:(1)width=w选项,这样interval就从[0,w)开始,然后后边每次增加w(2)lntervals=abc--,那么a,b,c…就是相应interval的cutpoints,即区间为[0,a),[a,b),[b,c)…小胖说到这里,有的同学会问了,如果你用了life-tableii,而且述有不同的interval的选择,那么log-rank的结果会不会不同?其实大可不必担心这个,因为log-rank包括wilcoxon的计算都是基于未分组即未分成interval的数据,因此它不会受interval选择不同的影响。另外,对于log-rank来说,在对组间S(t)比较时,也可纳入一定的协变量,即通过PROCLIFTEST程序中增加TEST步来实现,虽然可以筛选一些数值型协变量,但尚不足以能在控制其他协变量的棊础上来确定变量的效应。因此如果存在协变量,在更多的情况下,我们需要采用回归模型的估计,这时最常见的便是8X回归,从下一篇博文开始,小胖将介绍生存分析中另外一种最常见的分析方法COX回归。小胖说统计之二一五:肿瘤临床试验中的统计学问题(三十一)生存分析(十七)与前边小胖提及的log-rank检验一样,Cox回归是另-•种常见的生存分析的方法,它主要用于带有协变量的生存分析资料。比如在肿瘤临床试验中,可以使用Cox回归在调整年龄、病程及疾病稈度等因素的情况下,比较两组治疗的生存时间。Cox回归全程应该叫做CoxProportionalHazardsModel,它是rtl英国统计学家DavidCox于1972年提出的,当时这篇著名的文章”RegressionModelsandLifeTables”嫌在JournaloftheRoyalStatisticalSociety,SeriesBo这篇文章的深远意义无可估量,在1992年的ScienceQtationIndex中,这篇文章被引用超过800次,成为整个统计学文献中引用频次最高的文章。Garfield(1990年)曾指出这篇文章的累积引用次数已排在所有科学文献的前100位。CoxProportionalHazardsModel现在已成为生存分析中的最主要分析方法。为什么CoxProportionalHazardsModel会这么流行?首先,我们先从认识CoxProportionalHazardsModel的基本公式开始。h(t)=hO(t)*exp((31X1+(32X2+...+pkXk)CoxPHModel的公式可以分为两部分:(1)hO(t)(2)exp(31X1+32X2+...+BkXk)第一部分hO(t)叫做baselinehazardfunction,第二部分中X1,X2・・・Xk表示协变量,而B1,k则表示X1,X2…Xk的系数,而这B值则反应了协变量在这个模型中的重要性,而后边的统计推断则主\n要基于此。第二部分实际上就是k个协变量的一个线性函数然后再取指数。从以上可以看出,CoxProportionalHazardsModel的公式其实是一个比较简单的公式,那么为什么它那么popular呢,它的玄机到底在哪里呢?下一篇博文,小胖将深入介绍一下这个CoxProportionalHazardsModel的公式。生存分析(十八)上篇博文,小胖简单介绍了CoxProportionalHazardsModel的基本公式:h(t)=hO(t)*exp(piX1+P2X2+...+pkXk)其实这个公式中最大的玄机便在于hO(t)部分。hO⑴为什么叫baselinehazardfunction呢?从上边公式可以得出,如果所有的x值都等于0的话,那么h(t)=hO(t),另外如果对这个model进行reduce,不纳入x,那么还是h(t)=hO(t),因此我们nJ以把hO(t)看作是不考虑任何协变量前基线或起始版的hazardfunction。另外,关于hO(t)最重要的一点便是它是一个unspecified的非负数基础风险函数,即CoxPHmodel不需要你选择某种特定的概率分布來描述survivaltimes,因此CoxProportionalHazardsModel是一个semiparametricmodel(半参数模型),即:(1)对hO(t)没有任何assumption(模型的非参数部分)(2)反应协变量对hazard的影响的部分即exp(B1X1+B2X2+...+BkXk)(模型的参数部分)而CoxPHmodel这一semiparametric的特性正是它如此流行的一个重要原因。大家都知道,生存分析中有很多分布,如指数分布、weibull分布等等,如果确认生存时间服从某种特定的分布,我们就可以采用相应的参数模型。但是很多情况下,尽管我们有很多方法来评估参数模型的拟合优度,但我们还是可能无法完全确认我们给出的参数模型是否是准确的。这时CoxPHmodel就是一个安全的选择,它対生存分布没有特定要求,你就不必担心你会选择错参数模型了,而R其得出的结果与你选择正确的参数模型得出的结果十分类似。因此从这个意义上来说,CoxPHmodel是一个robust的model。小胖说统计之二一七:肿瘤临床试验中的统计学问题(三十三)生存分析(十九)CoxProportionalHazardsModel的基本公式:h(t)=hO(t)*exp(piX1+P2X2+…+pkXk)假设两个不同的受试者i和j他们的x值各不同,分别记为Xi1,Xi2・・・Xik;Xj1,Xj2・・・Xjk.那么这两个受试者的风险比为:hi(t)/hj(t)={hO(t)*exp(plXil+p2Xi2+...+pkXik)}/{hO(t)*exp(plXjl+p2Xj2+...+pkXjk)}=exp{pi(Xil-Xjl)+p2(Xi2-Xj2)+...+pk(Xik-Xjk)}如上所示,这种一个individual的hazard除以另一个不同individual的hazard,就是我们通常所说的hazardratio,简称HRo从以上这个HR的计算结果,大家不难看出一个很重要的变化就是分子和分母的hO(t)—除被去除掉了,这意味着什么?HR不依赖于时间t了,即和时间没啥关系了,也就是说HR随着时间的变化不会发生变化。换句话说,Thehazardforanyindividualisafixedproportionofthehazardforanyotherindividualo这就是为什么这个模型叫做ProportionalHazardsModelo如果根据这个模型,画任意两个受试者的logh(t),那么由于两者的HR不随时间的变化而变化,那么这两条Hazard曲线理论上应该是平行的,如下:小胖说统计之二一八:肿瘤临床试验中的统计学问题(三十四)生存分析(二十)CoxProportionalHazardsModel的基本公式:h(t)=hO(t)*exp(p1X1+(32X2+…+pkXk)前边小胖说过了CoxProportionalHazardsModel是一个semiparametricmodel,hO(t)为其非参数部分,而exp(B1X1+B\n2X2+...+PkXk)为其参数部分。对于exp(P1X1+P2X2+...+BkXk),其参数P如何估计呢?这就是所谓的CoxPHmodel的参数估计,具体方法为maximumlikelihoodestimates(ML,最大似然估计法),或者更为准确的说叫maximumpartiallikelihoodo为了便于大家的理解,在具体展开CoxPHmodel参数估计前,小胖和大家一起复习一下ML。ML(最大似然估计法)是首先由德国著名数学家Gauss在1821年提出的,后來由英国统计学家Fsher于1912年在其一篇文章中重新提出,并且证明了这个方法的一些性质。因此,后人提到这个方法,都归功于Fisher。那什么是最大似然估计法呢?一句话最大似然估计法是建立在最大似然原理基础上的求点估计的方法。呵呵,感觉有点废话是不是,那我们先从最大似然原理说起吧。我们先来看一个例子:假设我们现在有两个个外形完全相同的箱子,A箱子里有99个黑球,1个白球;B箱子里有99个白球,1个黑球。我现在从A,B这两个箱子中随机抽取一个箱子,然后从这个随机抽取的箱子里,再随机抽取一个球,结果拿出来发现是黑球。请问我抽取的这个箱子是A箱子还是B箱子?我们可以做这样的分析,如果是A箱子的话,那么黑球的概率是99%,如果是B箱子的话,那么黑球的概率只有1%。一个99%,—个1%,那么认为是A箱子,应该更合理吧,或者说这个球更像是从A箱子拿出来的,因此咱说是从A箱子拿出来的。这种判断方法符合我们实践经验,其实这里我们利用到的思想就是最大似然的思想。或者通俗点,我们来看最大似然的英文maximumlikelihood,直译过来就是“看起来最像”,在这个例子中就是说看起来这个黑球最像是从A箱子里拿出来的。上升到理论的高度,最人似然原理的直观思想就是在试验中概率最大的事件最有可能岀现。因此,一个随机试验,如有若干个可能的结果A,B,C…,若在一次试验中,A结果出现,则一般认为A出现的概率最大。小胖说统计之二一九:肿瘤临床试验中的统计学问题(三十五)生存分析(二十一)了解了最大似然原理,而最大似然估计则是通过构建似然函数,求似然函数达到最大时参数的取值。而具体到CoxPHmodel的参数估计,为了便于大家的理解,我们从下边这个例子开始讲起。(1)甲、乙和丙三个人每个人手上有一个彩票放到箱子里,我们抽三次,如果某人的彩票被抽中了,他的彩票就会从箱子里拿岀来,请问三次抽取的彩票顺序为甲、乙和丙的概率有多大?分析:甲的彩票第一个被抽中的概率应该是1/3,一旦甲被抽中后,那只剩下乙和丙的彩票,那么第二次抽中乙的概率为1/2,甲和乙都被抽中了,那只剩下丙了,最后一次抽中的肯定是丙。因此三次抽取的彩票顺序为甲、乙和丙的概率应该是:P=1/3*1/2*1/1=1/6(2)甲、乙和丙三个人分别有3张、2张和1张共6张彩票放到箱子里,我们抽三次,如果某人的彩票被抽中了,他的彩票就会从箱子里拿岀来,请问三次抽取的彩票顺序为甲、乙和丙的概率有多大?分析:一共有6张彩票,其中3张为甲的,那么甲的彩票第一个被抽中的概率应该是3/6,—旦甲被抽中后,那只剩下3张乙和丙的彩票,其中乙有2张,因此第二次抽中乙的概率为2/3,甲和乙都被抽中了,那只剩下丙了,最后一次抽中的肯定是丙。因此三次抽収的彩票顺序为甲、乙和丙的概率应该是:P=3/6*2/3*1/1=1/3其实我们可以把上边这两个例子与CoxPHmodel相对应起来:甲、乙、丙三个人对应的是受试者三次抽取的时间点对应的就是event的时间点抽中彩票对应的是发生event彩票张数对应的是受试者协方差甲、乙、丙的顺序则代表着受试者发生event的顺序三次抽取的彩票顺序为甲、乙和丙的概率计算P则对应的是似然函数具体怎么理解呢,下一篇博文我们来具体看一下。。。\n生存分析(二十二)上篇博文中,小胖把抽彩票和CoxPHmodel相对应起来了,现在我们再进一步解释一下:PatientTIMESTATUSFAMILY001110002211003300004411注:TIME:生存时间STATUS:1代表死亡0代表censoringFAMILY:家族史1代表有0代表无根据上边这个例子,我们可以建立下面这个CoxPHmodel:h(t)=h0(t)*exp(0i*FAMILY)那么受试者的hazard如下:PatientHAZARD001ho(t)*exp(O)002h0(t)*exp(PJ003ho(t)*exp(O)004h0(t)*exp(Bi)从上边这个表可以看出,受试者的hazard取决于是否有家族史。下边我们来看一下似然函数的构建思路:TIME=1年时,所有4个病人都有可能死亡,因此001病人死亡的概率应该为001病人的hazard除以所有4个病人的hazard的总和,即[ho(t)*exp(O)]/[ho(t)*exp(O)+h0(t)*exp({3J+ho(t)*exp(O)+ho(t)*exp(0i)];TIME=2年时,由于001病人在1余时死掉了,因此这时只剩下3个病人,这时002病人死亡的概率应该为002病人的hazard除以002,003和004三个病人hazard的总和,即[ho(t)*exp(Bi)]/[h0(t)*exp(Pi)+ho(t)*exp(O)+h0(t)*exp(Bi)];003病人在TIME=3年时censoring,而在TIME=4年时,只剩下004—个病人了,那么此时004病人死亡的概率为004病人的hazard除以自己一个人的hazard,即[h0(t)*exp(Pi)]/[h0(t)*exp(3i)]o因此最后似然函数为:L={[ho(t)*exp(O)]/[ho(t)*exp(O)+h0(t)*exp(Bi)+ho(t)*exp(O)+h0(t)*exp(Bi)]}X[h0(t)*exp(Bi)]/[h0(t)*exp(Bi)+ho(t)*exp(O)+h0(t)*exp(PJ]X[h0(t)*exp(Bi)]/[h0(t)*exp(Bi)]上边似然函数为三个项目的乘积:L=LiX|_2XL3Li=[ho(t)*exp(O)]/[ho(t)*exp(O)+h0(t)*exp(Bi)+ho(t)*exp(O)+h0(t)*exp(Bi)]L2=[h0(t)*exp(Bi)]/[h0(t)*exp(Bi)+ho(t)*exp(O)+h0(t)*exp(Bi)]L3=[h0(t)*exp(Bi)]/[h0(t)*exp(Bi)]而这LiL2L3对应的则是三个排序的死亡时间点(1,2和4年),而这三个项中分子为在这个时间点死亡的受试者的hazard,分母为这个时间点时剩下的所有受试者的hazard的总和。\n因此,CoxPHmodel的构建是基于observedorderofevents,而不是基于events的分布,因此从这个意义上来说,CoxPHmodel的参数估计其实是partiallikelihood.通过上边思路的叙述,大家这时可以和抽彩票例子结合起来理解了吧。。。小胖说统计之二二一:肿瘤临床试验中的统计学问题(三十七)生存分析(二十三)L={[hO(t)*exp(0)]/[hO(t)*exp(0)+h0(t)*exp(P1)+hO(t)*exp(0)+h0(t)*exp(61)]}X[hO(t)*exp(Pl)]/[hO(t)*exp(P1)+hO(t)*exp(0)+hO(t)*exp(Bl)]X[h0(t)*exp(Pl)]/[hO(t)*exp(B1)]大家不难看岀,上边函数式中的hO(t),可以从分子分母中消除掉,即得到:L={[exp(0)]/[exp(0)+exp(B1)+exp(0)+exp(Bl)]}X[exp(01)]/[exp(B1)+exp(0)+exp(Bl)]X[exp(B1)]/[exp(B1)]这也从一方面说明hO(t)无需在CoxPHModel中规定,因为它在参数估计过程中根本没啥作用。另外需要说明的一点是,虽然CoxPHmodel似然函数只考虑死亡病人的概率(上例中为001,002和004病人的概率),没有考虑censored病人的概率(003病人的概率),但是censored病人也参与了整个似然函数的构建,虽然分子上没有考虑,但分母则考虑了censored病人,即病人一旦censoringT,就不会出现在下一个时间点上的分母上了。最后需要强调的一点是CoxPHmodel似然函数是基于orderofevents,而不是所谓的生存时间的分布。例如上例中的时间点1,2,3和4年,我们把它换成5,6,7和8年,只要时间排序一样,似然函数都会是一样的。上边小胖举了一个简单的例子(4个病人,1个协变量)来介绍了CoxPHmodel似然函数的构建,根据这一思路,我们可以扩展到多个病人,多个协变量,构建CoxPHmodel似然函数。CoxPHmodel似然函数构建后,下一步就是求参数了,即参数取什么值,CoxPHmodel似然函数L才能达到最大。具体思路便是对似然函数取对数,然后建立似然方程,然后解似然方程从而得到最大似然估计值。具体计算方法,大家可参见相关数理统计书籍,小胖在此就不做进一步叙述了小胖说统计之二二二:肿瘤临床试验中的统计学问题(三十八)生存分析(二十四)上几篇博文,小胖向大家简单介绍了CoxPHmodel的参数估计,那有了参数估计,那怎么进行假设检验呢?最为常见的有两种检验方法即WaldZ-tests和likelihoodratiotests。1.WaldZ-tests对于大样本量(主要指的是events)的研究,参数估计是近似正态分布的。那么我们就可以通过参数估计值及其标准误来建立统计量。此时,检验无效假设为3i=0,而统计量Z即参数估计值与其标准误的比值服从标准正态分布。2.Likelihoodratiotests由于CoxPHmodel是基于1ikelihood的方法,因此我们也可以通过Likelihoodratiotests进行检验。具体方法就是计算两个模型的对数似然函数值,一个为简单模型,另一个为复杂模型,其中复杂模型相比较简单模型增加了你要检验的变量。通过似然值的高低来判断这两个模型哪一个更适合。通俗地理解,如果简单模型适合,那么你在复杂模型中增加的变量就没有显著意义,如果复杂模型适合,那么你在复杂模型屮增加的变量就有显著意义。而具体怎么来判断呢?Likelihoodratiotests就提供了下边这个公式:LR=2*(lnLl-lnL2)其中L1为复杂模型的似然值,L2为简单模型的似然值。LR近似符合卡方分布,自由度为复杂模型中增加的变量的个数。\n大多数情况WaldZ-tests和likelihoodratiotests的结果相似,但可能不会完全相同。当样本量比较大或者说hazardratio接近1的吋候,两者的结果越接近。而对于那些events比较少的研究,likelihoodratiotests给出的p值更为精确,因此这时推荐1ikelihoodratiotests。统计学家们也一般认为1ikelihoodratiotests比WaldZ-tests有更好的统计特性。小胖说统计之三:肿瘤临床试验中的统计学问题(三十九)生存分析(二十五)在肿瘤临床试验的结果报告中,我们会经常看到试验组和对照组hazardratio及其95%可信区间,前边小胖也稍微提及了一点hazardratio,从这篇博文开始,小胖将花一点篇幅,给大家简单介绍一下hazardratio0什么是hazardratio呢?hazardratio简称HR,我们一般翻作风险比,通俗地说,在肿瘤临床试验中一般是指试验组出现事件的风险(hazard)与对照组出现事件的风险(hazard)之比。关于hazard,小胖己在前边有过较为详细的介绍,在此就不再做赘述了。CoxPHmodel提供了对HR及其95%可信区间的估计。首先我们来看一下HR的点估计:'HR二exp「Bl(Xil-Xjl)+*P2(Xi2-Xj2)+・•・+"Bk(Xik-Xjk)}假设我们只关心一个变量治疗组情况即分为试验组和对照组,那么此吋只有一个变量,k=l,Xil=l代表试验组,Xjl=O代表对照组,那么试验组对比对照组的"HR=exp「Bl(Xil-Xjl)}=exp「B1(1-0)}=exp「B1)。而“31则是前边提及的P1的最大似然估计值。而其95%可信区间的计算过程如下:(1)先计算的95%可信区间(2)对上边计算的上下限取exp,即得最后得95%可信区间的上下限即exp("Bl±1.96*S“B1)上边我们简单介绍了HR在CoxPHmodel中的估计,下一篇博文小胖将重点介绍一下对HR的理解以及结果的解释。小胖说统计之二二四:肿瘤临床试验中的统计学问题(四十)生存分析(二十六)假设一项肿瘤临床试验中,冇两个药物A药和B药,主要终点为总体生存时间。那么A药与B药的死亡风险比HR应该理解为A药治疗组死亡的风险除以B药治疗组出现死亡的风险,简言之,就是A药相对于B药的死亡风险。如果HR>1,则说明A药相对于B药出现死亡的风险升高,如果HR<1,则说明A药相对于B药出现死亡的风险降低。而增加或降低风险的多少,则通过HR-1或1-HR来得到。举例如下HR二1.5,A药相对于B药出现死亡的风险升高0.5或50%HR二0.7,A药相对于B药出现死亡的风险降低0.3或30%对于HR的理解,我们需要把它和mediantimeratio区别开来,有的人把hazardratio和两组中位生存时间的比值即mediantimeratio混为一谈,实际上这是两种不同的measuresoHazardratio是基于hazard的,而mediantimeratio是基于time的。前者讲的是风险,是几率;而后者确切描述了treatmentmagnitudeo通俗地说,HR描述了病人接受某种治疗后生存时间延长的几率,而不能提供这种治疗到底能延长多少生存时间。因此,我们在对肿瘤临床试验生存分析的结果进行汇报时,往往同时汇报Hazardratio以及各治疗组的mediantime。下边就是是一段常见的关于肿瘤临床试验中总体生存时间结果报告的范例:Themedianoveral1survivalwassignificant1yIongerinthegroupreceivingdocetaxel,cisplatinandfluorouraci1(18.8months)thaninthegroupreceivingcisplatinandfluorouraci1(14.5months)-Thehazardratiowas0.73(95%CT0.56,0.94;p二0.02).小胖说统计之二二五:肿瘤临床试验中的统计学问题(四十一)生存分析(二十七)说完Hazardratio,小胖接着仔细说一下CoxPHmodel的PHAssumption。CoxPHmodel的PHAssumption\n要求Hazardratio是保持不变的,不随时间的变化而变化。关于这一点,《小胖在小胖说统计之二一七》中已从CoxPHmodel的公式方面做出了解释,小胖就不在此赘述了。这篇博文中,我们将着重关注如何来确认到底满足不满足这个PHAssumptiono对于PHAssumption的评估一般有三种方法:Graphical,Goodness-of-fittest和Time-dependentcovariateso小胖在这里主要介绍一下Goodness-of-fittest,其他两种方法,如果大家有兴趣可向小胖索取相关资料。小胖之所以重点介绍Goodness-of-fittest,在于它有其自身的优势,它可以对每个变量进行PHAssumption进行检验,捉供相应的统计量和p值,这样我们做起决定就比Graphical方法更加客观了。至于具体的检验方法,我们给大家介绍一下HarrelandLee在1986年提出的方法,这个方法來源于1982年Schoenfeld提出的方法,并且基于Schoenfeld定义的residuals,也就是我们现在通称的Schoenfeldresiduals.什么是Schoenfeldresiduals呢?举个例子,假设一个CoxPHmodel中有三个变量,治疗组、性别和基线评分,那么对于每个出现event的病人,总共有三个Schoenfeldresiduals,其中每个变量对应一个Schoenfeldresidualo具体的计算方法,假设某个病人在t时间点出现了event,那么他基线评分的Schoenfeldresidual就是他的基线评分值减去其他在这个时间点仍在研究中没有发生event的病人的weighted平均评分值,而weights则是每个病人的hazardo而检验方法的基本思想则是如果某个变量满足PIIAssumption,那么这个变量的Schoenfeldresidual与生存时间无关。下一篇博文,小胖将简单介绍一下检验的具体步骤。小胖说统计之二二六:肿瘤临床试验中的统计学问题(四十二)生存分析(二十八)上一篇博文中,小胖提及了HarrelandLee在1986年提出的基于Schoenfeldresiduals对PHassumption的检验方法,下边我们看一下这个方法的具体步骤:(1)构建CoxPHmodel,得出每个变量的Schoenfeldresiduals(2)按照发生event的吋间对病人进行排序,产生一个新的变量记为RANK,其中最早发生event的病人这个变量取值为1,下一个发生event的变暈取值2,依次类推。。。(3)检验(1)(2)中产生的变量之间的关系。检验假设为Schoenfeldresiduals和发生event的时间排序无关。如果拒绝这个假设,则证明PHassumption不满足。关于PHassu叩tion的检验可以通过SAS程序实现,具体程序,小胖从网上找到了一段范例程序如下,供大家参考:******PerformingastatisticaltestforthePHassumption**********;/*ThefollowingSASprogrammakesuseoftheaddictsdatasettodemonstratehowtoperformastatisticaltestoftheproportionalhazardassumptionforagivencovariate(F.Harrel&K.Lee,proceedingsoftheeleventhannualSASuser'sgroupinternational,1986,pages823-828).ThisisaccomplishedbyfindingthecorrelationbetweentheSchoenfeldresidualsforaparticularcovariateandtherankingofindividualfai1uretimes.Tftheproportionalhazardassumptionismetthenthecorrelationshouldbenearzero.Thep-valuefortestingthiscorrelationcanbeobtainedfromproccorr(orprocreg)・TheSchoenfeldresidualsforagivenmodelcanbesavedinaSASdatasetusingprocphreg.TherankingofeventsbyfailuretimecanbesavedinaSASdataseusingprocranked・ThenullhypothesisisthatthePHassumptionisnotviolated.Notethatthenullhypothesisisneverprovenwithastatisticaltest.Themostthatmaybesaidisthatthereisnotenoughevidencetorejectthenull.Ap-valueisdrivenbysamplesize.Agrossviolationofthenul1assumptionmaynotbestatistical1ysignificantifthesampleisverysmal1.Conversely,aslightviolationofthenullassumptionmaybehighlysignificantifthesampleisverylarge.\nFirstrunthefullmodel・TheoutputstatementcreatesaSASdataset,theout二optiondefinesanoutputdataset,andtheressch二statementisfollowedbyuserdefinedvariablesnamessothattheoutputdatasetcontainstheShoenfelcIresiduals.Notethattheorderofthenamesmatchupwiththeorderoftheinclependentvariablesinthemodelstatement.Theactualvariablenamesarearbitrary.*/procphregdata=ref.addicts;modelsurvt^status(0)=clinicprisondose;outputout二residressch=rclinicrprisonrdose;run;procprintdata=resid;run;/*CreateaSASdatasetthatdeletescensoredobservations.Wejustwantacorrelationwiththeorderofevents.*/dataevents;setresid;ifstatus二1;:run;/*Useprocranktocreateadatasetwiththerankingoffailuretimes.Theusersuppliesthenameoftheoutputdataset(out二).ThevariabletoberankedisSURVT(thesurvivaltimevariable)・The:rankstatementpreceedsauser-definedvariablenamefortherankingsoffailuretimes・Theuser-definednamesarearbitrary・*/procrankdata二eventsout=rankedties二mean;varsurvt;rankstimerank;run;procprintdata=ranked;run;/*Proccorrisusedtogetthecorrelationsbetweentherankedfailuretimevariable(calledTTMERANKinthisexample)andthevariablescontainingtheScoenfeldresidualsofCLTNTC,PRISON,ANDDOSE(calledRCLINIC,RPRTSON,ANDRDOSErespectivelyinthisexample)・Thenosimpleoptionsuppressestheprintingofsummarystatistics-Iftheproportionalhazardassumptionismetforaparticularcovariate,thenthecorrelationshouldbenearzero-Thep-valuefortestingthecorrelationofzeroisthep-valueforthetestingoftheproportionalhazardassumption*/proccorrdata=rankednosimple;withtimerank;varrclinicrprisonrdose;run;/*Thesamep-valuescanbeobtainedwothprocreg.Thep-valueforclinicis0.0012.*/procregdata=ranked;modeltimerank=rclinic;run;/*Procgplotcanbeusedtoplottheresidualsagainsttherankodfailuretimes・*/procgplotdata=rankcd;plotrclinic*timerank;titleShoenfeldresiduals(forclinic)plottedagainstfailuretime;procgplotdata=ranked;\nplotrdose*timer8nk;titleShoenfeldresiduals(forclose)plottedagainstfailuretime;run;procgplotdata=ranked;plotrprison*timerank;titleShoenfeldresiduals(forprison)plottedagainstfailuretime;run;title;*CLEARTHETITLE;小胖说统计之二二七:肿瘤临床试验中的统计学问题(四十三)生存分析(二十九)前•文中,小胖提及了CoxPHmodel的Assumption是hazardratio保持不变,并简单介绍了Assumption的检验方法。那么如果某个变量PHAssumption不满足的话,我们该怎么办呢?这时我们就有另一种选择即stratifiedCoxmodelostratifiedCoxmodel是CoxPHmodel的一种modification,它可以对不满足PHAssumption的变量进行分层,而那些满足PHAssumption的变量则可以纳入到model中。简而言之,根据不满足的进行分层,把满足的纳入到模型中。StratifiedCoxmodel的基本公式如下:hg(t)=h0g(t)*exp(P1X1+02X2+.・・+BkXk)g为根据不满足PHAssumption的变量Z分层后的每一层,记为1,2,3・・・.XI,X2・・・.・Xk为满足PHAssumption的变量这样根据变量Z进行分层后,可以分解为以下不同层的公式:Hl(t)=h01(t)*exp(P1X1+P2X2+.・.+BkXk)H2(t)=h02(t)*exp(P1X1+B2X2+...+BkXk)H3(t)二h03(t)*exp(P1X1+32X2+...+BkXk)每一层只是baselinehazardfunction不同,而Bl,B2…都是相同的,这样每一层的hazardratio也是相同的。而在具体估计Bl,B2…时,方法与CoxPHmodel类似,只不过需要把把每一层的似然函数相乘,具体的方法,小胖就在不在此赘述了。。。\n小胖说统计之二二八:肿瘤临床试验中的统计学问题(四十四)生存分析(三十)前边小胖主耍介绍了CoxPHmodel以及StratifiedCoxmodel的一些基本内容,下边我们简单来看一下其SAS程序。Coxmode是通过SAS程序中的PROCPHREG来实现的。(1)CoxPHmodelPROCPHREG;MODELTTME*STATUS(O)二TREATXIX2/TIES二EXACTRL;RUN;解释:(1)TIME代表从随机化到发生event或censored的时间(2)STATUS中1代表发生event,0代表censored(3)TREAT代表治疗组,XI,X2代表其他预后变量或者说协变量(4)TTES二EXACT选项在很多event同时发生的情况下比较适用,默认的为TEST二BRESI.0W(5)RL选项可以使SAS输出hazardratio的95%可信区间(2)StratifiedCoxmodelPROCPHREG;MODELT1\1E*STATUS(O)二TREATXIX2/TIES二EXACTRL;STRATACENTER;RUN;解释:假设CENTER不满足PHassumption,TREAT,XI,X2满足PHassumption,我们则可以采用上述的StratifiedCoxmodel0与CoxPHmodel不同的是:(1)MODEL中只包含满足PHassumption的变量(2)多了一个STRATA语句,用来对不满足PHassumption的变量进行分层小胖说统计之二二九:肿瘤临床试验中的统计学问题(四十五)生存分析(三十一)在前面关于生存分析的内容中,小胖主要介绍了肿瘤临床试验生存分析中最常见的三种方法:(1)Kaplan-Meierestimate(2)Log-rankTest(3)CoxPHmodel那具体在肿瘤临床试验统计分析方法部分怎么叙述呢?下边是小胖常用到的儿句简单的语句,供人家参考。TheKaplan-Meiermethodwillbeusedtoestimatethedistributionof(PES,overallsurvival,TTP,TTF,etc.)foreachtreatmentandthelog-ranktestwillbeusedtocomparethe(PFS,overal1survival,TTP,TTF,etc.)distributionbetweenthetwotreatments.Coxproportional-hazardsmodelwi11beusedtoestimatehazardratiosand95percentconfideneeintervals.Theeffectofprognosticfactorson(PFS,overal1survival,TTP,TTF,etc.)wi11alsobeexaminedusingCoxproportionalhazardsmodeio小胖说统计之二三零:肿瘤临床试验中的统计学问题(四十六)肿瘤临床试验中的非劣效试验(一)\n尽管现在关于不同场合下应用安慰剂对照试验的争议不断,但对于肿瘤这种关系到病人生死的临床试验中,单纯的安慰剂对照试验是不可能被采用的。在肿瘤临床试验中,除非你的药能确实显示出比标准药物疗效好,或者你做add-on研究,即标准治疗+你的药物由于单用标准治疗,否则你如果想上市你的药,你就饶不开非劣效试验。而你做非劣效试验的出发点或者说是H的,就是显示你的药物是有效的,保留了对照药物大部分的疗效(retainasubstantialfractionoftheeffectofthecontrol),iflj且同时你的药物与对照药物相比有安全性、耐受性、方便性等方面的优势。对于阳性对照药的非劣效试验来说,非劣效检验假设一般有两种,一种fixedmarginhypothesis,另—种叫fractionretentionhypothesis。我们先来看第一种fixedmarginhypothesis,这种方法大家比较熟悉,就是在试验开始前设置一个数值作为非劣效界值,一旦这个非劣效界值在试验开始前确定了,那么它就被视为是固定的和不变的(constant),然后根据此建立相应的非劣效检验假设。例如某肿瘤试验,主要终点是overallsurvival,我们假设这个非劣效界值为M,我们以建立下边这个检验假设:HO:HR(T/C)>=1+MHl:HR(T/C)<1+M其中T为试验组,C为对照组,HR(T/C)为试验组相对于对照组的死亡风险下一步我们便是要计算HR(T/C)及其95%可信区间,如果HR(T/C)的95%的可信区间的上限小于1+M吋则拒绝H0,从而证实非劣效。对于fixedmarginhypothesis来说,其方法简单直接,但最人也是最关键的问题是如何确定Fixedmargin,关于这个Fixedmargin的确定,小胖在前边关于非劣效试验的博文中己经有过比较详细的介绍,在此就不再赘述。小胖说统计之二三肿瘤临床试验中的统计学问题(四十七)肿瘤临床试验中的非劣效性试验(二)上文屮,小胖简单介绍了非劣效试验的第一种检验假设即fixedmarginhypothesis,从这篇博文开始,小胖重点介绍一下另一种非劣效假设fractionretentionhypothesis。对T*fractionretentionhypothesis来说,其核心是retentionofaproportionoftheactive~controlsurvivaleffect,通俗说,你的药能保持阳性对照药多大比例的疗效。假设0<=60<=1,那么检验假设便是试验组是否能保持超过(100X60)%比例的阳性对照药的疗效。比如60=0.5,那么就是试验组是否能保持超过50%的阳性对照药的疗效。基于fractionretentionhypothesis的方法有很多,其中比较常用的是Rothmann,smethod。它是由Rothmann于2003年在Rothmannetal.Designandanalysisofnon-inferioritymortalitytrialsinoncology.StatisticsinMedicine2003;22:239-264中提出的,有兴趣的同学可以向小胖索取这篇文章的原文。从下篇I専文开始,小胖将结合这篇文章向大家简单介绍一下Rothnrnnn'smethod小胖说统计之二三二:肿瘤临床试验中的统计学问题(四十八)肿瘤临床试验中的非劣效性试验(三)从这篇博文开始,小胖简单介绍一下Rothmann"smethod,首先我们从其fractionretentionhypothesis讲起。假设一项主要终点为overallsurvival的肿瘤试验中,P代表placebo(或其他以往研究中用到的参照治疗),C代表非劣效试验中的阳性对照组,T代表非劣效试验中的试验组,那么HR(P/C)为placebo相对于阳性对照组的死亡风险,HR(T/C)为试验组相对于阳性对照组的死亡风险。因此我们可以得出:(1)阳性对照药相对于placebo的疗效(或者说是阳性对照药的疗效):HR(P/C)-1(2)阳性对照药相对于试验药的疗效:HR(T/C)-1\n由(1)(2),我们可以推导出:试验药相对于placebo的疗效(或者说是试验药的疗效)为(1)-(2)即HR(P/C)-HR(T/C)o按照前边的非劣效假设,试验组的疗效能否保持超过(100X60)%比例的阳性对照药的疗效,那么检验假设可以写作:HO:HR(P/C)-HR(T/C)<=60X(HR(P/C)-1)Hl:HR(P/C)~HR(T/C)>60X(HR(P/C)T)我们对上边的公式进行一下转换,便最终得到:小胖说统计之二三肿瘤临床试验中的统计学问题(五十)H0:HR(T/C)>=50+(1-60)*HR(P/C)H1:HR(T/C)<60+(1-60)*HR(P/C)小胖说统计之二二二:肿瘤临床试验中的统计学问题(四十九)肿瘤临床试验中的非劣效性试验(四)上文中,小胖给大家推导出了Rothmann,smethod其fractionretentionhypothesis的arithmetic定义,其实我们还有另一种geometric定义,即通过log的形式。具体如下:(1)阳性对照药相对于placebo的疗效(或者说是阳性对照药的疗效):logHR(P/C)(2)阳性对照药相对于试验药的疗效:logHR(T/C)由(1)(2),我们可以推导出:试验药相对于placebo的疗效(或者说是试验药的疗效)为(1)-(2)即logHR(P/C)-logHR(T/C)o按照前边的非劣效假设,试验组的疗效能否保持超过(100X60)%比例的阳性对照药的疗效,那么检验假设可以写作:H0:logHR(P/C)-logHR(T/C)<=60XlogHR(P/C)H1:logHR(P/C)-logHR(T/C)>60XlogHR(P/C)我们对上边的公式进行--下转换,便最终得到:HO:logHR(T/C)>=(1-60)*logHR(P/C)Hl:logHR(T/C)<(1-60)*logHR(P/C)肿瘤临床试验中的非劣效性试验(五)总结上文中的fractionretentionhypothesis得到:(1)Arithmeticdefinitions:HO:HR(T/C)>=60+(1-60)*HR(P/C)Hl:HR(T/C)<60+(1-60)*HR(P/C)(2)Geometricdefinitions:HO:logHR(T/C)>=(1-60)*logHR(P/C)Hl:logHR(T/C)<(1-60)*logHR(P/C)关于§0,虽然在很多肿瘤试验中都选择0.5,但英选择也应该是casebycase的。当阳性对照药的疗效非常好的情况下,往往要求§0会较高点。其实我们从上边的公式,也可以看出一些比较有意思的东西:(1)如果60-0,即试验药保持大于0%的阳性对照药的疗效,其实对应的就是试验药大于安慰剂的疗效,这时代入60=0,上面的两个H0就会变成HR(T/C)>=HR(P/C),1ogHR(T/C)>=1ogHR(P/C),显然与其是相匹配的;(2)当60-1,即试验药保持大于100%的阳性对照药的疗效,这就变成了试验药优于阳性对照药的优效试验了,这时我们再代入60=1,上面的两个H0就会变成HR(T/C)>=1,logHR(T/C)>=0小胖说统计之二三五:肿瘤临床试验中的统计学问题(五十一)肿瘤临床试验中的非劣效性试验(六)\n上几篇博文,小胖主要介绍了fractionretentionhypothesis,下边我们看一下具体的Rothmann,smethod的检验方法。为了计算方便,我们下边的计算主要基于fractionretentionhypothesis的Geometricdefinitions:HO:logHR(T/C)>=(1-60)*logHR(P/C)Hl:logHR(T/C)<(1-60)*logHR(P/C)Rothmann,smethod是一种Linearizationmethod,它把阳性对照试验中的数据以及以往研究中的数据简单线性结合起来对无效假设进行检验,检验统计量Z为:其中se(logHR(T/C)),se(logHR(P/C))分别为logHR(T/C)和logHR(P/C的standarderroroZ近似标准正态分布,如果|z|>1.96,那么就可以拒绝H0,得出治疗组维持大于100X60%的阳性对照组的疗效,当然你也可以根据Z计算出相应的p值。小胖说统计之二三六:肿瘤临床试验中的统计学问题(五十二)肿瘤临床试验中的非劣效性试验(七)上文中,小胖介绍了Rothmtmn'smethod中的检验统计量,其实和应用检验统计量相对应的,我们还可以使用可信区间的方法。HO:logHR(T/C)>=(1-60)*logHR(P/C)Hl:logHR(T/C)<(1-60)*logHR(P/C)具体思路如下:当logHR(T/C)的95%可信区间的上限小于(1-60)*(logHR(P/C)的100y%可信区间的下限)时则证实非劣效。但前提是Y的取值能使得检验达到近似0.025的typeIerror<>Rothmann给出了近似0.025的typeIerror时Y的计算公式:小胖说统计之二三七:肿瘤临床试验中的统计学问题(五十三)肿瘤临床试验中的非为效性试验(八)卜•边我们通过一个例子來对前边提及的Rothmann?smethod加以理解:例:一项比较Xeloda对比5-FU+LV治疗转移性结肠癌的随机试验。以往的研究中都是比较5-FU+LV和5-FU单用治疗转移性结肠癌,没有5-FU+LV和placebo直接比较的疗效,因此我们用5-FU+LV和5-FU单用治疗之间疗效的差异作为5-FU+LV疗效的保守估计。而我们研究的目的是证实Xeloda非为效于5-FU+LV,而这个非劣效,我们将通过显示Xeloda是否保留了5-FU+LV相对5-EU单用治疗的疗效的50%以上这个非劣效假设来实现。Fractionretentionhypothesis:HO:logHR(T/C)>=(1-60)*logHR(P/C)Hl:logHR(T/C)<(1-60)*logHR(P/C)在这个例子中:T(治疗组):XelodaC(阳性对照组):5-FU+LVP(安慰剂组或以往研究中的对照组):5-FU60=0.5那么非劣效假设就变成:HO:logHR(Xeloda/5-FU+LV)>=0.5*logHR(5-FU/5-FU+LV)\nHl:logHR(Xeloda/5-FU+LV)<0.5*logHR(5-FU/5-FU+LV)根据以往的研究估计:LogHR(P/C)=logHR(5-FU/5-FU+LV)=0.2341SE(logHR(P/C))=SE(logHR(5-FU/5-FU+LV))二0.07501而本试验的主要结果如下:HR(T/C)=HR(Xeloda/5-FU+LV)=0.9295%CI:(0.775,1.089)logHR(T/C)=logHR(Xeloda/5-FU+LV)=-0.0844SE(logHR(T/C))=0.0867根据以上的数据,我们怎么来检验以上的非劣效假设呢?小胖说统计之二三八:肿瘤临床试验中的统计学问题(五十四)肿瘤临床试验中的非劣效性试验(九)接上篇。。。(1)方法一:通过计算检验统计量Z的方法:如前文所述:Z=(-0.0844-0.5*0.2341)/SQRT(0.0867*0.0867+0.5*0.5*0.07501*0.07501)=-2.13|z|=2.13>1.96,因此拒绝无效假设,得出Xeloda保留了5-FU+LV相对5-FU单用治疗的疗效的50%以上。(2)方法二:可信区间法:如前文所述,当logHR(T/C)的95%可信区间的上限小于(1-60)*(logHR(P/C)的100丫%可信区间的下限)时则证实非劣效。但前提是Y的取值能使得检验达到近似0.025的type1errorc第一步:我们计算Y,根据Rothmann,smethod给出的近似0.025的typeIerror时丫的计算公式:其中x=(1-80)*(se(logHR(P/C))/se(logHR(T/C)))得:X二0.5*(0.07501/0.0867)二0.4326Y=2①((1.96*SQRT(l+0.4326*0.4326)-1.96)/0.4326)-1=0.315第二步:我们看一下logHR(T/C)的95%可信区间的上限是否小于0.5*1ogHR(P/C)的31.5%可信区间的下限:logHR(P/C)的31.5%可信区间的下限为:logHR(P/C)-Z1-0.685/2*SE(logHR(P/C))=0.23411-Zl-0.685/2*0.07501=0.204因此0.5*logHR(P/C)的31.5%可信区间的下限为0.5*0.204=0.102而比较logHR(T/C)的95%可信区间的上限是否小于0.102,只需比较HR(T/C)的95%可信区间的上限是否小于exp(0.102)=1.107.而试验结果中,HR(T/C)得95%可信区间得上限为1.089,小于1.107,因此可证实非劣效。小胖说统计之二三九:肿瘤临床试验中的统计学问题(五十五)肿瘤临床试验中的非劣效性试验(十)上述对fractionretention非劣效检验假设的检验统计量的过程中,我们涉及到了很多生存分析中常见的参数,比如HR,HR的95%可信区间,logHR,SE(logHR)等,因此小胖觉得有必要再和大家复习一下这儿个参数之间的关系:其实他们之间的关系,可以用一个HR的95%可信区间的计算过程就可以概括:我们把HR的95%可信区间的下限和上限分别记为HRCL和HRCU:那么HRCL=exp(logHR-1.96*SE(logHR))HRCU=exp(logHR+1.96*SE(logHR))\n为了更便一步理解,我们来看一个COXPHmodel的简单SAS输出结果的例子:有了以上的关系,我们就知道如果你只知道HR及其95%可信区间,我们是可以到推出SE(logHR)的,例如我们对于阳性对照药相对于placebo或其他参照的疗效数据要参考以前做过的研究,发表的文章,而我们可能从发表的文章中常常只能得到HR及其95%可信区间,那此时我们就可以根据以上的关系利用这两个参数推岀SE(logHR)小胖说统计之二四零:肿瘤临床试验中的统计学问题(五十六)肿瘤临床试验中的非劣效性试验(十一)上儿篇博文,小胖简单介绍TRothmann,smethod,而基于fractionretention非劣效假设的常见方法还有:(1)Hasselblad&Kong:CIfortheratioHasselbladV,KongDF.Statisticalmethodsforcomparisontoplaceboinactive-controltrials.DrugInformationJournal2001;35:435-449.(2)Yong-ChengWang:RatiotestWangYC,ChenG,ChiGY.Aratiotestinactivecontrolnon-inferioritytrialswithatime-to-eventendpoint.JBiopharmStat.2006;16(2):151-64.(3)RichardSimon:BayesianSimonR.Bayesiandesignandanalysisofactivecontrolclinicaltrials.Biometrics1999;55:484-487.在这里小胖列出了主要方法的参考文献,有兴趣的同学可向小胖索取相关文献。小胖说统计之二四一:肿瘤临床试验中的统计学问题(五十七)生存数据中样本量的计算(一)肿瘤临床试验的一大特点便是其终点指标一般都是time-to-event变量(生存数据),因此其样本量的计算一般是基于time-to-event变量。对于生存数据样木暈计算最直接最简单的方法便是根据近似止态分布的原理,直接进行两个proportions的比较,这就和我们传统的两分类变量的样本量计算类似了。而对于那些event发生率非常低的研究,Chan和Bohidar在1998年进而提出了exactconditionalmethod,其中假设总的event数量符合Poisson分布。Chan,ISFandBohida,NR.Exactpowerandsamplesizeforvaccineefficacystudies.ConimunicationsinStatistics,TheoryandMethods1998;27:1305-1322.Freedman则在1982年给出了一个简单的讣算所需events/subjects的公式,这个方法基于log-ranktest,其assumption要求同一治疗组内的每个受试者出现event的概率近似相等的,而且没有dropout:Freedman,L.S.Tablesofthenumberofpatientsrequiredinclinicaltrialsusingthelogranktest.StatMed1982;1:121-129.这个方法,小胖在前边关于样本量计算的博文中曾有所涉及。其他的方法还有:GeorgeandDesu(1974),Schoenfeld(1981)等:George,S.L.,andM.M.Desu.Planningthesizeanddurationofaclinicaltrialstudyingthetimetosomecriticalevent.JournalofChronicDiseases1974;27:15-24.SchoenfeldD.Theasymptoticpropertiesofnonparametrictestsforcomparingsurvivaldistributions.Biometrika1981;68(1):316-319.但以上这些方法,都没有充分考虑到生存数据的一些特殊因素,如入组时间、总的研允时间、staggeredentrydistribution、治疗依从性、competingrisksapossiblynon-proportionalhazards这些都限制了其在生存数据样本量计算中的应用。\n从下i篇博文开始,小胖将简单介绍一下一些其他常见的考虑到生存数据特殊因素的一些样本量的计算方法。小胖说统计之二四二:肿瘤临床试验中的统计学问题(五十八)生存数据中样木量的计算(二)与常规的连续性变量以及两分类变量分析中样本量的计算不同,生存数据中样本量的计算往往会更复杂,考虑的因素会更多。除了常常需要考虑到a、B、effectsize,dropoutrate等之外,生存数据中样本量的计算还需要考虑到入组时间、总的研究时间、staggeredentrydistribution^治疗依从性、competingrisks、possiblynon-proportionalhazards等因素。当上述因素与你的研究设计相关时,我们就必须选择合适的统计方法来进行样木量的计算。选择了合适的统计方法,相对应的就要选择合适的统计软件进行最后的样本量的计算。现在有很多统计软件可用于生存数据中样本量的计算,每一种软件都有其优点和缺点。对于同一种情况,由于计算样本量时理论方法或assumption的不同,各个软件也可能有时产生不同的结果。如果有可能的话,我们可以利用两种不同的软件來计算,从而可以检查样本量计算的稳健性。下边小胖将向大家介绍一下几个主要的生存数据中样本量计算的软件。(1)PASSPASS全称PowerAnalysisandSampleSize,具体可参加以卜链接:http://www.ncss.com/pass.html现在最新版木是PASS2008,你可以在以上链接的PASS官方网站中下载其7天试用版。(2)nQueryhttp://www.statsol.ie/index.php?pageTD=2你可以在以上链接的网站中,下载其试用版及DEMO版。(3)Easthttp://www.cytel.com/Products/East/你可以在以上链接的网站中,了解相关内容。从下篇博文开始,小胖将结合不同的临床研究设计,向大家介绍一下生存数据中样本量计算方法以及软件的选择和使用。小胖说统计之二四三:肿瘤临床试验中的统计学问题(五十九)生存数据中样本量的讣算(三)众所周知,样本量汁算的基础是研究设计,临床研究设计的不同决定了其样本量汁算方法的不同。因此,我么在计算样木量时,必须首先了解其临床研究设计。对于主要疗效终点是time-to-event变量的临床试验来说,我们可以把其典型的研究设计分为以下三类:(1)Maximumdurationtrai1在这种设计类型的试验中,那些没有脱落和没有发生event的病人都会被一直随访到试验结束。也就是我们通常所说的病人不同时间入组(staggeredentry),但同一时间随访结朿。在这种情况下,山于病人进入试验的时间各不相同,而结束试验的日期则是一样的,因此,那些入组早的病人就可能比那些入组晚的病人随访时间更长。(2)Fixeddurationtrial在这种设计类型的试验中,那些没有脱落和没有发生event的病人都会被随访一段固定的时间。例如每个病人从随机化开始,都被随访固定的1年,即如果某个病人是2009年3月1日入组,那么他将被随访到2010年2月28日止;而另一个病人是2009年5月1日,那么他将被随访到2010年4月30日止。(3)Maximuminformationtrial在这种设计•类型的试验中,试验直到达到maximumrequiredinformation,比如说出现一定数量的events才结束。\n小胖说统计之二四四:肿瘤临床试验中的统计学问题(六十)生存数据中样木量的计算(四)対于生存数据的分析来说,最重要的直接相关的是events的数量,而不是病人的数量。因此,是是events的数量,而不是病人的数量决定了试验的powero在这个意义上,生存数据中样本量的计算--般分为两步走:(1)计算所需的events数量(2)计算达到所需的events数量的情况下所需的病人数量,这一步的计算可能取决于入组速度、入组时间、脱落率、总的研究时间等因素。从这个意义上來说,前文中小胖介绍的三种设计类型在第一步的计算上没有什么本质不同,不同之处在于第二步的计算。也就是说,由于三种研究设计中入组速度、入组时间、脱落率、总的研究时间等因素的不同,为了达到所需的events,其最后所需的病人数也各不相同。从下篇博文开始,小胖将具体简单介绍一下生存数据中样本量的计算的各种常见方法,适用条件及其软件实现。小胖说统计之二四五:肿瘤临床试验中的统计学问题(六十一)生存数据中样木量的计算(五)首先,小胖给大家简单介绍一下我们比较常见的两组比较的,建立在proportionalhazardratioassumption基础上的一些比较简单的临床试验的样本量的计算方法。1.LachinandFoulkesMethodLachinandFoulkcsMethod简称LFMethod由Lachin和Foulkes于1986年提出:LachinJMandFoulkesM.Evaluationofsamplesizeandpowerforanalysesofsurvivalwithallowancefornonuniformpatiententry,lossestofollow-up,non-compliance,andstratification.Biometrics1986;42:507-19LFMethod适用于两组比较的maximumdurationtrial,它要求数据比较好地符合proportionalhazardratioassumptiorio而关于LFMethod的软件计算,我们一般可以使用PASS中的LogrankTests(LachinandFoulkes)模块来实现。2.Kim&TsiatisMethod:Kim&TsiatisMethod由KimK和Tsiatis在1990年提出:KimKandTsiatisAA.Studydurationforclinicaltrialswithsurvivalresponseandearlystoppingru1e.Biometrics1990(46):81-92.Kim&TsiatisMethod适用于两组比较的maximumduration/inforamtiontrial,它要求数据比较好地符合proportionalhazardratioassumptiorioKim&TsiatisMethod的一大优势便是它可以应用于中期分析。关于Kim&TsiatisMethod的计算,主要使用East软件。3.Rubinstein,Gail,andSantnerMethod:Rubinstein,Gail,andSantnerMethod由Rubinstein,Gail和Santner于1981年提出:\nRubinsteinLV,GailMH,andSantnerTJ.Planningthedurationofacomparativeclinicaltrialwithlosstofollow-upandaperiodofcontinuedobservation.JournalofChronicDiseases1981;34:469-79.Rubinstein,Gail,andSantnerMethod与LFmethod类似,但公式计算更为简化些,可通过nQuery软件中的Testbasedonexponentialsurvival,accrualperiodanddropouts模块來实现。生存数据中样本量的计算(六)在这篇博文中,小胖向大家简单介绍一下一些比较复杂的两组比较的临床试验的样本量的计算,在这些临床试验中,可能存在piecewiseproportionalhazardratio或nonproportionalhazardratio,time-dependenthazard,lagintreatmenteffect,crossover,stratification等复杂白勺情况。1.LakatosMethod:LakatosMethod由Lakatos提出:LakatosE.Samplesizebasedonthelog-rankstatisticincomplexclinicaltrials.Biometrics1988;44:229-41.LakatosEandLanKKG.Acomparisonofsamplesizemethodsforthelogrankstatistic.StatMed1992;11:179-91.LakatosMethod计算出的样本量,即使在proportionalhazardsassumption违反的情况下,log-ranktest也能保持足够的powero因此,当proportionalhazardsassumption成立的情况下,LakatosMethod计算出的样本量往往会比LFmethod要大。具体到软件计算,大家可以参考PASS'|>ffjLogrankTests(Lakatos)模块。2.Simulations当hazards不是proportional时,可以近似为piece-wiseconstanthazards®这可以通过East或nQuery软件把研究时间划分成几段间隔时间,在每段间隔时间里hazard可以被视为是constant的。这样每段时间间隔内的hazardratio就可能各不相同。同样,我们也可以规定不同时间间隔的不同dropout,入组情况等。在nQuery中,大家可以通过Log-ranktest,userspecifiedsurvivalrates,accurual,dropouts(simulation)模块来实现。生存数据中样木量的计算(七)中期分析现在在肿瘤临床试验中越来越普遍,而对带有中期分析的生存数据的样本量的计算,也有很多方法,其中最常见的有JennisonandTurnbul1(2000)和KimandTsiatis(1990)。JennisonCandTurnbullBW.Groupsequentialmethodswithapplicationstoclinicaltrials.Chapman&Hall/CRC2000,Chap13.KimKandTsiatisAA.Studydurationforclinicaltrialswithsurvivalresponseandearlystoppingrule.Biometrics1990(46):81-92.而在统计软件方面,East是生存数据中期分析的首选软件,它不仅包括了简单的lo旷anktest,还包括了piecewiseproportionalhazardsratio的复杂1ogranktest的模块。PASS软件也可以用来处理中期分析,但只能适用于简单的logranktest,可以通过其Group-SequentialLogranktest模块来实现。最后,小胖需要说明的一点是,生存数据中样本量的计算是一个非常复杂的过程。一个统汁师必须在样本量的计算方血花足力气。而在同样的情况下,选择至少两种计算方法或软件,不失为样本量计算的一个好朿略。\n小胖说统计之二四八:LongitudinalData分析的常见方法(一)简介LongitudinalData是临床试验中最常见的数据类型之-一,即在临床试验过程中的规定的各个时间点比如说1周、2周、3周、4周等进行测量和数据的搜集。而在LongitudinalData的分析过程中,最棘手的问题便是缺失值,特别是在一些缺失值比例较高的情况下,如我们常见的一些CNS疾病的临床试验中,据有人统计,在抗抑郁临床试验中,受试者的dropoutrates平均高达37%,因此对缺失值的处理直接影响着这些临床试验统计分析的合理性。前边小胖在缺失值系列中己经花了大篇篇幅介绍了缺失值的处理方法,其中比较常见的有L0CF,但由于其比较明显的bias,一直受到学界广泛的质疑。关于L0CF及其他相关缺失值的介绍,大家可参见以前的小胖说统计之一二六到一四六中的缺失值系列。最近几年,一些新的LongitudinalData分析方法开始陆续出现,特别是一些model方法的出现,比较好的解决了LongitudimilData分析中缺失值的问题,从下篇博文开始,小胖将简单介绍一下几种常见的方法。小胖说统计之二四九:LongitudinalData分析的常见方法(二)|热1|已有283次阅读2010-03-0920:17标签:DataLongitudinal统计MMRM(一)MMRM全称mixed-effectmodelsforrepeatedmeasures,是由Mallinckrodt等人在2001年的一篇文章中提出的:Mallinckrodt,C.H.,Clark,W.S.»David,S.R.(2001).Accountingfordropoutbiasusingmixed-effectsmodels.JournalofBiopharmaceuticalStatistics11:9-21.MMRM是混合效应模型的一种特殊形式,因此我们首先来复习一下广义线性混合效应模型:V;=X/p+Z/by+£/其中:£为反应向量&为固定效应的设计矩阵B为固定效应向量乙为随机效应的设计矩阵b为随机效应向量£i为残差向量随机效应6满足均数为0,方差矩阵为G的止态分布,耐〜N(0,G),var(bi)=G;残差5满足止态分布J〜N(0,R),var(j)=R,R残差协方差矩阵其实从上边这个公式,我们可以衍生出Yi服从均数为XiB,方差■协方差矩阵为V=ZiGZ;+R的正态分布。在临床试验中,我们虽然主耍关注的是固定效应的差别,而很小关注随机效应,但是对随机效应的modelling在对固定效应做出合理推断中仍然发挥着很重要的作用。而在上边广义线性混合效应模型中,我们对随机效应不进行单独的modelling,而是把它纳入marginalcovariancematrix即V的一部分。在Longitudinal临床试验中,通常对所有的受试者进行规定吋间点的测量,即大量的受试者和相对较小数量的测量。这种情况就使得我们所谓的fullmultivariatemodel,即time及其time之间的关系的unstructuredmodel成为可能。而MMRM就是把随机效应modelling为within-subjectcorrelations的一部分。待续。。。\n小胖说统计之二五零:LongitudinalData分析的常见方法(三)MMRM(二)上篇博文中,小胖提到了MMRM(mixed-effectmodelsforrepeatedmeasures)是一种特殊形式的广义线性混合模型,它把随机效应modelling为within-subjectcorrelations的一部分,形成一个multivariatenormalmodel来进行重复测量的分析。下边我们再具体看一下:在MMRM中,time被当作一个效应变量,而treatment*time则被视为unstructured交互作用项,而不是把它看为治疗组随着试验时间的变化而造成的slope的差异。这样做就可以对研究结束时或各个规定访视点的主要疗效指标leastsquaremean(LSMEAN)的不同进行直接估计和统计检验。而由于受试者规定的访视吋间点的数量一般是固定的,而且相对数量较少,这些都使得MMRM考虑把time作为一个效应变量放在模型里。而在随机效应方面,MMRM把随机效应纳入到within-subjecterrorcovariancestructure的一部分。而within-subjecterrors通常采取“unstructured"(UN)covariance。UNcovariance的优点在于它对within-subjectvariability不作有任何assumptionso虽然错误地指定MMRM的covariancestructure会增大I类错误及改变power,但采取UNcovariance,无论其真实的variance-covariancestructure是什么,都是较为合理的,都能较好地控制I类错误及powero关于[类错误及power的问题,有兴趣的同学可参加下边这篇文献:小胖说统计之二五一:LongitudinalData分析的常见方法(四)|热2|己有277次阅读2010-03-1911:59标签:DataLongitudinalMMRM(三)前边的闿文,小胖简单介绍了MMRM的基本思想,而MMRM的SAS程序则主要通过PROCMIXED来实现,下边我们看一下一个最基本的MMRM的SAS程序:procmixed;classtreattimesubj;modely=treattimetreat*time/so丄utionddfm=kr;repeatedtime/subject=subjtype=un;lsmeanstreat*time/diffcl;run;解释:(1)class语句:纳入分析所用到的变量,在这个例子里,我们选择了最简单的即治疗组(treat),访视吋间点(time)以及受试者(subj);(2)model语句:-y为反应变量也就是测量值,然后我们在model中纳入了treat,time以及两者的交互项treat*time;・solution选项为显示出固定效应的参数估计・ddfm选项为指定计算分母自由度的方法,因为我们下边的repeated语句中指定TYPE=UN,这时■我们应规定ddfm=kr(3)repeated语句:-time为repeatedeffect-subject选项指定你在混合模型里的subjects,这里为subject=subj-type选项指定covariancestructure,在MMRM分析中我们指定为Unstructured,即type=un\n(1)Ismeans语句:-Ismeanstreat*time表示检验不同时间点治疗组间LeastSquaresMeans的不同-diff选项表示显示出LeastSquaresMeans的差值・cl选项表示计算各LeastSquaresMeans的可信区间,缺省值为95%可信区间Mallinckrodt,C.H.,Clark,W.S.,David,S.R.Type1errorratesfrommixedeffectsmodelrepeatedmeasuresversusfixedeffectsANOVAwithmissingvaluesimputedvia1astobservationcarriedforward.DrugTnformationJournal,Vol.35,pp.1215-1225,2001小胖说统计之二五二:LongitudinalData分析的常见方法(五)已有185次阅读2010-04-2517:52标签:DataLongitudinal统计MMRM(四)Brown在AppliedMixedModelsinMedicine,Wiley1999一书中通过下边这个例子对MMRM做了如下解释:假设一项6例受试者参加的交叉试验,如5:受试者A治疗B治疗AB治疗的差值00120128002262420031617・10042921800522————006—17—(1)如果我们采用的是completeranalysis即完整病例分析,那么我们只会用到001—004病人的数据,那么治疗差异的均值为(8+2-1+8)/4=4.25(2)如果我们采用LOCF进行填补(这里只是为了说明LOCF的思想,并不代表实际的填补方式),即受试者A治疗B治疗AB治疗的差值(LOCF)00120128002262420031617・1004292180052222000617170\n那么LOCF后治疗差异的均值则为:(8+2-1+8+0+0)/6=2.83(1)如果我们采用MMRM呢?首先,它先取(X)1-004这四例可以paired的completers的治疗差异均值,记为Aw=4.25其次,它对其他两例有缺失值不能paired的病人治疗差异的均值记为AB=22-17=5最后把这个差异均值combine起来,具体方式是:总体的均值是上边两个均值的加权均值,而权重则由它们的方差来决定,最后计算值为4.32MMRM(五)MMRM的出现在很大程度上是对我们传统的LOCF分析的挑战,而我们下边通过一个简单的例子来看一下两种方法的不同特别是在处理缺失值方面的不同。PatientTreatmentVisitl(Baseline)Visit2Visit3Visit4Visit5Visit6001A221816141210002A24191412108003B22201918--004A2116131098005B24201815108006A20171210--LOCF后:PatientTreatmentVisitl(Baseline)Visit2Visit3Visit4Visit5Visit6LOCF(changefrombaseline)001A221816141210-12002A24191412108-16003B222019181818-4004A2116131098-13005B24201815108-16006A201712101010-10而采用MMRM,我们不会对数据进行结转,但对于003来说,大家可以看到其下降速度明显低于001和002,那么MMRM就根据这个比较慢的下降速度对visit5-6进行模型处理,而不是直接都让他都等于访视4的值。下边我们通过另一个图表的例子来看一下LOCF和MMRM方法的不同从上图中,我们可以看出,对于patient2来说,在访视3后就开始缺失了,LOCF对其处理是访视4,访视5与访视3值相同,表现在曲线上就是从访视3开始是一条直线;而MMRM是根据其变化趋势,模型处理后在绿色虚拟部分,大家可以看到是向下的。\n从以上的例子我们可以看出,LOCF通过结转用最后一次访视值来代替其后的访视值,忽略了其潜在的访视值的变化趋势,而MMRM则从一定程度上考虑到了访视值的变化趋势,从这个意义上来说,MMRM的估计显得更为合理。小胖说统计之二五四:LongitudinalData分析的常见方法(七)热4已有295次阅读2010-05-0322:44MMRM(六)上两篇博文,小胖介绍了observedcaseanlaysis^LOCF和MMRM处理缺失值方法的不同,由于其处理缺失值方法的不同,有时会导致结果的大不同,下边我们来看一个这方面的实例:PollackMHyetal.TheselectiveGABAreuptakeinhibitortiagahineforthetreatmentofgeneralizedanxietydisorder:resultsofaplacebo-controlledstudy.]ClinPsychiatry.2005Nov;66(ll):1401-8.这是一项评价selectiveGABAreuptakeinhibitortiagabine治疗成年广泛性焦虑障碍的为期8周的随机双盲安慰剂对照研究。本研究的主要终点是thechangefrombaselineinHAMAtotalscoretofinalvisitoResult:Atotalof266patients(tiagabine,N=134;placebo,N=132)wereincludedinsafetyanalyses;260patients(tiagabineN=130;placeboN=130)wereincludedinefficacyanalyses.TiagabinereducedsymptomsofGADaccordingtotheobservedcaseandmixedmodelsrepeated・measures(MMRM)analysesbutnottheprimarylast・observation・cairied・forward(LOCF)analysis.Conclusion:TheprimaryLOCFanalysiswasnegative;however,resultsfromtheobservedcaseandMMRManalysessuggestthattiagabinemaybeausefultreatmentoptionforadultpatientsdiagnosedwithGAD.Thesefindingswarrantfurtherevaluationinrandomizedclinicalstudies.从上边这个临床试验的实例中,我们可以看出,试验共进行了三种分析即observedcase、LOCF和MMRM分析,然而却出现了不同的结论,LOCF分析的结果是阴性的,而observedcase和MMRM分析的结果却是阳性的,怎么来解释呢?我们来看一下病人入组和完成试验的情况,下边是本试验的patientdisposition情况:\nI?igureLPatientDispositionin応TrialofTiagabineforGeneralizedAnxietyDisorder(1)对于observedcase分析来说,纳入主要终点分析的病人为两组完成试验的病人数即97+100=197(2)对于LOCF分析来说,纳入主要终点分析的病人为130+130=260,但两组经过LOCF结转的病人分别为130—97=33例以及130—100=30例,共63例(3)对于MMRM来说,纳入主要终点分析的病人为130+130=260,并且这260例病人没有一例病人是结转的从patientdisposition情况来看,其dropout是比较高的,因此经LOCF结转的病例也会比较多,这就为三种分析最后出现不同的结果埋下了伏笔。。。小胖说统计之二五五:LongitudinalData分析的常见方法(八)MMRM(七)正如小胖前边提到的,MMRM的出现是对传统的LOCF的一大挑战,LOCF自身的缺陷使得它从一开始就备受各方的质疑,而MMRM—出现,便成为人们研究的热点,特别是MMRM与LOCF的比较,很多统计专家都通过不同的方面对两者进行了比较,其屮OhidulSiddiqui,等人根据25项NDAsubmission以及模拟研究对LOCF和MMRM进行了比较:OhidulSiddiqui,H.M.JamesHung,andRobertO'Neill.MMRMVS.LOCF:ACOMPREHENSIVECOMPARISONBASEDONSIMULATIONSTUDYAND25NDADATASETS.JournalofBiopharmaceuticalStatistics,19:227-246,2009.\n文中为了比较LOCF和MMRM,进行了两项模拟研究。对三种不同缺失机制下的治疗效应估计和检验的偏倚以及I类错误都进行了评估。模拟研究结果显示,LOCF可导致治疗效应估计较大的偏倚,并大大增加了统计检验的I类错误,而MMRM导致的偏倚则较少,在MCAR或MAR其至部分MNAR数据情况下,能较好地控制I类错误。而对从25项NDAsubmission中得到的48个临床试验数据集的分析发现,MMRM在控制I类错误和减少偏倚方面优于LOCFo正如这篇文章中提及的,MMRM对LOCF的最大优势在于两点:一是减少偏倚,更好地控制I类错误。最后,小胖想从直观的角度来说两句,同样地我们来分析一个changefrombaseline,对于observedcaseanalysis来说,由于那些缺失的病人没有后边的访视的数据,因此这些病人前期访视的数据也不会纳入分析,因此我们会remove掉一些earlydata;而对于LOCF来说,对于那些缺失后边访视数据的病人来说,我们用前边访视的数据来代替,实际上我们是add?一些其实是我们没有观察到的数据,或者说得难听一点就是虚假的数。而MMRM呢,现对那些完整病例进行分析,然后对那些从完整病例分析中删掉的数据进行合理的估计和比较,最后将两者结合起来得出最后的合理估计。抛歼别的什么偏倚不偏倚,保守不保守,I类错误不1类错误的,但就从这三者的思路和考虑问题的角度來说,MMRM无疑是最合理的。小胖说统计之二五六:临床试验中的描述性统计分析(一)Thepurposeofthefieldofstatisticsistocharacterizeapopulationbasedontheinformationcontainedinasampletakenfromthatpopulation。上述论述中,包含的三个要素是population>samples和characterization。那么具体怎么characterization呢?无非有两种,一种就是我们所谓的descriptivestatistics(描述性统计分析),一种是inferentialstatistics(推断性统计分析)。具体到我们的临床试验中,描述性统计分析占到了我们最后统计分析报告的绝大部分,这是因为除了你事先有检验假设的一些终点的分析会用到推断性统计分析外,你几乎所有的人口学和基线变量的总结、疗效数据的总结、安全性数据的总结都要用到描述性统计分析。而具体的描述性统计分析,乂根据不同的数据类型有不同的描述方式,对于连续性变量来说,我们最常用到的是均数、标准差、中位数、最小值和最大值;对于分类型变量来说,主要用到的是频数表的方式即频数及百分比;对于timetoevent数据来说,我们则最主要基于Kaplan-Meier来进行统计描述。此外,除了用表格的形式对临床试验数据进行描述性总结之外,我们述会用到一些figures来进行统计描述,最常见的如LinePlot,BarChart,BoxPlot,K-Mcurve等。从下一篇博文开始,小胖将分別对临床试验中的各种描述性统计分析做一简单介绍。小胖说统计之二五七:临床试验中的描述性统计分析(二)我们在统计分析计划或研究方案中的统计分析部分,特别是在统计分析的一般原则中一般会对描述性统计分析常有以下类似的描述:对于连续型变量,将列出未缺失的受试者个数、均数、标准差、中位数、最小值和最大值。对于分类变量,将以频数表的形式(频数和百分数)列出。而有些比较详细的统计分析计划会対各描述性统计分析统计量的小数位数加以规主,从而使table更加标准化,当然小数位数的规定也不是绝对统一的标准,以下的例子的描述供大家参考:对于连续型变量,将列出未缺失的受试者个数、均数、标准差、屮位数、最小值和最大值。最小值和最大值的小数位数将与数据库中记录的原始数据保持一致。均数、中位数和标准差将比数据库中记录的原始数据多保留一位小数,但最多不超过四位小数。对于分类变量,将以频数表的形式(频数和百分数)列出。百分数将保留一位小数。正如上文小胖提到的,描述性统计分析贯穿于临床试验统计分析的始终,这一点很容易理解,统计分析的最基本最重要的是,首先你必须准确地对数据本身以及对数据的分布有一个清楚的描述和总结,即使你通\n过各种检验方法甚至统讣模型来进行统讣推断和比较,但在这一步之前,伤;需要对你进行统计推断和比较的数据进行一个描述性总结,列出治疗各组之间的均值、标准差之类的或者频数、百分比之类的统计量,然后再采用适当的统计推断检验方法进行组间的比较。因此,从这个意义上,我们就不难理解我们一般把对描述性统计方法的描述放在统计分析的一般原则中。下篇闿文,小胖将从一个完整的统计分析计划的各项内容出发,来看一下描述性统计分析是怎么贯穿临床试验统计分析的始终的。。小胖说统计之二五八:临床试验中的描述性统计分析(三)一份完整的统计分析计划的统计分析方法部分一般可以分为三部分:受试者情况、疗效分析和安全性分析,我们来看一下描述性统计分析是怎么在统计分析计划的各项内容中加以体现的:1、受试者情况(1)受试者分布:在这部分中,我们往往会对入组人数、随机化人数、完成试验的人数以及未完成试验的人数,甚至参加各个访视的人数加以总结。另外,我们会对未完成试验的受试者的原因进行总结。所有这些总结都会用到频数和百分比等描述性统计分析方法。(2)方案违背:在这部分中,我们会对受试者的方案违背进行分类总结,显然频数和百分比是必须用到的。(3)人口学和其他基线数据在这部分中,将对人口学和其他基线数据进行汇总。其中连续型变量如年龄(岁)、身高(cm)、体重(kg)和BMI(kg/m2)等会列出均值、标准差、中位数、最小值和最大值等描述性统计,而对分类型变量如性别、民族等会用到频数和百分比。(4)治疗依从性在这部分中,我们首先会对治疗依从性加以描述性总结,当然列出的是均值、标准差、中位数、最小值和最大值等,然后我们还会根据治疗依从性不同的level(如v80%,80-90%.>=90%等)来进行分类总结。(5)合并用药在这部分中,合并用药一般会根据WHO-Drug或类似的dictionary进行编码,然后根据ATCleveldecode进行频数表分类总结。小胖说统计之二五九:临床试验中的描述性统计分析(四)接上篇。O。2.疗效分析疗效分析一般是临床试验最核心的部分,因为大部分临床试验的主要目的或者说主要的检验假设都是建立在疗效分析的基础上。但即便是这样,在你对主耍疗效或次要疗效终点进行统计检验前,必须首先对它进行一个最基本的描述吧。在连续性变量方而,临床试验中现在最常见的疗效终点莫过于所谓的changefrombaseline了,这时在你比较组间差别前,首先我们最常见的应该是对各组各个访视值以及与基线相比的变化值作一简单描述。此时的描述,最常规的便是均值,标進差,中位数,最小最大值等,一般我们还可以通过figure的形式加以直观的呈现。下边才是你采用ANOVA,ANCOVA,还是mixedmodel等各种统计方法进行组间比较的时候。在分类型变量方而,最常见的便是类似responserate等之类的两分类变量,我们首先需要做的是用频数表的形式,列出具体的频数和百分比,然后再用诸如卡方检验、flshci■精确检验、CMH>logistic以及一些复杂的混合模型进行统计比较。在timetoevent变量方面,也就是所谓的生存变量方面,我们首先做到的也是对具体变量的描述性分析,最常见的就是通过KaplmMeier来进行诸如中位生存时间、QI,Q3,甚至各个时间点生存概率的描述;这时对生存变量的描述还有一个必不可缺的便是Kaplan-Meier生存曲线,而通过这一曲线可直观地反应生存\n情况。下一步你便可以采用logrank检验或者COX回归等进行相应的统计分析和比较了。当然在这里,小胖要提到的一点是,有些情况下,虽然你的变量是timetoevent,但由于你的eventrate很低,这时■再用Kaplan-Meier来进行估计很多吋候就没有多大意义,因为这是很可能你的中位生存吋间、QI,Q3都是无法估计的。这时你可以直接采用频数表的形式,汇报eventrate即可,即当作简单的两分类变量来处理,而后边的比较你便可直接采用fisherexact检验。小胖说统计之二六零:临床试验中的描述性统计分析(五)热1已有134次阅读2010-08-3113:01接上篇。。。3.安全性分析一项临床试验的主要目的,往往除了证实药物的疗效外,还有一项目的便是评估药物的安全性,而对于很多临床试验的安全性分析来说,一般不进行inferentialstatistics,此时描述性统计分析或者说是描述性总结成为其主要分析方法。下边我们结合安全性分析的几个主要部分,来看一下描述性统计分析在安全性分析中的应用。(1)ExtentofExposure(药物暴館或用药程度)在这部分中,一般对药物治疗吋间以及给药剂量进行总结,而这种总结无外乎于用均值或中位数等来描述,另外也可根据治疗吋间或给药剂量进行分类,并提供各个分类中的受试者的人数及百分比。(2)AdverseEvents(不良事件)不良事件是安全性分析的一个核心部分,对于不良事件的分析,我们一般有以下儿个主要部分:・Ovenill的总结,即对发生不良事件、药物相关不良事件、严重不良事件、药物相关严重不良事件、导致停药的不良事件、导致死亡的不良事件等的受试者人数及百分比进行总结。・对所有不良事件、药物相关不良事件、严重不良事件、导致停药的不良事件、导致死亡的不良事件等,根据systemorganclass(系统器官分类)和preferredterm(标准术语)进行频数表分类总结・对所有不良事件和药物相关不良事件根据系统器官分类、标准术语,按照不良事件轻重程度(轻、中和重)进行总结・对所有不良事件根据系统器官分类、标准术语,按照与研究药物的关系进行总结(3)LaboratoryTest(实验室检查)大部分临床试验会对一些实验室指标进行评价,常见的实验室检查可分为血常规、血生化和尿常规等检查,而对于实验室检查的分析一般可分为:・对每个访视的实验室检查指标值以及与基线相比的变化值进行总结(均值、标准差、中位数、最小值和最大值)・对每个访视的实验室检查的指标值进行分类频数表描述总结,这种总结常见的分类有正常、异常无临床意义和异常有临床意义;以及根据实验室指标的正常值范围划分的高于正常值范围、低于正常值范围和在正常值范围内等。・并采用转置表格总结描述自基线到各个访视各项检查指标结果的变化,如正常到正常、正常到异常无临床意义、正常到异常有临床意义;异常无临床意义到正常、异常无临床意义到异常无临床意义、异常无临床意义到异常有临床意义;异常有临床意义到正常、异常有临床意义到异常无临床意义、异常有临床意义到异常有临床意义等,类似的就是根据高于正常值范围、低于正常值范围和在正常值范围内等之间的相互转换。小胖说统计之二六一:临床试验中的描述性统计分析(六)接上篇。。。(4)VitalSigns(生命体征)生命体征也是安全性分析中常见的一部分,具体涉及到收缩压、舒张压、心率、呼吸以及体温等,对其具体的统计总结描述,一般会对各个访视的观测值以及与基线相比的变化值进行总结。(5)PhysicalExaminations(体格检查)\n对于体格检查,i般会对各个访视体格检查止常以及异常的人数及比例做一描述总结。(6)ECG(心电图)对于心电图,首先应对各个访视正常、异常无临床意义以及异常有临床意义的人数及比例做一总结,然后采用类似于前边实验室指标部分提及的转置表格来对心电图检查的变化做一总结。另外,可能在一些特别关注心电图的临床试验中,会具体测量一些心电图的具体指标如PR间期、QT间期等,具体的描述性统计分析也无外乎于反复提及的连续性变量或分类变量的描述性统计分析方法。以上提及的药物暴露程度、不良事件、实验室检查、生命体征、体格检查和心电图室常见的安全性分析的几个主要部分,当然根据临床试验的不同,治疗领域的不同,还会有一些特定的安全性分析指标,比如过敏性鼻炎临床试验屮会进行鼻部检查,眼部疾病的临床试验会进行视力检查等,其描述性统计分析方法也都是基本类似的,在此不再一一赘述。小胖说统计之二六二:概率分布(一)热2己有118次阅读2010-09-0817:27众所周知,统计分析可以分为描述性统计分析(descriptivestatistics)和推断性统计分析(inferentialstatistics)o前边小胖简单介绍了描述性统计分析,从这篇博文开始,小胖开始简单介绍一下推断性统计•分析。对于推断性统计分析来说,要抓住其本质,就必须对其背后最根本的概率分布(probabilitydistribution)有个清楚的理解。概率分布是很多统计推断方法的基础,最典型的例子就是正态分布,很多统计检验方法都会涉及到正态分布。而有些统计检验则是直接建立在统计量值服从某种概率分布的基础上的,比如t检验的t值服从t分布,方差分析的F值服从F分布,卡方检验的卡方值服从卡方分布等。因此在小胖展开推断性统计分析或统计检验之前,先和大家一起熟悉一下概率分布。小胖首先简单介绍一下几个常见的概念:Randomvariable(随机变量):假设我们掷駛币,那么出现的结果有两种:正而或反面。我们换个角度,把正而和反而的结果与数字联系起来,将结果数量化,比如我们掷10次破币,出现5正5反。这时我们就把掷硕币的结果(正或反)与出现正或反结果的数字联系起来了。而随机变量就是一种function,它把每一种结果都与一个唯一的数值联系起来。对于随机变量的定义,版本有很多,我们来看一下其中的一个定义:一个随机试验的可能结果(称为基本事件)的全体组成一个基本空间Qo随机变量X是定义在基本空间Q上的取值为实数的函数,即基本空间Q中每一个点,也就是每个基本事件都有实轴上的点与之对应。随机变量一般可分为离散型随机变量(discrete)和连续性随机变量(continuous)。所谓离散型随机变量是指随机变量X的取值是有限个或可列无限个。比如我们掷硬币,我们定义随机变量是止面的次数,那么我们掷10次,那么X的取值只能是0,123,4,5,6,7,8,9,10,这时我们就称X是个离散型随机变量。所谓连续性随机变是指X可以取某一区间的所有值。比如,我们定义X为收缩压血压值,理论上来说X可以取任意非负值,此时X就是个连续性随机变量。待续。。。小胖说统计之二六三:概率分布(二)有109次阅读2010-09-1314:38接上篇。。。了解了什么是随机变量,接下来我们开始看一下什么是概率分布。。2.概率分布(probabilitydisIribulion)TheprobabilitydistributionassociatedwiththerandomvariableXdescribesthelikelihoodofobtainingcertainvaluesorrangesofvaluesoftherandomvariable.概率分布是描述随机变量取某个特定的值或取某一区间范围内值的概率。对应着概率分布的定义,取某个特定的值或取某一区间内的值,或者说对应着离散型变量或连续性变量,\n概率分布可以分为离散型概率分布和连续性概率分布。常见的离散型概率分布有二项分布(BinomialDistribution)和泊松分布(PoissionDistribution)。常见的连续性概率分布,我们一般称为ProbabilityDensityFunction,包扌舌正态分布(NormalDistribution)、t分布(tDistribution)>卡方分布(Chi-SquareDistribution)、F分布(FDistribution)等。从下篇博文开始,小胖简单介绍一下这几种临床试验中常见的概率分布。。。小胖说统计之二六四:概率分布(三)一提到概率分布,我们一般第一想到的便是正态分布,有人说没有正态分布就没有统计,由此正态分布的普遍性和重要性不言而喻。那么为什么正态分布如此普遍和重要呢?首先,很多情况下,自然界很多东西都是口然呈正态分布的,而更重耍的原因在于中心极限定理(centrallimittheorem)的应用。所谓中心极限定理是指当样本量足够大时,无论其总体分布如何,其样本均数趋于正态分布。中心极限定理为正态分布的普遍应用提供了最为坚实的理论基础。而对于上则几百例病人的临床试验来说,正态分布更是找到了其适合生长的最好土壤。另外,我们常用的一些统计方法都是依赖于正态分布的:(1)一些统计方法如t检验和方差分析,其应用的前提条件就是要求数据服从止态分布(2)而对于一些统计模型来说,比如线性模型,往往要求其残差服从正态分布。关于正态分布在统计模型中的应用,下边有一段论述很有意思,小胖摘抄下来供大家参考:正态分布对统计学家从某种角度來说是“垃圾的分布”。当向一个统计学家问什么是正态分布时,他会回答:当一个变量有多个、解释不清的因素决定,而且每个因素的作用都不强,于是变量就呈现正态分布。一个随机变量中有两种成分,一是非随机成分,一是随机成分分。建模把非随机部分用模型(函数形式)来表达,纯随机的成分就成了残差。回归不论线性与否,残差是正态,说明模型不能表达的成分确实是“垃圾”,不能再处理的。但是,我们把数据馈入模型,结果发现残差非止态(或并非白噪音),怎么办,最理想的办法是修改模型,使其符合正态假设。回归其实就是在杂乱的信息中,把有规律的信息用模型表达出来,而无规律的白噪声滤掉。