常用统计学方法分析 154页

  • 997.00 KB
  • 2022-08-29 发布

常用统计学方法分析

  • 154页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
ACOURSEOFLECTURES1\nWelcome2\n医学科研设计与数据处理网络多媒体学习系统讲座3\n医学科研设计与数据处理网络多媒体学习系统医学科研设计中常见的错误及其对策实验设计的基本要素、原则及常用的实验设计方法常用统计分析方法选择统计分析方法的技巧数据处理中常见的差错分析多选题练习4\n医学科研设计中常见的错误及其对策5\n实验设计中常见的错误:试验组有干扰实验效应的因素试验组病例选择上的偏倚组间试验对象的重要影响因素不一致,使组间无可比性组间基线不一致,影响结果的可比性临床药物疗效试验未设置对照组未遵循随机原则分配试验对象,研究者有期望偏倚探讨二者关系的研究,未设置对照组6\n例1:“排膜汤+白药治疗药物流产后子宫出血的疗效”一文中研究对象为早孕患者共200人,随机分为两组。试验安排:对照组100人,先服米非司酮,然后服维生素C;试验组100人,先服米非司酮,后服排膜汤+白药,观察两组患者流产后子宫出血的情况。7\n问题:本例设计对照组采用空白对照,而试验组的处理因素有两个(排膜汤和白药),即试验组的观察效应(子宫出血情况)中混杂有两个因素的作用。如果研究的目的是观察排膜汤的疗效,那么在对照组中未施加白药因素的情况下,则不仅有扩大两组的差别的作用,而且使试验组的效应不清楚是排膜汤的作用还是白药的作用。如果研究目的是观察排膜汤和白药联合用药的疗效,那么本例缺乏参比对象。因此无论何种研究目的,该研究的对照设置均存在问题。8\n释疑:为了解排膜汤是否有作用,研究对象随机分组,安排对照组服米非司酮+白药,试验组服米非司酮+服排膜汤+白药;如为了观察排膜汤与白药的联合疗效,则对照组应设置服米非司酮+排膜汤。这样,通过与对照组的比较,均衡试验组中的干扰因素效应,才能较准确的观察对比两组的疗效。9\n例2:“套管针在急性心肌梗死溶栓疗法中应用”一文,作者选用1995年~1996年心肌梗死患者中使用溶栓疗法的20人。试验组采用套管法,研究对象条件为:选用静脉好、直、血流足、充盈好的10个患者;对照组采用常规法,剩下10人为对照。比较两组采血的时间是否不同。结果(略)。结论:试验组采血时间快于对照组。10\n问题:作者在选择试验组对象上有偏倚,即两组试验对象在比较的试验效应(采血时间)的主要影响因素上明显不一致,使本研究获得“理想”的结果。显然,选择对象上的偏倚歪曲了实验结果,组间的试验效应无可比性,不能说明采血时间快于对照组是套管法的效应。同时两组患者也未随机分组,可能存在其他影响试验效应的因素。11\n释疑:为说明套管法的采血时间效应,应选择符合本次试验要求的(假设均要求选用静脉好、直、血流足、充盈好的患者),n个患者为试验对象,明确研究对象的纳入标准,随机将,n个对象分为试验组(套管法)和对照组(常规法),比较二者的采血时间效应。12\n例3:“都乐式分娩法的效应”一文,对96例分娩产妇做了临床观察。作者的设计如下:选择在本院分娩产妇为试验对象,分娩产妇自愿进入试验组或对照组。试验组(46例):处理因素是在整个分娩过程中有医院助产士为陪伴人,完成整个分娩过程;对照组(50例):处理因素为采用常规法观察分娩过程。作者结论:两组在产程、合并症、出血量上都有差别。13\n问题:1.本研究中采用了非随机对照试验,研究对象的分组有偏倚,组间试验对象影响试验效应的因素不一致。2.试验组的处理因素(分娩过程用医院助产士为陪伴人)的效应是已知的。研究结果不能说明问题。14\n释疑:明确试验因素的选取(如产妇的陪伴人),明确试验对象的选择和纳入标准,采用随机分组,使分娩过程两组的其他影响因素大致一致的前提下,观察两组的试验效应。15\n例4:“不稳定心绞痛冠心病患者护理疗效的观察”一文,研究对象为有心绞痛的冠心病患者。作者设计,A组:住CCU病房的82例冠心病患者,B组:住普通病房的冠心病患者92例。两组人群药物治疗相同,但护理等级不同。观察两组在不同的护理等级情况,两组冠心病心绞痛发作时间、次数/日、血压、心率等。结论:两组各指标差别均无统计学意义。16\n问题:本研究作者希望比较护理等级不同对冠心病的疗效,但比较组的研究对象间(病情等因素)有较大的差别,即组间基线情况明显不一致,影响结果的可比性,本例结果无意义,不能说明问题。17\n释疑:评价处理治疗效果的前提,是组间试验对象影响试验效应的因素(基线情况)大致相同,如希望比较护理等级不同对疗效的影响,可将本研究的病情做分层因素(普通病房层和CCU病房的患者层),在各层(如普通病房层)中随机分组,观察不同的护理等级的疗效。18\n例5:课题“黄连素、盐酸环丙沙星溶液治疗褥疮疗效观察”临床资料摘要:1997年8月至2000年2月的30名住院患者,共44处褥疮,其中Ⅰ期24处、Ⅱ期12处、Ⅲ期8处。最小面积2cm×3cm,最大面积6cm×7cm。处方:黄连素粉、盐酸环丙沙星溶液调制软膏敷于褥疮面,7天为一个疗程。结果见下表。19\n表黄连素、盐酸环丙沙星溶液治疗褥疮疗效观察褥疮期第一疗程第二疗程例数治愈显效好转无效例数治愈显效好转无效Ⅰ242031044000Ⅱ12821143100Ⅲ8213263111合计44306531410211*此处例数指褥疮数20\n作者结论:由表显示,经两个疗程治疗,44处褥疮有40处治愈,占90%,显效2例占4.55%,好转和无效各1例占2.27%,第一疗程治愈率为68.18%,其中Ⅰ期为83.13%。经第二疗程后,Ⅰ期褥疮全部治愈。Ⅱ期褥疮患者除1例好转,余全部治愈。21\n问题:1.本文为药物治疗褥疮疗效的临床评价,应设置对照组(常规药)加以比较,以确定研究药物的疗效。2.本例研究结论称该药治愈率为90%,实际I期褥疮24处(占54.5%),由于病情轻的病例较多,得到的“较高”治愈率是药物作用或是病情因素的作用所致难以客观评价。22\n释疑:许多疾病的恢复有一定的自限性,并且治疗过程中其他非处理因素也可对疗效产生影响。因此,为反映药物的真实疗效,一定要设置对照组,通过与对照组的对比,排除治疗过程和患者病情(褥疮面积)、护理方法等因素对疗效影响。同时,通过与常规药的比较,反映新药与常规药的优劣程度。23\n例6:“烫伤消疤软膏治疗褥疮临床分析”作者设计如下:选择脑损伤、下肢骨折、脊柱损伤发生在骶尾部褥疮患者50人,将30例较重的褥疮患者用烫伤消疤软膏外敷治疗,20例轻症用传统生肌膏治疗作为对照,作者强调:这是特意为了解烫伤消疤软膏的效果而安排的。结果见下表。24\n表两组褥疮愈合时间组别例数愈合天数()烫伤消疤软膏3028.16±16.72生肌膏2044.54±30.49P<0.01作者结论:从结果看出,烫伤消疤软膏组虽然病情较重,反而较对照组愈合时间短,可认为烫伤消疤软膏对褥疮患者有较好的疗效。25\n问题:作者在两组患者的分配上未按随机化分组的原则,有意造成两组患者人选病情不一致,这是实验研究和医学伦理不允许的,由于研究者希望试验组结果优于对照组,在试验过程中务必会对试验组的影响结果因素加以干扰,造成试验组结果的偏倚和不真实性,可能产生人为扩大组间的差异(如上表结果)。释疑:遵循随机原则,最好采用将患者随机分配两组,盲法观察患者的疗效。避免试验过程研究人员对试验结果的干扰,结果才有说服力。26\n例7:“护士心理素质、气质类型与操作能力关系的调查”研究对象与方法:选择某院参加护理操作比赛的各科护理业务骨干(操作能力与心理素质较其它护士略胜)作为研究对象,采用“陈会昌的气质调查表”和“内外向性格测试问卷”进行调查测试,同时对参赛者在参加预赛和决赛前的脉搏情况(反映心理素质)进行测试。结果:“内外向性格测试问卷”的调查中,混合型偏内向型的有13名(占46%),“陈会昌的气质调查表”调查结果(数据略)中多血质型有9人(占32.1%),多血-粘液型有8人(占28.57%)。28名护士的预赛与决赛前的脉搏数无统计差别(P>0.05)。27\n作者结论:通过调查,说明这28名护理业务骨干的操作能力与心理素质稳定性、气质类型和性格有关系,认为多血质型和多血-粘液型及性格为内外混合型的护士,在实施“人-岗匹配”上,更胜任做ICU、急诊护士。28\n问题:本例研究是了解护士心理素质、气质类型与操作能力的关系,作者仅仅通过调查护士骨干组的心理素质、气质类型,就得出有上述类型特征的护士与其操作能力有关的结论显然欠妥。例如本例操作能力一般的护士中“内外混合型”的人数比例未知,无对比结果,结论的说服力不强,故应设置相应的对照组。29\n释疑:本例研究可采用“病例—对照研究”的设计,安排护士业务骨干为“病例组”,在本院护士中随机抽取30名左右的非业务骨干护士(学历、年龄、护龄等影响因素大致相同)做为对照组,同时测定两组人的气质类型和性格结果做对比。如两组人在测定的气质类型与性格类型的(见下页表)人数分布上有统计差别,方可认为气质类型和性格与操作能力有关系。30\n表内外向测验问卷结果内容护士业务骨干组非护士业务骨干组人数百分比(%)人数百分比(%)稍外向13.57混合型偏外725.00混合型偏内1346.43稍内向621.43较内向13.57合计28100.00注:非护士业务骨干组无数据,空缺31\nContinue32\n实验设计的基本要素、原则及常用的实验设计方法33\n一、实验设计的基本要素:处理因素受试对象实验效应34\n处理因素:处理因素的分类区分处理因素与非处理因素处理因素应当标准化处理因素的数量35\n受试对象:病例的来源病例必须经过严格标准诊断规定纳入标准明确排除标准36\n实验效应:关联性客观性选用灵敏度较高的指标选用精确性较强的指标化验指标必要时规定所采用的方法37\n二、实验设计的基本原则:对照的原则随机的原则重复的原则均衡的原则38\n对照的原则:设立对照组的理由设立对照组的方法对照方式对照存在的问题39\n设立对照组的理由:抵消比较组间疾病自然史不同的影响抵消安慰剂效应抵消除治疗措施以外其它因素的干扰40\n设立对照组的方法:把研究对象随机地分入对照组和试验组进行比较,并要求它们之间具有可比性;各组应同时进行试验;各组的例数应尽可能相等;41\n对照方式:随机同期对照自身前后对照交叉对照标准对照空白对照潜在对照42\n对照存在的问题:未设对照组对照例数过少对照不合理43\n随机的原则:随机化的意义随机化方法⑴简单随机分组⑵分层随机分组⑶顺序分配方法44\n重复的原则:重复的意义影响样本大小的因素估计样本含量的方法45\n影响样本大小的因素⑴研究总体的变异程度⑵容许误差的大小⑶检验效能⑷Ⅰ型错误的概率水准46\n完全随机设计配对设计配伍组设计交叉设计析因设计拉丁方设计正交设计序贯试验队列研究病例对照研究三、常用的实验设计方法:47\n(一)完全随机设计1.方法⑴只能分析一个因素2.适用条件和特点⑵用于两个或两个以上样本比较⑶各个样本例数可以相等或不等3.统计分析方法t检验、单因素方差分析48\n(二)配对设计1.方法2.适用条件和特点⑴适用于同体比较⑵同体比较时前后间隔时间不宜过长3.统计分析方法配对t检验、秩和检验49\n(三)配伍组设计1.方法2.适用条件和特点⑴设置配伍组的条件和配对条件相同⑵此设计增强了各组间的均衡性、研究的效率等3.统计分析方法配伍组设计方差分析50\n(四)交叉设计1.方法⑴两次观察时间不宜过长,前后无后期效应影响2.适用条件和特点⑵多适用于各种慢性病治疗设计⑶节省样本,容易控制条件3.统计分析方法秩和检验、方差分析51\n(五)析因设计1.方法⑴是一种多因素的交叉分组试验设计2.适用条件和特点⑵可检验各因素间的交互作用⑶可以节约样本含量3.统计分析方法方差分析52\n(六)拉丁方设计1.方法2.适用条件和特点⑴必须是3个因素的试验,且3个因素的水平数相等⑵行间、列间、处理间均无交互作用⑶各行、列、处理的方差齐⑷各行、各列、各处理的观察个数相等⑸试验效率高,可进行行、列间均数的比较3.统计分析方法方差分析53\n(七)正交设计1.方法2.适用条件和特点⑴用于找出各因素对指标的影响,并指出哪个是主要的,哪个是次要的,哪个起独立作用,哪个起交互作用⑵选出各因素中的一个最佳水平3.统计分析方法直观分析、方差分析54\n(八)序贯试验1.方法2.适用条件和特点⑴常用于控制的临床试验、药物评价⑵要能较快获得结果⑶仅以单一指标作结论依据⑷节省样本数3.统计分析方法t检验55\nContinue56\n常用统计分析方法统计分析方法常用统计分析方法一览表选择统计分析方法流程图57\n统计分析方法基本统计方法临床统计方法多因素统计方法58\n基本统计方法统计描述:统计图表、统计指标统计估计:点值估计、区间估计假设检验:t检验、χ2检验、方差分析等59\n临床统计方法临床科研设计诊断统计方法疗效统计方法临床实验室统计方法60\n多因素统计方法多元线性回归分析多元线性相关分析判别分析聚类分析因子分析通径分析logistic回归分析Cox模型分析61\n常用统计分析方法一览表62\n表常用统计分析方法一览表名称统计符号主要应用均数或反映计量正态资料的集中趋势标准差σ或s反映计量正态资料的离散趋势均数±标准差±s确定计量正态资料的参考值范围t检验t计量配对资料研究;总体均数与样本均数比较;小样本均数比较;相关系数的假设检验63\n表常用统计分析方法一览表(续1)名称统计符号主要应用u检验u两大样本均数比较方差分析F多个均数比较;多个均数间的两两比较;因素间交互影响研究相对数相对数用于反映某现象的相对水平卡方检验两率比较;多率比较;计数资料的相关性研究;分布拟合研究64\n表常用统计分析方法一览表(续2)名称统计符号主要应用Ridit分析R两组或多组等级资料分析相关与回归r、b两变量相关关系分析;由一变量推测另一变量多元分析bi、b’i多变量相关关系研究;多因素分析;疾病预测;病因分析;筛选指标65\n表常用统计分析方法一览表(续3)名称统计符号主要应用统计图直条图——比大小直方图——看分布线图——观趋势构成图——看构成散点图——看关系箱式图——比大小66\n选择统计分析方法流程图67\n选择统计分析方法流程图研究目的变量个数资料类型统计分析目的寻找病因、诊断评价、疗效分析、病例分析、关系探讨单变量、双变量、多变量计量资料、计数资料、等级资料描述:统计图表、指标描述推断:估计、假设检验68\n选择统计分析方法流程图统计分析方法运算报告±S、相对数、相关系数、t检验、u检验、方差分析、卡方检验、Ridit分析手工计算计算机统计分析运算:SAS、SPSS统计结论、专业结论69\nContinue70\n选择统计分析方法的技巧统计分析方法的选择应根据资料类型,结合研究目的进行。71\n选择统计分析方法的技巧(一)依据临床资料类型选择方法(二)结合统计分析目的选择统计处理方法(三)结合临床研究目的选择统计处理方法72\n(一)依据临床资料类型选择方法计量资料(定量变量、数值变量)计数资料(无序分类资料、定类资料)等级资料(有序分类资料、定序资料)73\n临床资料类型与统计方法对应关系为:统计描述统计推断计量资料±St、u、F计数资料相对数检验等级资料相对数Ridit分析、秩和检验74\n(二)结合统计分析目的选择统计处理方法75\n直观法描述目的指标法估计推断假设检验76\n计量资料:直方图、相关图、线图直观法计数资料:直条图、构成图等级资料77\n计量资料:、M、G集中趋势指标计数资料:构成比等级资料:同计数资料计量资料:S2、S、Q3、Q1指标法离散趋势指标计数资料:率等级资料计量资料:r相关指标计数资料:相对比等级资料:等级相关系数rs78\n点估计计量资料:μ=计数资料:π=P计量资料:计数资料:区间估计估计79\n假设检验计量资料计数资料等级资料两均数比较多均数比较两率比较的χ2检验多率比较的χ2检验小样本t检验大样本u检验单因素方差分析双因素方差分析秩和检验Ridit分析80\n(三)结合临床研究目的选择统计 处理方法病因研究诊断研究疗效研究关系研究81\n病因研究计量资料:±S、t检验、u检验计数资料:相对数、检验、OR、RR多元分析:Logistic回归、多元线性相关与回归82\n诊断研究常用指标:敏感度、特异度、假阳性率、阳性符合率、阴性符合率、似然比、漏诊率、误诊率诊断指数(J)统计诊断法判断一致性(Kappa值)±S、t检验、方差分析83\n疗效研究计量资料:±S、t检验、u检验、方差分析计数资料:相对数、检验等级资料:相对数、Ridit分析生存率研究:生存率的计算与检验、Cox模型84\n关系研究计量资料:积差相关系数(r)、回归系数、偏回归系数、标准偏回归系数、复相关系数、±S、t检验、u检验等级资料:等级相关系数(rs)、秩和检验计数资料:、φ85\nContinue86\n数据处理中常见的差错分析87\n数据处理中常见的差错计量资料统计分析中的常见问题计数资料统计分析中的常见问题表达假设检验结果时存在的问题解释相关分析结果时存在的问题88\n计量资料数据处理及分析中常见差错的类型:选用统计指标来描述平均水平和离散趋势时,使用正态分布的方法表达呈偏态分布的资料选用标准差(s)还是标准误()时存在的问题忽视t检验的使用条件,在多组均数比较中,用t检验代替方差分析组间比较未排除基数的影响,导致统计处理可能无差别将计量数据化为等级数据或计数数据,会造成信息损失或结论的不一致89\n【差错分析例1】原先的资料表达形式(见表1)表1两组褥疮愈合时间指数对比(±s)组别愈合时间指数猪皮组1.34±2.63对照组0.75±1.4790\n【差错分析例2】某人观察了某医院某年151例慢性胃炎患者的住院天数,如下表。91\n表151例慢性胃炎患者住院天数住院天数频数(f)频率(%)0-7046.3615-5435.7630-1610.6045-53.3160-42.6575-10.0690-00.00105~11510.06合计151100.0092\n表统计结果中位住院天数P25~P75最小值~最大值16.538.09~27.014~108作者采用均数±标准差的方法,得出慢性胃炎患者平均住院天数为20.30±16.83(天)的结论。此结论欠妥,因为该资料的频数分布呈较明显的偏态,应该用中位数描述其集中趋势,用四分位数间距描述其离散趋势。如下表所示。93\n【差错分析例3】某人用烫伤消瘢软膏治疗褥疮,选择脑损伤、下肢骨折、脊柱损伤患者中发生骶尾部褥疮患者50人,将30例患者用烫伤消疤软膏外敷治疗,20例患者用传统生肌膏治疗作为对照组,用两组褥疮愈合时间(d)反映疗效,结果见下表。组别例数愈合天数烫伤消疤软膏3028.16±16.72生肌膏2044.54±30.49P<0.01表两组患者褥疮愈合时间(d)94\n表不同用药后患者褥疮愈合时间(d)(修改表)注:本例无原始数据,无法计算出中位时间中位愈最短最长组别例数愈合天数合天数愈合愈合()(M)天数天数烫伤消疤软膏3028.16±16.72生肌膏2044.54±30.4995\n【差错分析例4】为确定老年人(67~73岁)围手术期头孢唑啉钠的合理用法和用量,某研究小组对老年人与60岁以下者的头孢唑啉钠药物动力学特征分别进行了测定,并进行了比较,其部分结果见下表。96\n表两组患者头孢唑啉钠药物动力学参数比较()研究者依据P值认为两组在和k10两项指标上差异无显著性意义。你认为如何?组别(h–1)k10(h–1)老年组(n=7)0.6213±0.11770.2856±0.042760岁以下组(n=5)3.5505±3.55530.8257±3.5329成组t检验t值1.841.60P值>0.05>0.0597\n⑴差错分析本例差错为忽视了t检验的前提条件。在该项研究中我们可以看到,老年组的变异相对较小,而60岁以下组的变异是巨大的。这里可能包含多种原因:①原文给出老年组年龄范围为67~73岁,而60岁以下组年龄范围未给出,不能排除60岁以下组年龄变动范围较大导致变异加大;②不能排除有个别观测值超常;③当然也可能有随年龄增大个体差异减小的规律,但需排除前面两种可能,尤其是第一种。这样的情况给假设检验带来了麻烦,t检验用在这里是不合适的。因为虽然“个体之间的独立性”在这里是可以满足的,但样本来自正态分布总体和两总体方差相等的前提条件尚得不到满足。98\n⑵释疑首先我们来看正态性方面的问题。因为无法得到原始数据,因而不能进行严格的正态性检验,我们依据的是一种经验。当所有观测值都是正值时,若测定值服从正态分布,则一般来说,标准差s不会大于均值,更不会是均值的若干倍。因为s是正态曲线上拐点到中垂线“X=μ”的距离,曲线左侧观察值X的变化范围为[0,μ],故s应小于μ。在实际应用中,考虑到s有抽样误差,s接近或稍大于是有可能出现的结果,但s不应是的若干倍。在本研究中,60岁以下组的k10(h-1)的标准差数倍于均数。因此,根据经验,可以认为60岁以下组患者的k10(h-1)指标的取值不符合正态性要求。99\n接下来让我们来检验一下两个指标所对应的两组方差是否满足齐性。对本例中指标α而言,H0:两总体方差相等;H1:两总体方差不等;F=3.55532/0.11772=912.43。查方差齐性检验用的F值表,得F0.05(4,6)=6.23,F>F0.05(4,6),得P<0.05。可以认为此F值属‘过大’,故应拒绝H0接受H1,即可以认为两总体方差不等。同理,可检验另一个指标观测值的总体方差也不满足齐性要求。在两项前提不成立的情况下,使用t检验显然是不合理的。类似问题在医学研究中经常遇到。经验表明,在医学领域的很多实际问题中,方差不等经常与资料不服从正态分布同时存在。顺便提一下,100\n在此例子中t值的计算也是错误的,即使按错误的方法计算,该例中t统计量的值也分别应该是2.22和0.41。分析配对设计资料时也经常面临同样的问题,请根据前面介绍的方法进行总结和鉴别。那么这样的问题应该如何解决呢?解决的方法可以有两种:①通过对原始数据进行变量变换,使之满足正态性和方差齐性的要求,最常用的变量变换方法有对数变换和开方变换,部分非正态分布的情况通过变换可以得到很好的校正;②直接采用与分布无关的方法,如秩和检验、符号秩和检验等。但无论采取什么对策,都需提供各受试者的原始数据方可计算。本例只有“”的数据,无法用正确的方法进行分析。101\n【差错分析例5】某作者在表达一组正常人与五组患不同肝脏疾病的患者血清PCⅢ测定及统计处理结果时,编制出如表5的一张统计表。请分析有无差错。102\n表5正常人与5组不同疾病患者血清PCⅢ的测定结果组别例数(μg/L)P值正常对照10085.0±17.5——急性病毒性肝炎22131.1±30.2<0.01慢性迁延性肝炎1894.9±26.5>0.05慢性活动性肝炎13188.2±73.9<0.001代偿性肝硬化10227.4±91.0<0.001失代偿性肝硬化20266.2±157.5<0.001103\n【差错分析例6】某人研究三个部位注射药物后的吸收率是否不同,将15只动物随机分为3组,在不同部位注射某药,测定药物的吸收率(%),结果见下表,各组间比较采用t检验。表某药物在三个部位吸收率(%)的比较比较组例数药物吸收率()P值部位甲588.28±7.12部位乙579.72±3.33*<0.05部位丙564.66±10.55**<0.01∆:*表示该组与部位甲比较P<0.05,**表示该组与其它组比较P<0.01104\n作者结论:三种注射部位药物吸收率的差别均有统计学意义。部位乙吸收率低于部位甲,而部位丙吸收率低于甲、乙部位。105\n本例资料为单因素三个水平(三组均数)设计的比较,两两间比较采用t检验欠妥。在比较组数>2时,均数间的比较最好采用方差分析和均数的两两比较,以减少犯Ⅰ型误差的概率。本例资料采用方差分析后,F=12.385,P=0.0001,采用多个均数两两比较的Newman-Keuls法(又称为q检验),结果如下表。106\n表某药物在三个部位吸收率(%)的比较比较组例数药物吸收率()P值部位甲588.28±7.12部位乙579.72±3.33*>0.05部位丙564.66±10.55**<0.01*表示该组与部位甲比较P>0.05,**表示该组与其它组比较P<0.01107\n【差错分析例7】某研究者用不同导尿方法观察对老年前列腺增生患者血压和心率的影响,结果见下表表两组患者导尿前与插管时DBP和HR变化的比较()组别例数DBP(kPa)HR(次/min)导尿前插管时导尿前插管时试验组1510.06±0.7610.23±0.7873.87±5.3275.20±5.56对照组1510.08±1.0212.54±1.28*72.40±4.9187.00±4.93**P<0.05108\n作者结论:“试验组插管时的DBP和HR与导尿前比较,经t检验,P>0.05,无统计学差异,说明导尿插管过程中,血压、心率稳定。对照组插管时的DBP和HR与导尿前比较,经t检验,P<0.05,有统计学差异,说明该组导尿前与插管过程中,血压、心率变化显著,因此认为试验组导尿方法优于对照组。”作者的结论是根据各组插管时的均数与导尿前均数作t检验后得出的,而插管时不同处理的试验组与对照组均数间未作统计检验。此统计结论并不能说明用不同的方法对血压和心率的影响是否有不同。109\n本研究为试验性质的研究,各组基线值(导尿前)的测定是必要的,它反映两组间接受处理前的齐性情况,同时该研究设置对照组也反映了每个试验对象在接受处理过程时产生的效应和其他因素的效应。因此,本例的统计检验方法应对各组每个试验对象观察指标的差值(差值=导尿前-插管时)作统计计算的变量值,即用两组的各差值作比较(用成组t检验),这样可消除基线不同和其他因素的影响,来说明用不同的导尿方法对血压和心率的影响是否有不同。110\n【差错分析例8】某研究者比较了用静脉滴注丙种球蛋白治疗毛细支气管炎的临床疗效,结果见下表表静脉滴注丙种球蛋白治疗毛细支气管炎的疗效组别喘憋消失时间(小时)合计<2424~48>48治疗组21(72.4)6(20.7)2(6.9)29对照组17(39.5)19(44.2)7(16.3)43注:括号内为构成比作者用χ2检验,χ2=7.521,P<0.01。结论:治疗组与对照组患者喘憋消失的时间不同,治疗组患者喘憋消失时间短于对照组。111\n本资料为两组不同治疗方法对支气管炎临床疗效的比较,疗效指标为患者喘憋消失时间的计量数据。作者将原计量数据人为地划分为三个组段,归类为计数数据频数表,采用χ2检验处理,这种划分归类未描述出各组平均喘憋消失时间概括值情况,损失了数据的信息,如果人为地将计量数据分组用计数方法处理,组段划分的不同,会造成结论可能不一致。本资料的喘憋消失时间为计量数据,如满足t检验的条件应采用t检验,如不满足,则应采用秩和检验。112\n计数资料统计分析中的常见问题应用相对数时存在的主要问题1.计算相对数时的分母太小2.误用百分比取代百分率3.误用百分率取代构成比应用χ2检验时存在的常见问题1.资料的条件不满足公式的要求,却盲目套用•误用一般χ2检验取代校正的χ2检验或配对的χ2检验•误用一般χ2检验取代Fisher精确检验•误用一般χ2检验取代单向有序行列表应该使用的秩和检验•忽视了行×列表χ2检验时的注意事项——理论频数不能太小•忽视了χ2分割法的应用2.关于一般2×2表资料三种分析方法的选用标准113\n表血清TPS检出率与消化道肿瘤淋巴结转移的关系肿瘤淋巴结转移无淋巴结转移例数TPS阳性率(%)例数TPS阳性率(%)食管瘤77100.03133.3胃癌9666.7100.0大肠癌10770.0000.0合计262076.94125.0【差错分析例9】114\n一般来说,观察例数足够多时,计算的相对数比较稳定,能够正确反映实际情况。在实用中,观察例数少于20时,不宜计算相对数,而直接给出实际例数即可。115\n【差错分析例10】原先的资料表达形式如下表所示病人术前术后常见的心理问题(n=50)心理问题人数百分比(%)恐惧手术4182.0希望术后病痛解除3468.0希望手术细心3060.0担心为恶性病变2856.0担心远期并发症2550.0担心手术未成功1734.0担心丧失工作能力1122.0116\n【差错分析例11】表400例创面分泌物细菌培养(原表)大肠杆菌副大肠杆菌粪产碱杆菌金黄色葡萄球菌白色链球菌绿脓杆菌合计创面分泌物百分率(%)15039.75215.256616.58220.56315.7592.25400100117\n表400例创面分泌物的细菌培养结果(修改表)细菌分类例数构成比(%)大肠杆菌15939.75副大肠杆菌215.25粪产碱杆菌6616.50金黄色葡萄球菌8220.50白色链球菌6315.75绿脓杆菌92.25合计400100.00118\n【差错分析例12】某人用两种方法对高危出血热患者透析后死亡情况进行了比较,结果如下表。表两种方法对高危出血热患者透析后死亡情况组别例数死亡数未死亡数死亡率(%)试验组232218.69对照组1941521.31合计4263614.28119\n作者统计处理方法:=4.1,结论P<0.05,两组死亡率的差别有统计学意义,试验组的方法能降低高危出血热患者透析后死亡率。本例资料满足应用校正公式的条件,经计算=0.48,0.48<3.84,P>0.05,结论为两组死亡率的差别无统计学意义,与原作者结论相反。120\n【差错分析例13】研究者分别用两种方法检测120份标本,PCR法检测得到28份标本为阳性结果,ELISA法检测得到23份标本为阳性结果。阳性检出率比较:χ2=5.490,0.01<P<0.05(=3.84,=6.635),两方法间有显著性差异。表PCR法与ELISA法检测结果ELISAPCR+-+230-592121\n【差错分析例14】某作者欲研究不同分娩方式与重症肝炎孕妇死亡的关系,将资料列于下表表不同分娩方式与重症肝炎孕妇的结局分娩方式例数存活死亡剖宫产981阴道分娩1349合计221210122\n原作者使用一般χ2检验,得χ2=7.246,P<0.01,统计结论为两种分娩方式的存活率间的差别非常显著。专业结论为:应适当地选择分娩方式,并积极采取一系列支持疗法,有利于降低妊娠合并内科疾病的孕产妇死亡率。123\n【差错分析例15】某人用不同药物对肿瘤患者术后止吐的效果进行了比较,原结果见下表表不同止吐方案对肿瘤患者止吐的效果组别呕吐分级合计Ⅰ级Ⅱ级Ⅲ级Ⅳ级(0次)(1~3次)(4~6次)(≥7次)治疗组126(76.8)19(11.6)11(6.7)8(4.9)164(100.0)对照组5(10.0)15(30.0)13(26.1)17(34.0)50(100.0)注:括号内为各等级构成比(%)原作者统计学检验方法:χ2检验,P<0.01124\n本例为两组有序(等级)资料的比较,研究目的是了解不同处理组间呕吐级别(次数)的分布有无差别,选用χ2检验欠妥。本例最好用秩和检验,采用了两组比较的秩和检验后,得u=8.73,P<0.001。表示治疗组与对照组疗效不同,呕吐次数的分布上差别有显著性。为说明治疗组在止吐的疗效上优于对照组,计算两组的平均呕吐次数,结果见下表,其中治疗组平均呕吐不到1次,对照组平均呕吐约5次。125\n表不同止吐方案对肿瘤患者止吐的效果(修改表)比较组例数呕吐次数(中位数)治疗组1640.65对照组545.15126\n【差错分析例16】某研究者研究盐酸地尔硫缓释片治疗心绞痛的效果,收集到如下的数据[表16-(a)]。表16-(a)两药对心绞痛疗效比较临床疗效缓释片组(n=88)普通片组(n=80)P显效71.58%(63)43.75%(35)有效22.72%(20)38.75%(31)无效4.55%(4)17.50%(14)加重1.14%(1)10.00%(0)总有效率94.30%82.50%>0.05127\n原作者没有提及使用了哪一种统计分析方法处理资料,仅仅给出了“P>0.05”的结果,并据此认为:两组治疗总有效率无统计学差异,说明缓释片与普通制剂相似。128\n⑴差错分析本例差错为由于可能误用了统计分析方法,得出了错误的结论。我们不知道该作者用何方法计算得出以上结论。若用两个大样本率的U检验,应得到如下结果:U=2.41,因U>U0.05=1.96,所以P<0.05。如果忽视临床疗效指标的有序性,错误地使用检验分析,则计算结果为χ2=16.585,因χ2>11.345,(=11.345)故P<0.01。前一种处理方法对于资料的利用率很低;后一种处理方法与单向有序列联表不匹配。但这两种可能被选用的方法都得不出“P>0.05”的结果,作者的结论不知道用什么方法计算所得。129\n表16-(b)两药对心绞痛疗效的观察结果临床疗效缓释片组例数普通片组例数合计显效633598有效203151无效+加重51419合计8880168⑵释疑显然原资料“加重”组的例数太少(分别为1和0),应将其与“无效”组合并。于是,将原表修改成表16-(b)。130\n由于这是一个单向有序的列联表资料,实验分组变量的水平数为2,故选用秩和检验较合适。Hc=14.1969,P=0.0002。结论为:两个治疗组的疗效之间的差别具有非常显著性意义。结合具体问题分析,缓释片的“有效+显效”率(94.32%)高于普通片的“有效+显效”率(82.50%)。131\n【差错分析例17】某人观察了静脉滴注丙种球蛋白治疗毛细支气管炎的临床疗效,结果见下表。表静脉滴注丙种球蛋白治疗毛细支气管炎的临床疗效比较132\n作者计算三个χ2值不正确;喘憋消失时间分组组段表达为~24、~48,不符合统计常规的表达方法,易造成误解。本例应采用两组比较的秩和检验,u=2.642,P<0.01,差别有统计学意义,治疗组患者喘憋消失时间短于对照组。133\n【差错分析例18】某研究者欲分析产次与新生儿低体重发生率的关系,收集到数据如下表〔表18-(a)〕。表18-(a)产次与新生儿低体重率产次活产数LBW例数百分率(%)RR199514954.971.08224581144.641.003204188.821.98134\n该研究者采用了一般的3×2表的检验方法,得=6.99,P<0.05,结论为“不同产次的低体重发生率有显著意义,第二产低体重率最低,大于等于第三产低体重率及相对危险度上升”。135\n⑴差错分析本例错误之处在于根据3×2表资料的分析结果武断地推测两两比较的结果。该资料的值仅仅说明总体上不同的产次间低体重发生率至少有两组间的差别有显著性意义,并不意味每两组间的差异都有显著性意义,要比较任何两种产次间的差别,应进行两两比较(需降低每次检验的显著性水平的数值,若α=0.05,可令α’=0.05/C,其中C等于比较的次数,本例C=3)或采用分割法(要求分表的自由度等于总表的自由度、分表的值之和等于总表的值)进一步分析。136\n⑵释疑本例的“产次”是一个有序分组变量(从性质上来看,它属于自变量),“低体重”与“非低体重”是一个二值变量(从性质上来看,它属于因变量)的两个具体取值,较适合选用线性趋势检验或logistic回归分析。如可用SAS软件作线性趋势检验,此处从略。这里把“产次”看作一般名义分组变量来检验各产次的低体重发生率之间的差别有无显著性意义。先将一、二产次对比,若差别无显著性,则将其合并与第三产次对比。137\n该资料的值仅仅说明总体上不同的产次间低体重发生率至少有两组间的差别有显著性意义,并不意味着每两组间的差异都有显著性意义。要比较任何两种产次间的差别,应进行两两比较,即采用分割法进一步分析。①一、二产次间的比较,结果见表18-(b)H0:π1=π2(1、2产次间低体重儿发生率相等);H1:π1≠π2(1、2产次间低体重儿发生率不等);α=0.05138\n表18-(b)表18-(a)的部分结果产次低体重例数正常例数合计149594569951211423442458合计6091180012409因n>40,且理论频数均大于5,故可选用一般的检验。得=0.478,因<=3.841,故P>0.05,不拒绝H0。结论:1、2产次低体重率间的差别无显著性意义。139\n②将1、2产次合并与≥3产次比较,结果见表18-(c)表18-(c)表18-(a)的前两行合并后的结果产次低体重例数正常例数合计<36091180012409≥318186204合计6271198612613算得=6.515,因>=6.635,所以P<0.01,拒绝H0。结论:小于3产次与大于等于3产次的低体重率间的差别有非常显著性意义,即“≥3产次”组低体重儿发生率高于1产次、2产次组,而第一、二产次组间的差别无显著性意义,不应该作出第二产次组低体重发生率最低的结论。140\n关于一般2×2表资料3种分析方法的选用标准分析一般2×2表资料,通常有3种方法,即:①一般的χ2检验:当n≥40,且理论频数T均大于5时,选用;②连续性校正的χ2检验:当n≥40,但有理论频数1≤T<5时,选用;③Fisher精确检验:当n<40,或有一个理论频数T<1时,选用;141\n表达假设检验结果时存在的问题1.解释无显著性意义的结果时存在的问题误认为P>0.05所对应的实验因素一定是无用因素2.解释有显著性意义的结果时存在的问题:误解了P<0.01和P<0.05的真正含义3.表达假设检验结果时,仅给出P值是不够的:142\n在医学论文中,可以看到表达假设检验结果有以下几种方式:⑴资料未经过任何统计处理,仅根据实际数据的大小,凭经验作出某组与另一组之间的差别有显著性的结论;⑵作了统计处理,但未交代选用的是什么统计方法,仅给出P值;⑶作了统计处理,也交代了所选用的统计分析方法,并给出了P值,但未给出统计量的具体值;143\n表达假设检验结果时,最好同时给出以下信息:⑴选用的统计分析方法⑵统计量的具体取值及其自由度⑶假设检验的确切P值⑷有关总体参数的95%置信区间144\n总之,所交代的统计分析方法要尽可能具体一些,如配对设计资料的t检验、成组设计资料的t检验、单因素设计资料的方差分析、配伍组设计资料的方差分析、四格表资料的χ2检验等,要在论文中具体给出来。145\n对相关系数r未作假设检验,就作出肯定的结论应结合r2的数值大小来评价r的假设检验结果解释相关分析结果时存在的问题146\n【差错分析例19】某研究者欲分析年龄(设为“X”)和LgA(设为“Y”)的关系,得到了32个人的年龄和LgA数据,采用的是直线相关与回归分析方法。得相关系数r=0.340,回归方程=-108.6+5.5X,由此得出结论为:LgA随年龄增大而升高。147\n原作者未作假设检验就作出肯定的结论是不妥的。虽然r=0.340>0,但不能说明总体相关系数ρ>0,即使r值再大,也不能通过样本相关系数下结论,必须对r进行假设检验。样本相关系数r存在抽样误差,应对r作假设检验后才能作出统计推断。对直线相关系数r的假设检验可用查表法来实现:υ=32-2=30,查r界值表得r0.05(30)=0.349,因r<r0.05(30),故P>0.05,说明相关性无统计学意义,即不能认为年龄与LgA有直线相关关系。因此,回归方程=-108.6+5.5X并无实际意义。148\n【差错分析例20】某作者欲分析年龄与淋巴细胞转化率的关系,调查了252人的年龄和淋巴细胞转化率,采用的统计处理方法是直线相关与回归,得相关系数r=-0.20,回归方程=76.0-0.4X。直线相关系数r的假设检验:自由度υ=250,查r界值表得P<0.01,结论是淋巴细胞转化率与年龄相关。149\n原作者“淋巴细胞转化率与年龄密切相关”的结论,对问题的回答尚不够完整和严谨。对相关系数的假设检验得P<0.01,仅说明“淋巴细胞转化率(X1)与年龄(X2)之间存在线性相关关系”。至于这两个变量间呈线性关系的密切程度,需要借助r2(称为确定系数)的数值大小来给出定量的度量。若建立由X2(年龄)推算X1(淋巴细胞转化率)的直线回归方程,则r2就等于。SS回是由于X2的变化而150\n引起X1改变的量,称为回归的离差平方和;是X1的总变异,称为总的离均差平方和。因此,r2实际上反映了X1与X2线性变化部分的量占X1总变异的百分比。本例r2=(-0.20)2=0.04,说明淋巴细胞转化率的变化中只有4%的量是与年龄有关的,所以尽管在对相关系数的假设检验中得P<0.01,但两变量之间的线性相关程度还是较低的。这提示用某种曲线方程来描述两个变量之间的变化关系,效果可能更好些。151\n152\nTheend153\nThankyou154

相关文档