- 678.56 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
等级资料的秩和检验陈涛DepartmentofEpidemiology&Biostatistics,SchoolofPublicHealthNanjingMedicalUniversityRankSumTestofRankedData\nBiostatistics2资料的分类数值变量资料分类资料二分类多分类无序多分类有序多分类(等级资料)\nBiostatistics3内容提要:1医学研究中的等级资料2秩次与秩和3两样本比较的秩和检验4多样本比较的秩和检验5配对设计的秩和检验6配伍组比较的秩和检验7秩和检验的正确应用\nBiostatistics41医学研究中的等级资料疗效:痊愈、显效、有效、无效、恶化化验结果:-、、+、++体格发育:下等、中下、中等、中上、上等心功能分级:I、II、III、IV文化程度:小学、中学、大学、研究生营养水平:差、一般、好\nBiostatistics5等级资料的特点既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;比“定量”粗,而比一般的“定性”细;等级间既非等距,亦不能度量。\nBiostatistics62秩次与秩和Wilcoxon在1945年首先提出了比较两个总体分布函数的秩和检验。秩和检验以及其它的秩检验法,都是建立在秩及秩统计量基础上的非参数方法。秩次(rank),秩统计量是指全部观察值按某种顺序排列的位序;秩和(ranksum)同组秩次之和。\nBiostatistics7例1编秩(page86)A组:-、、+、+、+、++B组:+、++、++、++、+++、+++A:-+++++B:+++++++++++++123457689101112124.54.54.58.54.58.58.58.51112124.54.54.574.589101112124.54.54.58.54.58.58.58.511.511.5尿白细胞:等级相同(tie)取平均秩次!!\nBiostatistics8秩和A组:-、、+、+、+、++秩和:124.54.54.58.5TA=25B组:+、++、++、++、+++、+++秩和:4.58.58.58.511.511.5TB=53TA+TB=N(N+1)/2=78\nBiostatistics9秩次:在一定程度上反映了等级的高低;秩和:在一定程度上反映了等级的分布位置。对等级的分析,转化为对秩次的分析。秩和检验就是通过秩次的排列求出秩和,进行假设检验。2秩次与秩和\n10Sumofranks=37Sumofranks=41769213458101112假如两组等级分布相同理论上两组秩和相近.A两样本合并排序示例B\nBiostatistics113两样本比较的秩和检验检验假设H0:A、B两组等级分布相同;H1:A、B两组等级分布不同。=0.05。\nDistributionoftwopopulationswhentheirlocationsaresame\n分布情况第1种情形…第2种情形…ABBA13\nBiostatistics14基本思想如果H0成立,即两组分布位置相同,则A组的实际秩和应接近理论秩和n1(N+1)/2;(B组的实际秩和应接近理论秩和n2(N+1)/2).或相差不大,差值很大的概率应很小。如果相差较大,超出了预定的界值,则可认为H0不成立。\nBiostatistics15A组B组和实际秩和255378理论秩和n1(N+1)/2n2(N+1)/2N(N+1)/2393978差值-14140抽样误差?如果H0成立,则理论秩和与实际秩和之差纯粹由抽样误差造成。基本思想\nBiostatistics16两样本秩和检验T界值n1=6,n2-n1=0双侧单侧28~500.100.0526~520.050.02524~540.020.0123~550.010.005间距222630326(12+1)/2=39(理论值)\nBiostatistics17检验结果如果H0成立,则按0.05水准,A组秩和之界值为26~52。现A组的实际秩和为25,在界值之外,故拒绝H0,接受H1,认为两组的分布位置不同。\nBiostatistics18秩和检验的结论判断A组的实际秩在界值之外,(小于或等于下界,大于或等于上界)则拒绝H0,接受H1。A组的实际秩在界值之内,(大于下界且小于上界)则不拒绝H0。\nBiostatistics19例题【例】某实验室观察在缺氧条件下猫和兔的生存时间,结果见表,试检验在缺氧条件下猫和兔的生存时间有无差别?\nBiostatistics20例题\nBiostatistics21检验假设H0:猫和兔在缺氧条件下生存时间总体分布相同;H1:猫和兔在缺氧条件下生存时间总体分布不同。=0.05。检验统计量T值n1=8,n2=12,检验统计量T=127.5确定P值和作出推断结论查附表10得T界值是58~110。则双侧P<0.05,按=0.05水准,拒绝H0,接受H1,差异有统计学意义,故可认为在缺氧条件下猫的生存时间较兔长。例题\nBiostatistics22例8.2用复方猪胆胶囊治疗老年性慢性支气管炎患者403例,疗效见表8.1第(1)~(3)栏。问该药对此两型支气管炎疗效是否相同?例题(page87)\nBiostatistics23例题(page87)\nBiostatistics24例题(page87)\nBiostatistics25建立检验假设H0:两型老慢支疗效分布相同;H1:两型老慢支疗效分布不同;=0.05。检验统计量n1=182,n2=221,检验统计量T=40682.5。例题(page88)\nBiostatistics26样本含量较大时,用u检验相同秩次较多时需要校正\n\nBiostatistics28确定P值和作出推断结论P<0.01,按=0.05水准,拒绝H0,接受H1,差异有统计学意义。可认为复方猪胆胶囊治疗老年性慢性支气管炎喘息型与单纯型的疗效有差别。例题(page88)\nBiostatistics294多组比较的秩和检验Kruskal-Wallis法先对所有数据编秩,求各组秩和;计算H统计量;查H界值表,或用近似2检验,计算P值;界定P值,作出结论。注:相同观察值不同组时取平均;相同组时,按位置顺序编号\nBiostatistics30【例】某医生在研究再生障碍性贫血时,测得不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平(U/ml),问不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平有无差别?例题\nBiostatistics31例题(假设不满足参数检验的要求)\nBiostatistics32例题\nBiostatistics33多组等级比较的检验假设建立检验假设H0:各组总体的等级分布相同;H1:各组总体的等级分布不同或不全相同。=0.05。计算检验统计量H值\nBiostatistics34多组等级比较的检验假设若组数k=3,每组例数ni≤9,可查附表11,H界值表得出P值。若组数k≥3,有ni≥10,则H近似服从=k1的2分布。\nBiostatistics35确定P值和作出推断结论本例k=3,查附表12,得P<0.001。按=0.05水准拒绝H0,接受H1,差异有统计学意义,可认为不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平有差别。多组等级比较的检验假设\nBiostatistics36H的校正当有相同秩次时,H需校正:\nBiostatistics37例8.3某医院用三种复方小叶枇杷治疗老年性慢性支气管炎,数据见表8.2第(1)~(4)栏,试比较其疗效有无差异。例题(page89)\nBiostatistics38例题(page89)\nBiostatistics39建立检验假设H0:三药疗效总体分布相同;H1:三药疗效总体分布不同或不全相同;=0.05。例题(page89)\nBiostatistics40计算检验统计量H值例题(page89)\nBiostatistics41由于此资料的相同秩次很多,须校正:例题\nBiostatistics42确定P值和作出推断结论故按=k1=31=2查2界值表,得20.005,2=10.60,Hc>20.005,2,P<0.005。按=0.05水准拒绝H0,接受H1,差异有统计学意义。认为三药疗效有差别。例题\nBiostatistics43多组间的两两比较如果多组等级比较拒绝H0,认为组间存在差异,则需进行两两比较。两两比较的方法很多。\nBiostatistics445配对符号秩和检验(page91)Wilcoxon符号秩和检验计算等级之差值,对差值进行编秩,并冠以差值的符号。查T界值表,或用近似u检验,计算P值;界定P值,作出结论。注:1,差数等于0,舍掉2,差值的绝对值排序,并冠以差值的符号3,差值的绝对值相等,取平均秩次\nBiostatistics45符号秩和检验的假设H0:差值的总体中位数为0;H1:差值的总体中位数不为0。=0.05。当n≤50时,查T界值表当n>50时,用u近似\nBiostatistics46扁平足疗效例(page91)用配对设计观察两种方法治疗扁平足效果记录如下,问那种方法好。(好=3中=1差=0)病例号12345678910111213141516A法好好好好差中好好中差好差好中好中B法差好差中中差中差中差好差中差中差差值2021-111200001111\nBiostatistics47符号秩和检验病例号A法B法差值秩次(1)(2)(3)(4)(5)1312102330—33121043214.5512-1-4.562114.573214.58312109220—10110—11330—12110—133214.5142114.5153214.5162114.5T+=61.5T-=4.5\nBiostatistics48符号秩和检验的基本思想总秩和为T=N(N+1)/2如H0成立,则正负各半,T+与T-均接近N(N+1)/4。如果相差太大,超出了事先规定的界值,则H0不成立。\nBiostatistics49符号秩和检验T界值表N=11双侧单侧13~530.100.0510~560.050.0257~590.020.015~610.010.005间距4046525611(11+1)/4=33(理论值)\nBiostatistics50本例T+=61.5,T-=4.5,已超出附表10中双侧P0.01相对应的界值5~61,故得P0.01。按=0.05水准拒绝H0,接受H1,认为两种方法疗效的总体分布不同。结合资料可认为A法优于B法。扁平足疗效例\nBiostatistics51u的校正当重复的秩次较多时,u需要校正:\nBiostatistics52【例】某医院检验科试用新旧两种方法检测谷-草转氨酶,新方法的检测时间由20分钟缩短为10分钟。用两种方法测一份血清,结果见表第(2)、(3)栏,问两法所得结果有无差别?例题(假设不满足参数检验的要求)\nBiostatistics53例题\nBiostatistics54建立检验假设H0:差值总体中位数Md=0;H1:差值总体中位数Md≠0;=0.05。求检验统计量T值T+=18.5,T-=36.5,其和为55,n(n+1)/2=10(10+1)/2=55。例题\nBiostatistics55符号秩和检验T界值表N=10双侧单侧10~450.100.058~470.050.0255~500.020.013~520.010.005间距4046525610(10+1)/4=27.5(理论值)\nBiostatistics56确定P值和作出推断结论本例n=10,T=18.5,查附表10,得=0.05时的T界值为8~47,T在双侧界值范围内,故P>0.05。按双侧0.05水准,不拒绝H0,差异无统计学意义,故尚不能认为两法测定血清中谷-丙转氨酶含量有差别。查表时,若T在T上、下界值范围外,则P<;若T在T上、下界值范围内,则P>。例题\nBiostatistics576配伍组比较的秩和检验(page93)Friedman法分别对每一配伍组中的观察值进行编秩;按处理组求各组秩和计算FriedmanM统计量;查M界值表,或用近似2检验,计算P值;界定P值,作出结论。\nBiostatistics58葡萄酒的等级例:白兰地评委WXYZA四二一三B四一二三C三一二四D四二三一E三一二四Ri(4)(2)(1)(3)(4)(1)(2)(3)(3)(1)(2)(4)(4)(2)(3)(1)(3)(1)(2)(4)1871015\nBiostatistics59葡萄酒等级资料的分析H0:对四种葡萄酒评判结果的总体分布相同;H1:评判结果的总体分布不同或不全相同。=0.05。式中b为配伍组数,k为处理组数。本例b=5,k=4。\nBiostatistics60检验结果本例b=5,k=4,查M界值表得:M0.05=7.80,M0.01=9.96。M0.0550mg”等)缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同。\nBiostatistics63秩和检验用于定量资料计量资料中:极度偏态资料,或个别数值偏离过大各组离散度相差悬殊资料中含有不确定值大于5年<0.0011:1024以上兼有等级和定量性质的资料\nBiostatistics64心肌坏死面积例用二种食物配方饲养大白鼠,观察心肌坏死面积。分析二组间的差异。A组:(n=29,mean=3.61)0,0,0,0,0,0,0,0,0,0,0.2,0.3,0.4,0.4,0.6,1,1.6,2.2,2.6,3.3,4.3,5.1,5.4,5.5,6.1,6.2,9.7,13.8,36B组:(n=28,mean=1.06)0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0.2,0.2,0.20.3,0.4,0.4,0.9,0.9,1.3,1.7,2.8,7.4,13\nBiostatistics65特点:0特别多,无论用什么变换均不可能改变分布的偏性;0与其它数的区别是质的区别。\nBiostatistics66分析一:二组心肌坏死率比较,按四格表作2检验:无心肌坏死有心肌坏死合计心肌坏死率甲组10192965.5%乙组15132846.4%2=2.1081,P=0.147\nBiostatistics67分析二:二组平均心肌坏死面积的比较二组平均心肌坏死面积的t检验:t=-1.7755,P=0.0814\nBiostatistics68分析三:按等级资料处理:两组秩和检验:n秩和理论秩和A组29968841B组28685812合计5716531653u=2.119,P=0.0341。\nBiostatistics69成组设计两样本比较如资料满足t检验的条件,应该用t检验进行分析。此时,如果对这类资料用Wilcoxon秩和检验,实际上是将观察单位的具体数值舍弃不用,只保留了秩次的信息,使检验功效降低;尤其样本含量较小时,降低更加明显。如资料不满足t检验的条件,而用了t检验,同样降低了检验效能。\nBiostatistics70秩变换检验基本思想:将等级转换为秩次;对秩次作效应的参数检验(t检验,方差分析,相关等)。在样本含量较大时,秩变换检验与秩和检验结果相同或相近。\nBiostatistics71manythanks