医学统计学讲义 58页

205.50 KB
2022-08-13 发布

医学统计学讲义

关闭预览

58页
当前文档由用户上传发布，收益归属用户

1、本文档由用户上传，淘文库整理发布，可阅读全部内容。
2、本文档内容版权归属内容提供方，所产生的收益全部归内容提供方所有。如果您对本文有版权争议，请立即联系网站客服。
3、本文档由用户上传，本站不保证质量和数量令人满意，可能有诸多瑕疵，付费之前，请仔细阅读内容确认后进行付费下载。
网站客服QQ：403074932

医学统计学讲义.txt27信念的力量在于即使身处逆境，亦能帮助你鼓起前进的船帆；信念的魅力在于即使遇到险运，亦能召唤你鼓起生活的勇气；信念的伟大在于即使遭遇不幸，亦能促使你保持崇高的心灵。医学统计学之1--平均数与标准差（在医科院皮研所统计培训班编写的讲义）2008年05月06日星期二06:51　　平均数是分析测量资料常用的一种统计指标。它说明一组观察值的平均水平或集中趋势。在麻风病统计中常用的有算术均数、几何均数和中位数。标准差也是分析测量资料常用的统计指标，它说明一组观察值的离散程度。在应用中，常常把平均数和标准差结合运用，综合表达一组观察值的集中和离散特性。　　(一)小样本均数、标准差直接计算法　　1、公式_　∑X　X＝　────　　　　　　　　　　　(1.1)　N┌─────│　_│∑(X－X)2S＝│──────(1.2)√N－1┌────────│　(∑X)2│∑X2－───│NS＝│──────(1.3)√N－1_X:观察值　　　　　　　X:算术均数　N:观察值个数　　　　　S:标准差　∑X:观察值总和　∑X2:观察值平方的总和_　∑(X－X)2:观察值的离均差平方和　　2、应用范围及注意事项　　(1).观察值必须是同质的。　　(2).观察值资料必须大体符合正态分布才能计算均数，而偏态分布的资料不宜用均数描述其集中趋势。　　(3).标准差越大，表示观察值的分布越分散、标准差越小，说明观察值分布越集中。　　(4).常以“均数±标准差”的写法综合表达一组观察值的集中和离散特征。　　3、实例\n　　［例1.1］　10例麻风病人空腹测定转氨酶GPT的结果为43、50、36、32、40、38、47、41、45、40单位，求GPT的平均值和标准差。　　计算步骤:　　∑X＝43＋50＋36＋32＋……＋40＝412∑X2＝432＋502＋362＋322＋……＋402＝17228　　代入公式(1.1)求均数得_412　　X＝───＝41.210代入公式(3.2)求标准差得┌─────────│4122　　│17228－────│10S＝│───────────＝5.308√10－1　　故可用均数与标准差综合表示10名麻风病人转氨酶测定结果为:41.2±5.308。　　(二)、大样本均数、标准差的计算法　　1、公式_∑fxX＝────(1.4)∑f　　　┌──────────│(∑fx)2│∑fX2－────│∑fS＝│──────────(1.5)√∑f－1_　X:均数　X:各组的组中值　　　　f:频数　　　　S:标准差　　　　　　　　　　　　2、应用范围及注意事项　　(1)样本观察值与小样本资料一样，必须同质并呈正态分布。　　(2)大样本资料应先整理成频数表后再进行计算。频数表一般以8—15个组段为宜。　　3、实例　　[例1.2］某地在1975年调查麻风发病情况，共发现640例麻风病人，其年龄分布如表1.1所示，求麻风病人发现时平均年龄。表1.1　某地麻风病人发现年龄统计(1975)─────────────────────　年龄组　　　组中值　　　病人数─────────────────────　　0－2.53\n5－7.51110－12.54615－17.59520－22.511025－27.518130－32.59035－37.56840－42.53045－47.51350－52.5855－6057.57─────────────────────合计　　640─────────────────────　　计算步骤:　　(1).首先将数据分组，整理成如表1.1所示的频数分布表。可利用函数型电子计算器的统计计算功能，方便地求得均数及其标准差。不同的计算器其操作方法有些差别，本书均以CASIOfx－180P为例，其它种类计算器请参考说明书。　　　(2).将计算器置于“SD”工作状态，即按下MODE3，液晶屏显示“SD”，然后按下INV　AC，清除内存中遗留的数字。在每次进行新的运算之前，都应进行上述操作。　　(3).输入数据:2.5×3RUN7.5×11RUN12.5×46RUN……57.5×7RUN。　　(4).取出结果:INV3，显示:9.6137(标准差SD)，INV　1，　显示:27.145(均数值)。医学统计学之2--平均数与标准差，t检验（在医科院皮研所统计培训班编写的讲义）2008年05月07日星期三14:20(三)几何均数　　1、公式　　　　　　∑lgXG＝lg－1(────)(1.6)N∑flgXG＝lg－1(────)(1.7)∑fG:几何均数　　　　　　　　X:观察值　　N:观察值个数　　　　　　　f:频数　　2、应用范围及注意事项　　(1).当样本观察值呈等比关系或对数正态分布而求均数时，如计算抗体平均滴度、传染病平均潜伏期等，可用几何均数。　　(2).一般采用以10或e为底的对数进行计算。　　(3).公式(1.6)适用于未分组小样本资料，公式(1.7)适用于分组的大样本资料。\n　　3、实例　　［例1.］　　8例麻风病人的估计潜伏期分别为2、3、5、8、9、14、20、31年，求其平均潜伏期。　　计算步骤:　　(1)　∑lgX＝lg2＋lg3＋lg5＋……＋lg31＝7.27307.2730(2)　G＝lg－1(────)8＝lg－1(0.9091)＝8.1(年)(四)中位数计算法　　1、公式　　小样本未分组资料计算法:　　一组观察值按大小顺序排列，如个数为单数，则居中的一个观察值即为中位数；如个数为双数，则居中的两个观察值的平均数为中位数。　　大样本分组资料计算法:　　　　　N──－C2M＝L＋─────────(i)(1.8)fmM:中位数　　　N:总频数　　L:中位数所在组段的下限i:组距　fm:中位数组段内的频数　　　C:小于L的各组段的累计频数　　2、应用范围及注意事项　　(1).中位数适用于表示大多数观察值分布比较集中、少数极大值或极小值分布两端的样本的集中趋势。这种资料的算术均数易受极端值的影响，而对中位数则影响很小。　　　(2)大样本资料应先编制频数表再计算中位数。　　3、实例　［例1.4］有204例麻风病人血中大单核细胞百分数资料，制成频数分布表如表1.2所示，计算其中位数。　　表1.2　204例麻风病人大单核细胞百分数中位数计算表。───────────────────分组　　频数　累积频数───────────────────　　0－2424　　2－4064　　4－55119　　6－37\n　　8－27　10－1812－114－016－118－020－1──────────────────204──────────────────计算步骤:(1).自上而下累计各组段频数。　　(2).找中位数所在组段。本例中位数在第3组。　　(3).本例:L＝4,N＝204,i＝2,fm＝55,C＝64204──－642M＝4＋────────·2＝5.38％55　　二、t检验　　用计算t值进行差异显著性检验的方法称做t检验。检验适用于服从正态分布而且符合随机抽样原则的资料。t检验习惯上按下列标准判定检验结果:　　t＜t(0.05)P＞0.05无显著性差异　　t(0.05)≤t＜t(0.01)0.05≥P＞0.01有显著性差异　　t≥t(0.01)P≤0.01有高度显著性差异　　检验有显著性差异并不等于有实际意义，还需要根据专业知识判断，谨慎地下结论。　　(一)、样本均数的标准误　　1、公式　　　　　　　S　　　Sx＝────(2.1)　　　　　┌───√NSx:样本均数的标准误S:样本标准差　　N:样本例数　　2、应用范围及注意事项　　(1).标准误是样本均数的标准差，表示样本平均数分布的离散程度。可用于估计总体均数的可信区间和进行均数间的差异显著性检验。　　(2).表示样本均数离散情况时，可以写成“均数±标准误”的形式。但必须标明是标准误，或用符号SE表示，以便和标准差相区别。医学统计学之3--t检验（在医科院皮研所统计培训班编写的讲义）2008年05月08日\n星期四06:40(二)、配对资料的t检验　　1，公式_　　　　　d　　　t＝──　　　　　　　　　　　　　　(2.2)Sd_　　d:差数均数　　　Sd:差数均数标准误　　2、应用范围及注意事项　　(1).医学研究中常采用的自身对照和配对比较设计得到的都是配对资料。　　(2).配对资料t检验比用两个分组均数的差异显著性检验法的效率高，但事先未经配对设计的资料不能用本法检验。　　　3，实例　　[例2.1]　用DDS、RFP和B663联合用药治疗10例瘤型麻风病人，治疗前及治疗一年后的BI值如表2.1所示，试问治疗前后的BI值是否有显著性差异?　表2.1　　10例麻风病人联合化疗前后BI变化──────────────────────────例号　治疗前　治疗后　差数(d)　　d2──────────────────────────1　　　5.4　4.01.41.9623.22.50.70.4932.52.6-0.10.0143.01.91.11.2154.23.30.90.8164.63.70.90.8173.42.70.70.4984.13.40.70.4993.62.80.80.64102.72.10.60.36──────────────────────────7.77.27──────────────────────────　　1、检验假设:治疗前后BI值无差异。　　2、计算步骤:　　(1).求治疗前后BI差数d和d2(见表2.1第4和第5列)，计算其总和，∑d＝7.7，∑d2＝7.27。　　　　　　　　　　　　　　　　_　　(2).把数据代入公式(1.1)和(1.3)计算差数的均数d和标准误Sd得:　　　　7.7　d＝───＝0.77　　　　　10　　　　　\n　　　　　┌─────────│7.72│7.27－────│10　Sd＝│────────────＝0.3860√　　　　10—1　　　　　　　　　　　　　　　(3).把数据代入公式(2.1)求标准误Sd得　　　　　　　　0.3860　　　　Sd＝───────＝0.1221┌───　　　　　√10　　(4)把数据代入公式(2.2)求t值得:　　　　　0.77　　　t＝────＝6.308　　　　　0.1221　　3、确定P值　　　计算自由度(df),df＝10—1＝9,查t值表(见附表　)，t(0.01(9))＝3.250，　　　本例t＞t(0.01(9))，故P＜0.01。　　4、统计判断:　　　该组病例在治疗前与治疗一年后，BI有非常显著性差别(P＜0.01)，所以可以认为该疗法有显著降低BI的作用。　　(三)、两样本均数差别的t检验　　1，公式　　　_　_　∑(X1－X1)＋∑(X2－X2)　　　　Sc2＝─────────────────　　　N1＋N2－2　　(∑x1)2(∑x2)2　　　　∑X12－────＋∑X12－────　　N1N2　　＝──────────────────────────(2.3)　N1＋N2－2　　　　　　　　　┌─────────　　│11　Sx1－x2＝│Sc2(──＋──)(2.4)√N1N2　　　_　　_　│X1－X2│t＝──────(2.5)\nSx1－x2__X1:样本I的均数X2:样本II的均数　S2c:合并方差　　　　　　X1:样本I的观察值　X2:样本II的观察值　　　N1:样本I的例数　N2:样本II的例数　　　Sx1－x2:两样本均数之差的标准误　2、应用范围及注意事项　　(1).两个样本均数差别的t检验，适用于按完全随机化设计的两样本均数的差异显著性检验。　　(2).两样本例数不相等也可以检验，但当两样本例数相等时，检验的效率最高。　　(3).如每组例数大于10，而两标准差的平方相差5倍以上时，不能直接用t检验，可考虑用非参数统计方法。　　3、实例　　［例2.2］　为研究正常成年男、女血液红细胞均数之差别，检查了某地25—29岁正常成年男子156名，正常女子74名，男性红细胞均数为465.13万/mm3，标准差为54.80万/mm3。问两组均数差别有无显著意义?　　1、检验假设:　两性间红细胞数无差异。　　2、计算步骤:　　将数值代入公式(2.3)、(2.4)和(2.5):(156－1）(54.80)2＋(74－1)(44.20)2Sc2＝────────────────────────156＋74－2＝2667.05(万/mm3)　　　　　　　┌─────────│156＋74Sx1－x2＝│2667.05×────＝7.29(万/mm3)√156×74465.13－422.16　　　t＝────────＝5.897.293、确定P值:　计算自由度df＝156＋74－2＝228，　　查t值表t(0.01(120))＝2.67，n'越大则t的临界值越小，本例t＞t(0.01(120))，则必大于t(0.01(228)),　故P＜0.01。　4、统计判断　　25—29岁正常男女间红细胞数之差别有极显著意义。　　(四)、两样本含量较大时均数差别的t检验　　1、公式　　　\n　　_　_　　　　　　　　　　　　　│X1－X2│u＝──────(2.6)┌─────√S2x1＋S2x2　　　　　　　　_　　　　　　　　_u:u值,　　X1:样本I的均数,X2:样本II的均数　　　Sx1:样本I的标准误　　Sx2:样本II的标准误　　2、应用范围及注意事项　　(1)．样本量大于100时，t分布近似正态分布，可用u检验。　　(2)．按下列标准判定结果:　　u＜1.96，P＞0.05差异不显著　　1.96≤u＜2.58，0.05≥P＞0.01　差异显著　　u≥2.58，P≤0.01　　差异非常显著　　(3)．其它条件与(三)相同。　　3、实例　　［例2.3］某院测定200例银屑病人的血清铜含量均数为110.49ug％，标准差为29.13ug％；健康对照组165例，平均值为125.91ug％，标准差为17.74ug％。比较两组的血清铜值是否有差异?　　　1、检验假设:两者血清铜值无差异。　　2、计算步骤:　　将数值代入公式(2.6)|110.49－125.91|u＝────────────＝4.224│29.1317.74│(───)2＋(───)2　√　√100√65　3、确定P值:　　u＞2.58，故P＜0.01　　4、统计判断　　本例两样本均数差别非常显著(P＜0.01)，说明银屑病人的血清铜含量比正常人偏低。　　(五)、关于t检验的说明　　1、显著性检验有双侧检验和单侧检验之分，请读者参考有关统计书。　　2、t检验只有在两个样本均数的方差没有显著差别的前提下，才可使用，否则须改用t'检验。　　3、例2.1是对配对资料BI进行t检验，BI属半定量资料，有些BI值并不服从正态分布，所以使用t检验时要慎重；但目前国内外普遍使用t检验来比较治疗前后BI均数差异，故在此举一例。医学统计学之4--卡方检验（在医科院皮研所统计培训班编写的讲义）2008年05月10日星期六09:31　　X2检验是一种用途广、简单常用的差异显著性检验方法之一。主要可以用于计数资料(Enumerationdata)的两组或两组以上的两类属性、两类或两类以上现象之间的比较，如检验两个样本率、构成比等之间的差别。\n　　一、基本原理和步骤:　　X2检验的基本原理是假设各个样本(Sample)来自同一属性的总体(Population)，各组中实际数之间的差别仅仅由于抽样误差造成的；通过分别计算各组实际数与理论数的离散情况，求得总的误差X2值，从而测定假设存在的概率(Probability)，即可能性P，如果假设成立，那么X2值就不会很大，而保持在一定范围内，相应的P值就大于5％(P＞0.05)，即仅仅由于抽样误差而造成样本之间这么大小差别的可能性大于5％，说明各样本间的差别本质上无明显差异，它们来之于同一属性的总体，假设被肯定。。反过来说，如果推算出的X2值很大，而超出了一定范围，相应的P值就小于5％或1％，即由于抽样误差造成样本之间如此大的差别的可能性小于5％或1%；说明各组间差别不是由于抽样造成的，可能两者的确有差别，它们不是来之于同一属性的总体，假设被否定。　　　具体步骤:　　(一)、建立2×2的四格表(Fourboldtable)或r×c的行×列表:分析资料，将实验组(Exporimentalgroup)和对照组(Controlgroup)资料，按两类属性分类，组成如下计算表格:　　　　│属性Ⅰ│属性Ⅱ│合　　计──────┼──────┼────┼──────实验组　│αTa│bTb│α＋b──────┼──────┼────┼──────对照组　│c　Tc│dTd│c＋d──────┼──────┼────┼──────合　计　│α＋c│b＋d│N＝α＋b＋c＋d　　　　a│b　表格中　─┼─以a、b、c、d四个数为基础计算统计量，故称四格表。　　　　c│d　　(二)、建立检验假设:假设两组间无显著差异。　　(三)、计算理论数:　　　　　　　　　　同行合计数×同列合计数　　任何一格理论数＝────────────　　　　　　　　　　　　总　合　计　数　　T代表理论数(theoretical)，那么a、b、c、d分别有四个理论数:　　Ta,Tb，Tc，Td，(a＋b)(a＋c)Ta＝─────────N(a＋b)(b＋d)　　Tb＝─────────＝(a＋b)－TaN\n(a＋c)(c＋d)Tc＝─────────＝(a＋c)－TaN(b＋d)(c＋d)Td＝─────────＝(c＋d)－TcN　　用字母表达写成通式为:　　NrNc　　　T＝──────NNr:为行合计数，(N:number　r:row)。　　Nc:　为列合计数，(c:Column)。　　(四)、计算X2值:　　　　　　　　　　(A－T)2　　基本公式:X2＝∑──────　　　　　　　　　　(1)T　　∑:(Sigma)即总和的意思，表示各个格子实际数与理论数之间的误差总和。　　A:代表a、b、c、d实际数(actual)。　　上式展开:(a－Ta)2(b－Tb)2(c－Tc)2(d－Td)2X2＝──────＋──────＋──────＋──────TaTbTcTd(五)、求自由度:　　　　自由度(n')＝(行数－1)(列数－1)n'＝(r－1)(c－1)(六)、差X2表，确定P值:　　　　X2＜X2(0.05(n'))，P＞0.05，无显著性差异。　　　　X2(0.0５(n'))≤X2＜X20.0１(n')，0.05≥P＞0.0１，有显著性差异。　　　　X2≥X20.01(n')，P≤0.01，有高度显著性差异。　　(七)、　结论:　1、有否显著性。2、P值为多少。3、由本资料推论总体，应当从实际出发，谨慎地下结论。　　二、四格表资料的X2检验。\n　　(一)、计算X2值的四格表基本公式:　　例1:　某研究所进行HLA与麻风的相关研究，随机选取32例瘤型病人和65例健康人为对照组。病人组中18例HLA—DR2抗原阳性，健康人组中有14例HLA—DR2阳性。是否可以认为HLA—DR2抗原阳性率在瘤型麻风病人比健康人中为高?　表1．HLA—DR2在瘤型麻风病人和健康人中的测定结果──────────────────────────────────────　　瘤型病人　　　健康人　合　计──────────────────────────────────────　　　　　　　＋　18　　　　　14　　　　32　　HLA—DR2　　　　　　　－　　14　　　　　51　　　　65──────────────────────────────────────　合　　计　　　　32　6597──────────────────────────────────────　　(徐可愚等:中华皮肤科杂志，Vol.16(1):24,1983)　　1、检验假设:LA—DR2抗原在瘤型麻风病人和正常健康人中分布无显著性差别。　　　　　　　　　　32×32　　2、求X2值:Ta＝────＝10.557(小数点后保留三位有效数字)　　　　　　　97　　　Tb＝32－10.557＝21.443Tc＝32－10.557＝21.443Td＝65－21.443＝43.557此例，每个格子T＞5，N＞40，可用公式(1)。　　　　　(A－T)2　　X2＝∑────────T(18－10.557)2(14－21.443)2(14－21.443)2(1－43.557)2＝──────────＋──────────＋──────────＋──────────10.55721.44321.44343.557＝11.69(小数点后保留两位有效数字)　　2、确定P值:自由度n'＝(2－1)(2－1)＝1，查X2表，　　X2(0.01(1))＝6.63,11.69＞6.63，则X2＞X2(0.01(1)),所以P＜0.014、结论:HLA—DR2抗原在二组人群中分布有高度显著性差别(P＜0.01)，就本资料可以认为HLA—DR2抗原在瘤型麻风病人中出现的频率比健康人为高。　医学统计学之5--卡方检验（在医科院皮研所统计培训班编写的讲义）2008年05月11日星期日09:11　　(二)、应用四格表专用公式计算X2值。　　对于四格表资料，可直接用公式(2)计算X2值，免去了求T值的麻烦。　　　(ad－bc)2N\n　　X＝─────────────────　　　　　　　　　　　　(2)　　　(a＋b)(c＋d)(a＋c)(b＋d)　　式中各字母意义同前。　　例2、某医院为研究吐温80对灰黄霉素治疗头癣是否有增效作用，随机选了193例头癣病人，分为两组分别以吐温80(0.25％)＋灰黄霉素(7.5mg/kg)和单纯灰黄霉素(15mg/kg)治疗二十天，结果如下:表2.　吐温80对灰黄霉素的增效作用实验结果─────────────────────────────────────────　　　　　　　　　　痊　愈　　未　愈　　合　计　　治愈率─────────────────────────────────────────吐温80＋灰黄霉素　　　123　　　14　　137　　89.7　灰黄霉素　　　　　　41　　　155673.2─────────────────────────────────────────　合　计　　　　　　1642919384.97─────────────────────────────────────────　　1、检验假设:二组疗效基本相同。　　2、求X2值:　　估计T值均大于5，N＞40，用公式(2)。(123×15－41×14)2×193　　X2＝────────────────＝8.54　　　　164×29×137×56　　以基本公式计算:164×137　　Ta＝─────────＝116·415193Tb＝137－116·415＝20·585Tc＝164－116·415＝47·585Td＝29－20·535＝8·415(123-116.415)2(14-20.585)2(41-47.585)2(15-8.415)2X＝───────────＋──────────＋──────────＋──────────116.41520.58547.5858.415\n＝0.372＋2.106＋0.911＋5.152＝8.54与用专用公式计算结果基本相同。　　3、确定P值:　　　自由度n'＝(2－1)(2－1)＝1　　因为X2(0.01(1))＝6.63，8.54＞6.63　所以P＜0.014、结论:两组疗效有高度显著性差异(P＜0.01).实验组中灰黄霉素为半量但疗效比单纯全量灰黄霉素疗效为佳，可以认为吐温80对灰黄霉素有增效作用。　　(三)、用四格表校正公式计算X2值。　　当四格表中任何一T值大于5，且N>40，可用公式(1)(2)。但当10.05　　4、结论:兔眼在L和T型麻风病人中无显著差异(P>0.05)，仅根据此资料还不能认为兔眼在两型麻风病人中发生率有差异。应在增大样本继续观察。医学统计学之6--卡方检验（在医科院皮研所统计培训班编写的讲义）2008年05月13日星期二15:25(二)、应用四格表专用公式计算X2值。　　对于四格表资料，可直接用公式(2)计算X2值，免去了求T值的麻烦。　　　(ad－bc)2N　　X＝─────────────────　　　　　　　　　　　　(2)　　　(a＋b)(c＋d)(a＋c)(b＋d)　　式中各字母意义同前。　　例2、某医院为研究吐温80对灰黄霉素治疗头癣是否有增效作用，随机选了193例头癣病人，分为两组分别以吐温80(0.25％)＋灰黄霉素(7.5mg/kg)和单纯灰黄霉素(15mg/kg)治疗二十天，结果如下:表2.　吐温80对灰黄霉素的增效作用实验结果─────────────────────────────────────────　　　　　　　　　　痊　愈　　未　愈　　合　计　　治愈率─────────────────────────────────────────吐温80＋灰黄霉素　　　123　　　14　　　137　　89.7　灰黄霉素　　　　　　41　　　155673.2─────────────────────────────────────────　合　计　　　　　　1642919384.97─────────────────────────────────────────　　1、检验假设:二组疗效基本相同。　　2、求X2值:　　估计T值均大于5，N＞40，用公式(2)。(123×15－41×14)2×193　　X2＝────────────────＝8.54　　　　164×29×137×56　　以基本公式计算:164×137　　Ta＝─────────＝116·415193\nTb＝137－116·415＝20·585Tc＝164－116·415＝47·585Td＝29－20·535＝8·415(123-116.415)2(14-20.585)2(41-47.585)2(15-8.415)2X＝───────────＋──────────＋──────────＋──────────116.41520.58547.5858.415＝0.372＋2.106＋0.911＋5.152＝8.54与用专用公式计算结果基本相同。　　3、确定P值:　　　自由度n'＝(2－1)(2－1)＝1　　因为X2(0.01(1))＝6.63，8.54＞6.63　所以P＜0.014、结论:两组疗效有高度显著性差异(P＜0.01).实验组中灰黄霉素为半量但疗效比单纯全量灰黄霉素疗效为佳，可以认为吐温80对灰黄霉素有增效作用。　　(三)、用四格表校正公式计算X2值。　　当四格表中任何一T值大于5，且N>40，可用公式(1)(2)。但当10.05　　4、结论:兔眼在L和T型麻风病人中无显著差异(P>0.05)，仅根据此资料还不能认为兔眼在两型麻风病人中发生率有差异。应在增大样本继续观察。　　(四)四格表的直接计算概率法。　　当四格表中有一个理论数小于1，或者N<40时；或者T<5、N<40时；另外，当得出的P值在0.05附近，不够显著而难以下结论时，应当用直接计算P值的方法，不必查表，该法称为Fisher精确法或精确检验法。医学统计学之7--卡方检验（在医科院皮研所统计培训班编写的讲义）2008年05月14日星期三06:14(1)、有实际数为0的情况。　　例4:用新旧两种药物治疗某种疾病结果如表4，试检验其差别是否有显著性差异?　表4.　　两种药物治疗结果比较──────────────────────────────────　　　　　　　　未　愈　　治　愈　　合　计──────────────────────────────────　旧　药　　　　　4　　　　　2　　　　6　新　药　　　　　0　　　　　5　　　　5──────────────────────────────────　合　计　　　　　4　　　　　7　　　　11──────────────────────────────────　　1、假设:二组无显著性差别。　　2、求P值:表中人数过少，T<5，N<40，用精确检验法。　　　　　(a＋b)!(c＋d)!(a＋c)!(b＋d)!P＝────────────────────　　　　　　　　　(5)a!b!c!d!N!!:为阶乘号，如5!＝5×4×3×2×1　　0!＝1本例:　6!5!4!7!　6!7!\n　　　P＝─────────＝───────＝0.045　4!5!2!0!11!　2!11!　　3、结论:　用直接法计算出的P值为单侧概率。什么叫单侧检验和双侧检验?在用两种药物作实验观察时，我们不知何种药物疗效为优，可有两种结果，甲优于乙或乙优于甲。这种比较两种可能性的试验，统计学上叫双侧检验。对于双侧检验需用双侧概率的显著性水平来作判断。如果我们认为甲药不可能比乙药的疗效差，这样一种可能，这时作显著性检验时，用单侧检验，用单侧概率的显著性水平作判断，到底选用单、还是双侧，应由研究者根据专业知识来决定。单侧与双侧概率见表5。　　　表5　　单侧与双侧概率的显著性水平─────────────────────────────────────────　　　　　　　　　　差别有显著性　　　　差别有高度显著性─────────────────────────────────────────　单侧检验　　　　0.010.025，差别无显著意义。如果已知新药疗效不可能比旧药差，看看新药是否优于旧药有显著性，此即单侧检验，则P值与0.05比较。本例P＝0.045<0.05，故差别有显著意义。　　(2)、没有实际数为零的情况。此种情况计算时比较复杂，如下例:　　例5、有人对T麻风病人与正常人甲皱微循环进行观察，结果如下表，问T麻风病人的甲皱微循环异常率是否比健康人为高?表6.　T型麻风病人与健康人甲皱微循环观察结果───────────────────────────────────────────　　　　　　　甲皱微循环异常　　甲皱微循环正常　　合计　　％───────────────────────────────────────────T型麻风病人　　　　　8　　　　　　　　3　　　　　　11　72.7％健　康　人　　　　　19　1010.0％───────────────────────────────────────────91221───────────────────────────────────────────　　(华文渊等:中华皮肤科杂志　Vol15(1):14,1982)　　1、假设:T型病人与健康人甲皱微循环无差异。\n　　2、求P值:此例N<40，T<5　　　　　　9!12!10!11!12!11!10×9　　P1＝──────────＝──────────＝0.00568!3!1!9!21!3!21!　　此时算得的概率仅仅包括了表6一种情况，还应当包括以下极端的情况，即异常与正常多的例数更加多，少的更减少，直到出现零为止，但总合计保持不变。所以例5还有如下一种情况:───────────────────────────────　　　　　　　9　　　　　　2　　　　　11　　　　　　　0　　　　　1010───────────────────────────────　　　91221───────────────────────────────9!12!11!10!P2＝──────────＝0.000199!0!2!10!21!积累概率P＝P1＋P2＝0.0056＋0.00019＝0.0058　　3、结论:本例理论上推测结核病人甲皱微循环不可能比正常人好，所以是单侧检验，P＝0.0058<0.01。二组人的甲皱微循环有高度显著性差异。从本例资料来看，结核样麻风病人甲皱微循环比健康人差。　　如果表中数很大，可采用查lgN!表法即查阶乘的对数表来求P。如本例可以写成:　　　lgP＝lg9!＋lg12!＋lg11!＋lg10!－lg9!－lg0!－lg2!－lg10!－lg21!　＝7.6012＋8.6803－0.301－19.7083　＝－3.7278查反对数表，P＝0.00019　与原式结果一样。医学统计学之8--卡方检验（在医科院皮研所统计培训班编写的讲义）2008年05月17日星期六09:03三、行×列表(r×c)的卡方检验。　　当行数(r)或列数(c)大于2时，称为行×列表(r×c表)，其检验方法与四格表相同。　　例6、某地观察磺胺三甲氧吡嗪加增效剂(吡嗪磺合剂)预防疟疾复发的效果，用已知有抗疟疾复发效果的乙胺嘧啶和不投药者作对照，比较三组处理的复发率，如表7，问三组复发率有无显著性差别?表7.　　三个组疟疾复发的比较─────────────────────────────────────────　　　　　　　复发数　　未复发数　　合计　　复发率(％)─────────────────────────────────────────吡嗪磺合剂　　　76　　　　1920　　　1996　　　3.18　乙胺嘧啶　　　274464735.71　对　照　　　　53　　　　43148410.95\n─────────────────────────────────────────合　计　　　156279729535.28─────────────────────────────────────────(四川医学院主编　卫生统计学　62、1978)　　1、检验假设:三个组处理的效果相同。　　2、求X2值:　　　　　　(A－T)2　　　X2＝∑───────(6)　　　　　　　　T　　　　　　　　　A2　　　X2＝N(∑────────－1)　　　　　　　　　(7)　　　　　　　　　NrNc　　以公式(7)计算:　　　762　27253219202X2＝2953(───────＋───────＋───────＋───────　　156×1996　　156×473156×484　2797×1996　　　4462　　　4312　　　＋──────＋───────－1)　　　　　　2797×473　2797×484＝39.92　3、确定P值:n'＝(3－1)(2－1)＝2查表,因为X2(0.005(2))＝10.60,10.60＜39.92所以P<0.005　　4、结论:三组复发率之间有高度显著性差异(P<0.005)。结合药理知识，说明吡嗪磺合剂有预防疟疾复发的效果，其效果似不低于乙胺密啶。　　例７:对于麻风院内居住的其父母皆为麻风病人的健康儿童进行麻素实验，按年龄分组的晚期反应率如表8，问麻素实验阳性是否与年龄有关?表8．　麻风病人的健康子女麻素反应阳性率结果──────────────────────────────────────────　　　　　　　　年龄分组\n　　　───────────────────────　　合　　　计　　　　　　0～　　3～　　5～　───────────────────────────────────────────麻素晚　＋　　15　　　35　　　30　　　　　　80期反应　－　　38　　　24　　　870───────────────────────────────────────────合　计　　　535938150阳性率(％)28.359.378.953.3───────────────────────────────────────────(Lechat　扎伊尔1959)　　1、假设各年龄组间差异不显著。　　2、求X2:用公式(7)　　　152　352　302382X2＝150(───────＋────────＋────────＋─────────　　80×5380×5938×8070×53　　　　24282　　　＋─────＋──────－1)　＝21.50　　　　70×59　70×383、定P值:　n'＝2，X2(0.005(2))＝10.6021.5>10.60，所以P<0.0054、三个年龄组间晚期麻素实验阳性率有高度显著性差异(P<0.005)，根据免疫学知识，麻素实验晚期阳性率随年龄增大而大幅度增高，可以认为麻素反应阳性率似随年龄增大而增高。　　　例八:某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系，结果如下表，试问两者之间是否有关?表9.　冠心病与眼底动脉硬化的关系统计表─────────────────────────────────────────　　　　　　　　　　　　　冠心病诊断结果眼底动脉硬化程度　────────────────────　　合　　计　　　　　　　　　　正　常　　可　疑　　冠心病─────────────────────────────────────────　　　　0　　　　　　340　　　11　　　　8　　　　359\n　　　　I　　　　　　7313894II971818133III3216─────────────────────────────────────────　合　　　计　　　5134435592─────────────────────────────────────────　　本例有的格子T<5，故应合并如下:───────────────────────────────　　0　　340　　　11　　　8　　　359II7313894II＋III1002019139───────────────────────────────合　计　　513　　　44　　35592　───────────────────────────────　　1、假设冠心病与眼底动脉硬化程度无关　　2、计算X2值:　用公式(7)　　　34027321002112　　　X2＝592(─────＋──────＋──────＋──────359×513　94×513139×513359×441322028282＋─────＋─────＋─────＋─────94×44139×44359×3594×35　　192＋─────－1)　139×35　　＝53.99　　3、查X2表:n'＝(3－1)(3－1)＝4,X2(0.005(4))＝14.8653.99＞14.86,　　P＜0.005　　4、结论:　冠心病与眼底动脉硬化间有高度显著性的关系。医学统计学之9--卡方检验（在医科院皮研所统计培训班编写的讲义）2008年05月18日星期日07:40行×列表X2检验注意事项:　　1，当有T＜5时，应当合并相应的数据项；　　2，有显著意义，仅仅指整个资料，而不是指任意二组间有显著性意义。\n　　四、配对计数资料的X2检验　　所谓配对资料，即对一组实验对象或同一实验对象，先后给予不同的处理，这样可以减少因个体差异而造成的影响，获得的资料可比性高，使结果更为可靠，以较小的样本就可以获得只有大样本才能获得的结果。同一对象用甲、乙两种方法处理，有可能出现四种情况，甲＋乙＋，甲－乙+，甲＋乙－，甲－乙－。制成四格表:　──────────────────────────────────　　　　　　　　　　　　　　　甲　　　　　　　　　　────────────　　　　　　　　　　　　＋　　　　　　—──────────────────────────────────　　　　　　＋　　　　　ab乙　　　—　　　　　cd──────────────────────────────────　　　　　　　　　　　　　　　　　15　　例9、有23份细菌标本，把每份标本依同样条件分别接种于甲、乙两种培养基上，观察结果如表10所列，问两种培样基培养效果的差别有无显著性？　表10.　　　　两种细菌培养基培养结果比较─────────────────────────────────────　　　　　　　　　　　　　甲培养基　　　　　　　　　　───────────────　　合　　　计　　　　　　　　　　　　＋　　　　—─────────────────────────────────────乙培　　　＋　　　　　　11　　　　9　　　　　　20养基　　　—　　　　　　1　7　　　　　　8─────────────────────────────────────合　计　　　　　　　　　12　　　1628─────────────────────────────────────“＋”表示生长，“—”表示不生长　　1，检验假设:　培养的结果甲－乙＋的对子数与甲＋乙－对子数相等。　　　　　　　　　　　　　　　　　　　　　　b＋c9＋1　　2，求X2值:根据假设，b和c格子的理论数同为─────，本例为─────＝5，因b＋c＜40，故用校正公式求X2值　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　(│A－T│－0.5)2(│9－5│-0.5)2(│1－5│－0.5)2　　　X2＝∑──────────＝──────────＋───────────T55＝4.90简化运算用以下公式:　　　　(│b－c│－1)2\nX2＝────────────　　　　　　　　　　　　　　(8)b＋c(│9－1│-1)2＝──────────9＋1＝4.90　3,确定P值，n'＝1,X2(0.01(|))＝6.63,　X2(0.05(|))＝3.84　3.84＜4.9＜6.630.05＞P＞0.0１4，结论:b与c差别有显著性(P＜0.05)，乙种培养基阳性率较高。　　如果b＋c＞40，不需对X2值进行校正，可用公式(9)计算:　　　　　　(b－c)2　　　X2＝───────　　　　　　　　　　　(9)b＋c　　例10、某研究室为用耳血代替静脉血做FLA—ABS试验，选72个各型麻风病人，同时分别采静脉血和耳血做FLA—ABS试验，其中1∶160滴度测定结果如下表11，问二法有否差异?　表11　　两种方法测定结果比较(FLA—ABS1∶160)─────────────────────────────────────　　　　　　　　　　　耳　　　　血　　　　　　　　　　─────────────　　合　　计　　　　　　　　　　　＋　　　　—─────────────────────────────────────　　　　　＋　　　56　　　　2　　　　　　58静脉血　　　　　－　　　7714─────────────────────────────────────　　　　合　计　　　63　　　9　　　　　72─────────────────────────────────────(吴勤学等:内部资料、1983)1，检验假设，两种方法无显著差异。2，求X2值:　　　　　　　　(│7—2│—1)2　　　　　X2＝────────────＝1.78　　　　　　　　　　7＋23，确定P值:n'＝1,　X2(0.10(1))＝2.71,1.78＜2.71，P＞0.10　　4，两种方法的FLA—ABS试验结果无显著差异(P＞0.10)，耳血法可以代替静脉血法。　　　但在实际研究中，除四格表形式的配对资料以外，对于r≥3，c≥3的多格表资料并不少见，最近白求恩医科大学的张志军和王广仪推导出了即适用于多表格又适用于四格表配对资料的显著性检验公式(参见中华预防医学杂志VOL17(2).65.1883)。医学统计学之10--卡方检验（在医科院皮研所统计培训班编写的讲义）2008年05月19日\n星期一06:50例11、某研究室试验用于血纸片法代替耳鲜血法作FLA—ABS时验，选了72例各型麻风病人，同时分别以1∶20，1∶40，1∶160的抗体滴度测定，结果如下。问两法有否差异?　表12.　　72例麻风病人FLA—ABS试验的三种滴度配对比较表───────────────────────────────────────　　　　　　　　　干血法　Y　　　　　　────────────────────────────　　　　　1+++2++-3+--4---───────────────────────────────────────耳1＋＋＋　　555　10血2＋＋－　　5　4　　0　0法3＋－－1000X4－－－1000∑──────────────────────────────────────────────　n(i－j)11559510(i－j)3210－1－2－3n(i－j)(i－j)3250－5－203(d)n(i－j)(i－j)2945054027(D)──────────────────────────────────────────────　　先将两组变量X、Y数量化，行由i代表，列由j代表，三种滴度均为阳性的为1，两种滴度阳性的为2，一种滴度阳性的为3，全阴性为4，以下列几个公式计算:适用于n较大，n＞50，样本率不靠近0％或100％。　　　　　　　　　　　　　　│d│　　　u＝────　　　　　　　　　　　　　　　　(10)┌──　√　D　　　　　　rc　　d＝∑　∑Nij(i－j)　　　　　　　　　(11)i＝1j＝1rcD＝∑　　∑　nij(i－j)2　　　　　　　　　　　(12)i＝1j＝1　　其中:(i—j)为两组数量化后的差值，为0、±1、±2、±3、±4……Nij为第i行第j列相交的频数。　　　d＝1(3)＋0(2)＋0(1)＋0(0)\n　1(2)＋0(1)＋0(0)＋0(－1)5(1)＋4(0)＋0(－1)＋0(－2)55(0)＋5(－1)＋1(－2)＋0(－3)在同一条对角线方向(左上到右下)上的都相等，将上式整理得:　　d＝1×(3)＋1×(2)＋5×(1)＋59×(0)＋　　　＋5×(－1)＋1×(－2)＋0×(－3)＝3　　这样计算较麻烦，根据对角线上i—j均相等，设计出表12下半部的标准计算格式，表下第一行采用斜线合计。　　　d＝3　　　　D＝27　　代入公式(10)求u值3　　u＝───＝0.577　　　┌──√27　　u＝0.577,小于1.96，　P＞0.05　　　　　承认两方法无显著差异，提示我们干纸片法可以代替耳鲜血法。　　五、2×c表线性回归的显著性试验。　　该检验法，可以看成百分率(比)趋势的显著性检验，见下表:　表13.　　不同工令工人患病率变动情况───────────────────────────────────────────────　　　　　　　　　　　　　工　　　　　　　　　　龄　　　　　　　────────────────────────────　　　　　　　＜1　1—　　2—　　4—　　6—　　8—12───────────────────────────────────────────────工人数　　　　52　　100　　224　　191　　56　114患某病数　　　0　　5　23　　35　16　　23等级评分　　　0.51.535710患病率(％)05.010.318.328.620.2───────────────────────────────────────────────对于这类资料，可以用一般X2检验来研究工令长短与患病率关系。当有显著性时，只能认为“不同工令工人的某病患病率不是一样的”。如果当百分率依次递增或递减的情况下，我们可以推测“随着工令的延长，工人的患病率有升高或降低的趋势”，但当百分率无规律时，就难以下结论了。而该法可以进行百分率趋势的显著性检验。　　㈠、按数量分组资料的百分率趋势的显著性试验。　　例12：某研究室对89例各型麻风病人的FLA—ABS试验结果如表14，　问FLA—ABS阳性率是否有随着病型从T→L的升级而有升高的趋势?　　(吴勤学等:中国医学科学院学报　Vol.4(6).392.1982)\n表14.　89例各型麻风FLA试验结果(滴度1:40)──────────────────────────────────────────　　　　　　　TT　　BT　　BB　　BL　　LL　　合计──────────────────────────────────────────FLA阳性数(t)6246251980TFLA阴性数　　241209──────────────────────────────────────────总人数(n)8287271989N阳性率(％)　75　85.785.792.610089.9──────────────────────────────────────────分数(Z)　　－2　－101＋2──────────────────────────────────────────　　对于等级型资料，为“定量分组(即计量资料)”时，取其数量的组中值为等级评分，如为“定性分组(即计数资料)”时，须将数字依次排列，给以顺序性的评分，如1，2，3，4，……(或4，3，2，1)1、假设各组间无差异，　　2、计算:N(N∑tZ－T∑nZ)2X2＝───────────────(13)T(N－T)｛N∑nZ2－(∑nZ)2｝　　决定分数(Z)的一般方法:　　　　1　　　　　　　11　Z1＝－──(C－1),　Z2＝－──(C－3),　Z3＝－──(C－5)……　　　　222∑tZ＝6(－2)＋24(－1)＋6(0)＋25(1)＋19(2)＝27∑nZ＝8(－2)＋28(－1)＋7(0)＋27(1)＋19(2)＝21∑nZ2＝8(－2)2＋28(－1)2＋7(0)2＋27(1)2＋19(2)2＝163(∑nZ)2＝(21)2＝441　　　　　　代入公式(13)　　　89(89×27—80×21)2　X2＝───────────────　　　　80(9)(89×163—441)　　　＝4.59　　　按性质分组，Z:1，2，3,…5,　X2仍为4.59\n3、确定P值:该自由度　n'＝1，　　X2(0.05(1))＝3.84，　X2(0.01(1))＝6.63，　3.38＜4.59＜6.630.05＞P＞0.0１４、结论，可以认为FLA阳性率是随着T—L的升级而升高。　　㈡、药物疗效的比较　　例１３:某院试以中西药合并治疗白癜风，两种药物搭配治疗效果如下，试问二种药，何种为优?　表15.　两种不同搭配的药物治疗白癜风结果比较───────────────────────────────────────────────　　　　　　　　　　　　　　痊愈　显效　有效　无效　　合计───────────────────────────────────────────────复方氮芥醑(外)+内服白一.三(t)　85　　249　　239　129　　702(T)复方氮芥醑(外)+内服白二.四　　44169199127539───────────────────────────────────────────────合　　　　计(n)　　　　　　　　1294184382561241(N)分　　　　数(Z)　　　　　　　－1.5－0.50.51.5───────────────────────────────────────────────1、假设两组间无显著差异，　　２、计算：　　∑tZ＝85(－1.5)＋249(－0.5)＋239(0.5)＋129(1.5)＝61∑nZ＝129(－1.5)＋418(－0.5)＋438(0.5)＋256(1.5)＝200.5∑nZ2＝129(－1.5)2＋418(－0.5)＋438(0.5)＋256(1.5)＝1080.25(∑nZ)2＝(200.5)2＝40200.25代入公式(13)　　　　　1241(1241×61－702×200.5)2X2＝───────────────────────702(539)(1241×1080.25－40200.25)＝10.67253、确定P值:　本例n'＝1，查X2表　　X2(0.005(1))＝7.83，　10.67＞7.83，P<0.005　　４、结论:外用复方氮芥醑＋内服白一、白三丸的无效率为18.4％，外用复方氮芥醑十白二、白四丸的无效率为23.6％，二者经线性回归显著性差异，(P<0.005)，前者的疗效优于后者。医学统计学之11--相对数（在医科院皮研所统计培训班编写的讲义）2008年05月21日星期三15:14四、相对数统计\n　　相对数是两个有联系的数量之比。通过相对数计算可以了解事物相互间的关系，有助于分析和阐明事物的规律性。相对数可分成率、比、相对比和动态数列。　　㈠、率(频率指标、强度指标)　　1、公式A(＋)　　　　率＝───────────×K(1)A(＋)＋A(－)A(＋):某现象实际出现例数。　　A(－):某现象实际未出现例数。　　K:比例基数(％或‰、1/万、1/10万等)。　　2、应用范围及注意事项　　(1)率说明某种现象发生的频率或强度。如发病率、患病率、死亡率、病死率等。　　(2)计算率时、分母不宜过小，分母较大，算得的率较稳定，其意义也较大。分母较少时，算得的率不稳定，以用绝对数表示为好。如“4人全部治愈”，“4人中有2人死亡”等。　　　(3)．率的比较需作率的差异显著性检验。　　(4)．对于内部构成有显著性差异的两个率，应先经标准化处理，才能进行比较。　　㈡、比(构成比，结构指标)　　1、公式　　　　　　　　　　A　　　　比＝──────────×K　　　(2)　　　　　　　A＋B＋C＋D……　　A:事物内部某一构成部分的个体数值。　　A＋B＋C＋D＋……各构成部分个体数的总和。　　　　K:比例基数(常用100％)　　2、应用范围及注意事项　　(1)．构成比表示事物或现象内部各构成部分的比重，通常以100为比例基数，常称百分比。　　(2)．构成比只能说明比重，不能说明发生的强度或频率，比不能代替率。　　(3)．构成比的特点是以各部分的数值总和为100％。　　(4)．构成指标中某一部分所占比重的增减会相应地影响其他部分的比重，故比较两组构成比时要注意其内部是否相近，必要时应先用标准化法处理。　　(5)．样本过小，计算百分比无意义。　　(6)．用于麻风统计的比有:人口构成比，发现方式构成比，麻风型别构成比等。　　㈢、相对比　　1、公式　　　　　　　　甲指标　　　相对比＝────────×100％　　　　　(3)　　　　　　　　乙指标　　2、应用范围及注意事项　　(1)．相对比是说明两个有关的同类指标之比，常以倍数或百分数来表示。　　(2)．甲、乙两指标可以是绝对数，相对数或平均数。　　(3)．用于麻风统计的相对比有:性别比，型别比(瘤型比)等。　　㈣、动态数列\n　　1、公式　　　　　　　　同种指标　　　定基比＝─────────×100％　　　　　　　　　　　　　(4)　　　　　　　　基期指标　　　　　　本年度同种指标　　　环比＝─────────────×100％　　　　　　　　　　(5)　　　　　　上一年度同种指标　　2、应用范围及注意事项　　(1)．动态指标是表示某种现象的指标(绝对数、相对数、平均数)在各个不同时期的变化动态。　　(2)．定基比通常以最初一年或有意义的一年作为基期指标，然后将各年的数值与之相比，因基数固定，故称定基比。　　(3)．环比是将各年的数值与其前一年的数值相比，由于基数不是固定的而是依次更换的，故称环比。　　3、实例表1.　某地区1975～1986年麻风患病率动态分析───────────────────────────────────────────　　　　　　　　　　　　　　　　动　　态　　指　　标　年份　　麻风患病率───────────────────────────　　　　　　‰　　定基比(1975年为100)　　环比(上一年为100)　(1)　　　　(2)　　　　　　　(3)　　　　　　　　　(4)───────────────────────────────────────────────19751.340100—1976　　0.94670.670.619770.61946.265.419780.41330.866.719790.32023.977.519800.25519.079.719810.24118.094.519820.16612.468.919830.15311.492.219840.1269.482.419850.1148.590.519860.07835.868.7────────────────────────────────────────────　　计算方法　　(1)．定基比:以1975年麻风患病率为基期指标，则1976年的定基比为:(0.946/1.34)×100％＝70.6％，1977年的定基比为:(0.619/0.946)×100％＝46.2。其余类推。\n　　(2)环比:例如1978年的环比为:(0.413/0.619)×100％＝66.7％，1979年的环比为:(0.320/0.413)×100％＝77.5％。其余类推。　　从定基比第三栏可见该地区12年间麻风患病率如以1975年为100，1986年则降到5.8％，从环比可看到麻风患病率变化的波动较大。医学统计学之12--率的抽样误差与显著性检验（在医科院皮研所统计培训班编写的讲义）2008年05月22日星期四06:33　　　　　　　五、　　率的抽样误差与显著性检验　　㈠、率的标准误及总体率的估计1、公式　　┌─────────　　　　　　　│　P(1—P)　　　　Sp＝│──────　　　　　　　　　(1)　　　　　√　　N　　95％可信区间＝P±1.96Sp　　　　　　　　　　　　(2)　　95％可信区间＝P±2.58Sp(3)　　Sp:率的标准误　　　　　　　P:样本率　　N:样本观察例数　　2，应用范围及注意事项　　(1)率的标准误反映率的抽样误差大小，是衡量样本率的稳定性及可靠性的指标。标准误越小，表示率的抽样误差越小，用以估计总体率的可靠性越大，反之，标准误大，则由样本率估计总体率的可靠性就小。　　(2)．估计总体率，习惯上使用95％和99％可信区间。95％可信区间是指:从被估计的总体中，随机抽取含量为N的样本，由每个样本计算出一个95％可信区间，则理论上其中有95％的可信区间将包含总体率。所以任一样本所得95％可信区间作估计时，总体率不在此区间的概率不到5％，在此区间内的概率则达95％以上。　　(3)．一般以样本观察例数≥30例为大样本，＜30例为小样本。　　(4)．大样本要估计总体率的可信区间虽可用公式计算，但样本率P不能太接近0或100％，否则误差较大。　　3，实例　　[例1]某县发现新病人80人，其中有畸形者20人，求畸形率标准误及95％可信区间。　　计算步骤:　　　　　　　　　　　　20　　(1)．求畸形率，P＝───＝25％　　　　　　　　　　　　80　　(2).把数据代入公式(1)，求Sp　　　　　　┌────────　　　　　│　0.25(1－0.25)　　　Sp＝│──────────＝0.0484＝4.84％　　　　√　　　80　　(3).把数据代入公式(2),求95％可信区间　　　0.25±1.96×0.0484＝15.51％～34.49％\n　　(二)、样本率与总体率的差异显著性检验　　1，公式　　　　　　　　　　　　　　　│P—π│　　│P—π│　　　　u＝─────────＝──────────　　　　(4)　　┌────────　　　　　　　σp√π(1－π)/N　　　π:总体率　　　　　　　　P:样本率　　　σp:总体率的标准误　　N:样本观察例数　　2，应用范围及注意事项　　检验大样本时，样本率的分布近似正态分布，可按正态分布的规律检验样本率与总体率的差异显著性，以u＜1.96，即P＞0.05判为差异不显著；1.96≤u＜2.58即0.05＞P＞0.01判为差异显著；以u＞2.58，即P＜0.01；判为差异非常显著。　　3，实例　　[例2]　某县1974年有麻风病人505人，二年治愈率为28.2％，该地区总的二年治愈率为32.6％，问某县麻风病二年治愈率是否比全区还低?　　　1、检验假设:某县麻风病二年治愈率与全区相同。　　2、计算步骤　　(1)将数据代入公式(4)，求u值:　　　　│0.282－0.326│u＝──────────────＝2.109　　　　┌───────────√0.326(1－0.326)／505　　3、确定P值　　　　本例1.96＜u＜2.58，故0.05＞P＞0.01。　　4、统计判断:某县麻风病二年治愈率与全区有显著差异，可以认为某县麻风病二年治愈率低于全区。　　(三)、两个大样本率的差异显著性检验　　1，公式　　　　　　　　　　　　　│P1—P2│　　　　U＝──────────────────　　　　　　　　　　(5)　　　　　┌─────────────────√Pc(1－Pc)(1／N1＋1／N2)X1＋X2Pc＝─────────(6)N1＋N2　　　P1:样本率Ⅰ　　　　　　　　　P2:样本率Ⅱ　　　Pc:合并样本率　　　　　　　　N1:样本Ⅰ观察例数　　　N2:样本Ⅱ观察例数　　　　　　\n　　　X1、X2:分别为样本Ⅰ和样本Ⅱ中出现某现象的例数　　2，应用范围及注异事项　　(1)判定标准和样本率与总体率的差异显著性检验相同。　　(2)公式(5)的分母为两个率相差的标准误(Sp1－Sp2).　　3，实例　　[例3]　某院试以中西药合并治疗白癜风，将病人随机分为两组，用复方氮介醑(外用)＋内服白1号治疗600例病人，有效为382人，用复方氮介醑＋内服白2号治疗562人，有效为402人，问二种治疗方案何种为优?　　1、检验假设:两种治疗方案效果相同。　　1、计算步骤:　　(1)求u值　　　　　　　402＋382　　　　Pc＝────────＝0.6747562＋600　　　　　　　　　　　　　　　　　　　　　│382/600—402/562│　　　　u＝──────────────────────────　　　　　┌────────────────────────　　　　√0.6747(1－0.6747)(1／600＋1／562)＝2.86　　3、确定P值，u＞2.58,故P＜0.01　　4、统计判断　两组有非常显著的差异，复方氮介醑＋内服白2号的疗效优于第一种方案。医学统计学之13--率的抽样误差与显著性检验（在医科院皮研所统计培训班编写的讲义）2008年05月24日星期六06:53　　(四)、两个小样本率的差异显著性检验　　1，公式　　　　　　　H1＋1　　　　P1＝──────×100％　　　　　　　　　　　　　　　(7)　　　　　　N1＋2　　　　　　　　　　　　　　　　　43　　　　　　　H2＋1　　　　P2＝──────×100％　　　　　　　　　　　　　　　(8)　　　　　　　N2＋2　　　　　　　　┌────────────────────　　　　　　　│　P1(1—P1)　　P2(1—P2)　　　　Sp1－p2＝│─────────＋──────────　　　　(9)　　　　　　　　√　N1＋3　N2＋3　　　　　　　　　　\n　　　　　　│P1—P2│　　　　t＝──────────　　　　　　　　　　(10)　　　　　　Sp1－p2　　H1，H2:分别为两种样本中某现象出现的例数。其余符号的意义与前面相同。　　2，应用范围及注意事项　　两小样本率进行比较，必先经公式(7)、(8)、(9)对两率和它们的相差标准误(Sp1－p2)进行校正后，用公式(10)计算t值。　　　3，实例　　[例4]　在观察麻风对神经的损害中，发现收治病人中7名T型麻风有2例面神经损害，在25名L型麻风有15人面神经损害，问T与L型麻风病人中中面神经损害有否差异?　　　　1、检验假设:两型中面神经损害无差异　　2、计算步骤:　　(1)把数据代入公式(7)、(8)、(9)，　　求校正P1、P2和Sp1—p2:　　　　　　　2＋1　　　　P1＝───────×100％＝33.33％　　　　　　　7＋2　　　　　　15＋1　　　　P2＝───────×100％＝59.26％　　　　　25＋2　　　　　┌────────────────────────────────　　　　　　│　0.3333(1－0.3333)0.5926(1－0.5926)Sp1－p2＝│───────────────＋────────────────　　　　　　　√　　　　7＋3　　　　　　　　25＋3　　　　　＝0.1756　　(2)把数据代入公式(10)，求t值:　　　　　　　　　　　　　　　　　　　　│0.3333－0.5926│t＝────────────────＝1.480.17563、求自由度，确定P值。本例自由度为df＝(7－1)＋(25－1)＝30，查t值表t(0.10(30))＝1.697，本例1.48＜1.697，故P＞0.10。　　4、统计判断:两型间面神经损害无显著差异，仅据此资料，不能认为两型间面神经损害有差异。　　㈣、用二项分布法进行两组小频数的显著性检验　　1，公式\n　　　P(k)＝CkPkQn－k(11)N!Ck＝──────────(12)K！(N－K)！　P(k):在N次试验中事件A恰好发生K次的概率　　Ck:在N次试验中事件A发生K次的组合数　　N!:N的阶乘　　2:应用范围及注意事项　　(1)根据两项分布的原理可直接计算概率的大小，以判断两组小值频数差异的显著性。　　(2).在医学中有一些事物，其结果为两种互斥情况之一，且随机抽取的样本很大，而出现的阳性数很少。如一些发病率较低的疾病，比较两地发病率的差异、或进行预防接种和预防措施效果的对比，可应用二项分布法进行两组小频数的差异显著性检验。　　3，实例　　[例5]某年某地在乙脑流行时，未接种的8,000人中有6个病例，在接种疫苗的12,000人中只有4个病例。问接种组发病率是否真的比非接种组为低?　　1、检验假设:接种组与非接种组发病率相等　　2、计算步骤:　　(1)计算接种组人口占合并人口的比率(P)和非接种组人口比率(q)。　　　　　　　　　接种组的人口　　　　　　　12000　　　　P＝───────────────────────＝──────────＝0.6　　　　　　接种组的人口＋非接种组的人口　　12000＋8000　　q＝1—0.6＝0.4(2).设N为两组病例之和，则N＝10，代入公式(12)求组合数C4得:　　　　　　　　10　　　　C4＝──────────＝210　　　　　　4！(10—4)！　　(3).把数据代入公式(11)，求接种组发生4例，非接种组发生6例的概率P(4)得:　　　P(4)＝210×(0.6)4(0.4)(10—4)＝0.1115，　　　　即P＞0.05　　4、统计判断:两组发病率无显著意义(若P(4)小于0.05，应分别计算P(3)、P(2)、P(1)、和P(0)的概率。如各概率之和仍小于0.05，即有显著意义；如大于0.05，即无显著意义)。医学统计学之14--泊松分布资料的统计（在医科院皮研所统计培训班编写的讲义）2008年05月27日星期二09:21　　六、泊松分布资料的统计　　(1).通常n＞100，P＜0.01时，可以应用泊松分布。\n　　(2).泊松分布适用于研究稀有事件在重复试验中出现的概率分布，如稀有疾病在人群中发生例数的概率分布，白血球计数板每小格内白血球数概率的分布等。　　㈠、总体均数可信区间的估计　　1，公式┌─　　　S＝√λ　　　　　　　　　　　　　　　　　　　　　　(1)　　95％可信区间:λ±1.96S　　　　　　　　　　　　(2)99％可信区间:λ±2.58S(3)λ＝nP　　　　　　　　　　　　(4)　　S:标准差　　λ:符合泊松分布的均数，同时又是方差。　　2，应用范围及注意事项　　(1).当λ值大于20时，可使用上述公式。　　(2).当λ≤20时则可从附表，查得可信区间。　　3，实例　　[例1]某地1986年新发现56例麻风病人，求95％可信限。　　计算步骤:　　(1)本例λ＝56，代入公式(1)，求S┌──　　　S＝√56＝7.48　　(2).95％可信限为:56±7.96×7.48＝41.3～70.7　　则某地1986年新发现麻风病人数95％可信限为41.3～70.7人　　㈡、样本率与总体率比较　　1，公式　　　P(k≥m)＝1—P(k＜m)　　　　　　　　　　　(5)　　2，应用范围及注意事项　　　适用于服从泊松分布的资料。　　3，实例　　[例　.2]某慢性病患病率根据历年来的统计资料已知为0.1％。某地调查到2000人，其中有患者4人，问此病是否高过一般水平。　　1、检验假设:样本率不高于总体率。　　2、计算步骤:　　(1).据总体率求λ得:　　　λ＝2000×0.1％＝2　　　　　　　　　　　　　λk　　(2).依据公式P(x＝k)＝─────е－λ　　　　　　　　　　　　　K！　　　求2000人中出现不到4个患者的概率P(k＜4)得\n　　　　　　　　2°　　　　P(0)＝───е－2＝0.1353　　　　　　　　0！　　　　　　　　　21　　　　P(1)＝──────е－2＝0.2706　　　　　　　　　1！　　　　　　　　　22　　　　P(2)＝─────е－2＝0.2706　　　　　　　　　2！　　　　　　　　23　　　　P(3)＝─────е－2＝0.1804　　　　　　　　3！　　　　P(k＜4)＝P0＋P1＋P2＋P3＝0.8569　　(3).按公式(5)，求2000年人中出现等于或多于4个患者的概率P(k≥4)得　　　P(k≥4)＝1—0.8569＝0.1431　　3、统计判断:由于P＞0.05，故样本率与总体率无显著差异，不能认为样本率显著地高于总体率。　　(三)、两个样本比较　　1，公式　　当X1、X2均大于20，N1＝N2时:　　　　|X1－X2|u＝─────────　　　　　　　　　　　　　　　　(6)┌─────√X1＋X2当X1、X2均大于20，N1≠N2时:__　　　　│X1－X2│　　u＝──────────────────　　　　　(7)┌───────────────√X1／N12＋X2／N22X1、X2:分别为两样本在相同条件下的计数__　　X1、X2:分别为两样本在相同单位区间中的计数　　N1、N2:分别为两个样本的单位区间数目　　2，应用范围及注意事项\n　　(1).样本服从泊松分布，X1、X2大于20。　　(2).u＞1.96，则P＜0.05，u＞2.58，则P＜0.01。　　3，实例　　[例3]某省1985年麻风新发病人数为219例，1986年麻风新发病人数为192例。问两年中麻风新发病人数是否有差异?　　1、检验假设:两年中麻风发病人数无差异。　　2、计算步骤:　　把数据代入公式(6)，求u值　　　　　　|219—192|　　　　u＝────────＝1.33　　　　　┌───────　　　　√219＋192　　3、确定P值:u＜1.96，故P＞0.05　　4、统计判断:两年中该省麻风发病例数无显著性差异。　　[例4]　某麻风病人查菌涂片，耳垂皮肤涂片在100个视野中共发现228个麻风杆菌，而在手指指背的皮肤涂片的80个视野中共发现120个麻风杆菌，问两处细菌涂片检查结果是否有差异?　　1、检验假设:两细菌涂片细菌检查结果无差异。　　1、计算步骤:　　将数据代入公式(　.8)，求u值:　　　　　　　|228/100－120/80|　　u＝──────────────────＝3.826　　　　　　┌─────────　√228/1002＋120/802　　3、确定P值，本例u＞2.58，故P＜0.05。　　4、统计判断:两处细菌涂片检查结果有高度显著性差异，可认为耳垂处皮肤含菌量高于手指指背处。医学统计学之15--率的标准化及其差异显著性检验（在医科院皮研所统计培训班编写的讲义）2008年05月30日星期五08:06七、　率的标准化及其差异显著性检验　　当两组资料内部各小组的率明显不同，观察对象的构成亦明显不同时，则不能直接比较两组的总率。必须经标准化后方可进行比较。标准化率简称标化率，亦称调整率，就是将所比较资料之构成，按选定的“标准”调整后算得的率。目的在于统一内部构成，使资料具有可比性。如对比两地某病发病率、而两地人群的年龄、性别构成不同，须比较其标准化率。　　(一)直接计算法　　1，公式　　　　　　　∑NiPi　P':＝─────────　　　　　　　　　　　　　　　　　　(1)　　　　　　　N　　P':标准化率　　Ni:标准人口年龄组人数\n　　Pi:被标化组年龄组专率　　N:标准总人口　　2、应用范围及注意事项　　(1).　标准人口组应选有代表性的、较稳定的数量较大的人群，如全国、全省、全地区、时间最好是与被标化资料一致或接近。也可用相互比较的人群本身作标准，取其合并数据。　　(2).当被标化组有年龄别发病率，标准组有年龄别人口数或人口年龄别构成比，可采用直接法。　　3，实例　　[例1]　现有两地区麻风患病资料，见表1，试标化后比较两地麻风患病率的高低。　　计算步骤:　　1，用标准人口计算　　(1).将表1中甲、乙两地年龄别人口数合并后作为标准年龄别人口数，见表2第2列。　　(2).求甲、乙地期望麻风患病人数，用年龄别标准人口乘相应的原麻风患病率即可。见表2第(4)(6)列。　表1　　　甲乙两地麻风患病率比较(‰)────────────────────────────────────────────────年　龄　　　　　甲　　　地　　　区　　　　　　　乙　　地　　区　　　　─────────────────────────────────────────(岁)　　人口数　　患病数　　患病率　　人口数　　患病数患病率────────────────────────────────────────────────────0—　　3,619,517270.00742,213,70980.003615—2,280,7915240.2301,923,7354390.22830—　930,0508290.891864,9735980.69140—　　828,1427950.960708,6695410.76350—645,1335610.870591,2664130.69960—583,4184090.701769,4942270.295────────────────────────────────────────────────────合　计　8,887,05131450.3547,071,84622260.315─────────────────────────────────────────────────────　　(3).求麻风患病标化率，将表　.2中数据代入公式(　.1):　　　　　　　　　　　　　6107　　甲地麻风患病标化率＝─────────×1000‰＝0.383‰\n　　　　　　　　　　　15,958,897　　　　　　　　　　　　　4656　　乙地麻风患病标化率＝─────────×1000‰＝0.292‰　　　　　　　　　　　　15,958,897　　表　.2　直接法标准化甲乙两地麻风患病率计算表(一)────────────────────────────────────年　龄　标准　　　　甲　　地　　区　　　　　　乙　地　区　　　　　　　　─────────────　──────────────(岁)　人口数原患病率(‰)　期望患病人数　原患病率(‰)期望患病人数(1)(2)(3)(4)＝(2)×(3)(5)(6)＝(2)×(5)────────────────────────────────────0—　5,833,2260.0074430.00362015—4,204,5260.2309660.22895930—1,795,0230.89116000.691124140—1,536,8110.96014750.763117350—　1,236,3990.87010750.69986460—1,352,9120.7019480.295399────────────────────────────────────合计15,958,897—6107—　4656────────────────────────────────────　　()结论:经标化后，麻风病标准化患病率甲地为0.38‰，yi→地为.29‰，甲地高于乙地。　　2，用标准人口构成比计算。将表　.2中第(2)列标准人口化为标准人口构成比，见表　.3第(2)列。　　(1)求各年龄组麻风分配患病率，将各年龄标准人口构成比乘相应的麻风原患病率，即得各年龄组按标准分配的麻风病患病率，见表　.3第(4)、(6)列。　　(2)求麻风病标准患病率，将各年龄组的分配麻风患病率相加即可，见表　.3第(4)、(6)列的合计栏。结果与用标准人口计算的结果相同。　　(二)间接法计算　　1，公式　　　　　　　　γ　　　　　P'＝─────　　　　　　　　　　　(　.2)　　　　　　　∑n！P！　　P':标准化率　　　　　　　　　　　　γ:被标化组患病总数　　　　　　　　　　　　　　　(47)　　P:标准组总率　　　　　　　　　　　n！:被标化组年龄总人口　　Pｉ:标准组年龄专率　表　.3直接法标准化甲乙两地麻风患病率计算表(二)────────────────────────────────────年　龄　标准人口　　　　甲　　地　　区　　　　　　乙　地　区　　　　　　　　　────────────　──────────────\n(岁)　　构成比原患病率(‰)　分配患病率　原患病率(‰)分配患病率(1)　(2)(3)(4)＝(3)×(2)(5)(6)＝(2)×(5)────────────────────────────────────0—　0.36550.00740.00270.00360.001315—0.26350.2300.06060.2280.060130—0.11250.8910.10020.6910.077240—0.09630.9600.09250.7630.073550—　0.07750.8700.06740.6990.054260—0.08470.7010.05940.2950.0250────────────────────────────────────合计1.0000—0.3828—0.2913────────────────────────────────────　　2，应用范围及注意事项　　(1)要有两地麻风病患者总数和各年龄组人口数。　　(2)要有一标准麻风年龄患病专率。　　3，实例　　仍以上例来说明间接法标准化方法。　　以表　.4中第(2)列为麻风标准患病率。　　计算步骤:　　(1)求期望患病人数，将各标准年龄患病专率乘相应的人口数，即得各年龄组期望患病人数，见表　.4第(4)列。　　(2)将数据代入公式(　.2)求表准化率:　　　　　　　　　　　　　　　　　　3145　　甲地麻风标准化患病率＝0.337×─────×100＝0.380‰　　　　　　　　　　　　　　　　　　2789　　　　　　　　　　　　　　　(48)　　　　　　　　　　　　　　　　　　2226　　乙地麻风标准化患病率＝0.337×─────×100＝0.290‰　　　　　　　　　　　　　　　　　　2595　表　.4　间接法标准化甲乙两地麻风患病率计算表────────────────────────────────────年　龄　标准麻风　　　　甲　　地　　区　　　　　　乙　地　区　　　　　　　　　　────────────　─────────────(岁)　患病率(‰)　人口数　　期望患病人数　　人口数　　期望患病人数(1)　(2)(3)(4)＝(2)×(3)(5)(6)＝(2)×(5)────────────────────────────────────0—　0.00553,619,517202,213,7091215—0.2292,280,7915221,923,73544130—0.791930,050736864,97368440—0.862828,142714708,66961150—　0.785645,133506591,26646460—0.498583,418291769,494383────────────────────────────────────\n合计0.3378,887,05127897,071,8462595　　(3)结果与直接法近似　医学统计学之16--基本统计方法（在医科院皮研所统计培训班编写的讲义）2008年06月01日星期日08:47　　第一节　麻风病统计工作的任务及其内容1　　　　一、麻风病统计工作的任务及内容　1　　　　二、麻风病统计工作步骤3　　　　三、麻风病统计中的几个主要概念　5　　第二节　麻风病统计指标的计算方法9　　　　一、反映麻风病流行强度和流行趋势的指标　　　　9　　　　二、评价发现工作的指标18三、用于临床治疗管理的指标20　　　　四、反映防治效果的指标24　　　　五、用于完成治疗后(或治愈后)监测管理的指标　26　　第三节　麻风病的基本统计分析方法28　　　　一、平均数与标准差28　　　　二、t检验37　　　　三、卡方(X2)检验47　　　　四、相对数59　　　　五、率的抽样误差与显著性检验　　　　　　　　65　　　　六、泊松分布76七、率的标准化82八、Ridit分析　　　87九、寿命表在评价麻风防治效果中的应用95　　第四节　麻风病电子计算机登记报告系统102一、登记和收集资料的组织机构102二、登记报告表(卡)和统计报表104三、电子计算机硬件配置和软件设计109　　第五节　统计表与统计图111　　　　一、统计表111二、统计图115　　第六节　科研设计123　　　　一、科研设计123　二、科研设计的类型127三、科研设计的方法129　　第一节　麻风病统计工作的任务及其基本概念　　一、麻风统计工作的任务\n　　医学统计学是运用概率论和数理统计原理和方法、研究医学领域中数字资料的收集、整理、分析和推断的一门学科。麻风病统计工作是将医学统计学的研究成果和方法应用于麻风病的流行病学、临床和实验研究诸领域；在占有丰富资料的基础上，运用适当的统计方法进行整理和分析，透过众多的表面现象和偶然因素阐明事物客观存在的内在联系及其发展运动的规律，辨别事物间在数量上的差别是偶然的还是必然的；从而作出正确的结论，为麻风病防治工作及控制和消灭麻风服务。　　麻风病统计工作的内容如下:　　(一)、统计研究设计　　在调查设计或实验设计时，除了从专业上考虑外，还必须从医学统计学的角度考虑，使调查或实验结果能够科学地回答所研究的问题。一个好的设计可以用较少的人力、物力和时间取得更多的较可靠的资料。　　(二)、总体指标的估计　　麻风统计工作中除用均数、率等样本的统计指标对调查或实验结果进行描述外，更重要的是通过样本信息、来估计总体中相应的统计指标，为制定防治计划提供参考。　　(三)、差异显著性检验　　依据资料性质和所研究的问题、建立统计假设，采用适当的检验方法，判断差异是否具有统计学显著性意义，从而决定是拒绝或接受该假设。　　(四)联系、相关和监测等研究　　在疾病防治工作中，经常要探讨各种现象数量间的联系，寻找与某病关系密切的因素，选择治疗方案，评价防治效果，对疾病进行流行趋势预测等。　　二、麻风病统计工作步骤　　麻风病统计工作分为资料的收集、整理和分析三个步骤。三者缺一不可。　　(一)、搜集资料　　即按照研究设计中搜集资料的要求，用尽可能少的人力、物力和时间，及时获得正确、完整的原始资料。麻风病统计资料来源主要来自三个方面:1、日常病人登记表、医疗记录和复查记录。包括门诊病历、住院病历和医学检验结果等。这些记录常有漏填、重复、项目不清等情况。要使资料能用于统计分析，必须要做到原始记录的完整性和正确性。2、专题调查和实验记录。按事先设计进行的专题调查和实验研究。调查表的设计是非常重要的一环，要根据课题目的、调查指标等来决定登记项目。、其它部门的统计资料、报表等。如，统计部门的人口资料，气象部门的水文、天气资料等。这些资料为研究麻风病的流行特点及其相关因素提供素材。　　除了做好调查设计和实验设计外，对资料的要求有三点:1、正确性，资料是否准确反映实际情况，各项目间有无矛盾，数字是否合理等。2、完整性，原始资料是否有遗漏或重复，各项目是否填完全。3、及时性，资料收集应及时，相隔年代久远的资料往往不易做到正确和完整。医学统计学之17--基本统计方法（在医科院皮研所统计培训班编写的讲义）2008年06月03日星期二06:38　　(二)、整理资料　　根据研究的目的，按统计分析的要求进行分组和汇总。分组可用划记、分卡等方法；将原始资料按条件分组，然后按分析指标的要求，将各组数字填入整理表、汇总表。计算合计数。在整理资料时要确保数字准确可考。　　(三)。分析资料　　包括各个统计指标，绘制统计图表，统计处理并作结论。统计处理泛指应用适当统计方法对原始资料进行加工，如，差异显著性检验，相关回归分析等。分析资料时要求选用适当的统计分析推断方法，计算准确无误，结合专业实际作出恰如其分的结论，并用概率P值说明结论的可靠程度。　　三、麻风病统计中的几个主要概念　　　(一)资料类型\n　　　1、计数资料　　将观察单位按某种性或类别分组计数，所得的各组观察单位数称计数资料。如，用RFP治疗麻风病人，可按治愈人数与未愈人数计数；某人群中麻素反应按阳性结果与阴性结果计数。分析计数资料常用率，构成比、X2检验等。　　2、计量资料　　测定每个观察单位某项指标量的大小，所得的资料称计量资料。如，麻风病人尿中DDS含量，血中红细胞数，血压值等。分析计量资料常用平均数、标准差、t检验等。　　3、等级资料　　将观察单位按某种属性的不同程度分组计数，称为等级资料或半计量资料。如，用药物治疗结核病人，其中临愈、近愈、好转、无效的人数；麻风病人FLA－ABS试验结果－、±、＋、＋＋、＋＋＋的人数；麻风病人的细菌指数1＋、2＋、3＋、4＋……也是等级资料。分析等级资料常用率、构成比、idit检验等。　　　(二)、总体与样本　　总体是同质的个体所构成的集合。总体所包含的个体数可以为无穷大，但往往是设想的或是抽象的。如，一个麻风病人称为个体，由一个个麻风病人组成了麻风病人总体。我们研究麻风病的发生、流行和治疗等问题，并不需要将麻风病人总体都观察到，而只要对一部分个体进行观察就能推测总体。这种从总体中取出部分个体进行观察研究的过程，称为“抽样”。所抽得的部分称为样本。一个样本中所含有的个体数目称为样本含量。统计分析所要解决的问题之一，就是如何正确地以样本来推测总体。　　(三)误差　　指测得值与真值的差，样本指标与总体指标之差，主要有三种:　　1、系统误差　　在收集资料过程中，由于仪器不准、标准试剂未经校正，医生掌握疗效标准偏高或偏低等原因，可使观察结果偏大或偏小。　　2、随机误差　　在消除了系统误差后，由于各种偶然因素的影响造成同一对象多次测定的结果不完全一致。应尽力消除这类误差，将其控制在允许范围。　　3、抽样误差　　在消除了系统误差，并把随机误差控制在允许范围内，样本均数与总体均数间仍可能有差异，称为抽样误差。抽样误差有一定的规律，研究和运用这一规律，进行调查(或实验)设计与资料分析、是统计学的重要内容之一。　　(四)、概率　　它是反映某一事件发生的可能性大小的量。如，某药治疗麻风病治愈率为90％，这个数值说明某药治愈该病的可能性。常用字母P来表示。必然发生的事件P＝1，不可能发生的事件P＝0，一般情况下P值在0与1之间。　　第二节　麻风病统计指标的计算方法　　为了进行麻风流行病、临床治疗和实验研究，了解麻风病的流行特点、评价麻风病的防治效果，必须要有相应的一系列指标。这些指标应该是实用、敏感，要有统一的标准和明确的定义，并能为防治工作者所掌握。下面分五个方面列出一些常用的麻风病统计指标。　　一、反应麻风病流行强度和流行趋势的指标　　　　　　　　　　　(一)、发病率　　在一定时期(阶段、年度、季节、月等)内，某人群中发生麻风病新病例的频率。由于麻风病的发病率较低，故常常以1/10万表示。　　某年(期)内发生的麻风新病例数　　(登记)发病率＝─────────────────────×100,000/10万　　　　　　　　　同年(期)平均人口或受检人数　　　麻风病的真正发病率不易获得，常常是依据病人口述及医生的综合判断确定发病时间，然后对若干年前的发病数进行“追补”，所得到的是估计发病率。这样发病率近期内是变动的，经过若干年的“追补”\n，才稳定下来。同年(期)平均人口数，一般指年中7月1日的人口数，也可用上一年底人口与同年底人口数之和的一半来求得。某年内发生的新病例，严格地说应是对全部人口进行普查或对特定人群检查后发现的全部新病例数，才能求得真正的发病率。但是，目前一般将由门诊、线索调查、接触者调查等非普查方式发现的登记病人作为分子来推算发病率，得到的应是“登记发病率”，并不能完全代表真正的发病率，但可以通过登记发病率来估计真实发病率。以下发现率和患病率也存在着同样的问题。　　(二)、发现率　　在一定时期内，某人群中发现新病例(包括复发病人)的频率，常以1/10万表示。某年(期)内发现的新病例数　(登记)发现率＝──────────────────×100,000/10万同期平均人口或受检人数　　病人从发病到发现往往有一段延迟期；如果延持期较短(例如一年以内)，或者新病例中畸残率接近0时，发现率可以代表发病率，或作为发病率的估计值。　　(三)、患病率　　在一定时期内，某人群中现症病例总数与人群人口之比。常以1‰表示。某年(期)现症病例总数　(登记)患病率＝─────────────────×1000‰同期平均人口或受检人数　　现症病人指新老病例，但不包括已死亡、治愈和迁走的病人。真正的病人总数往往不易得到，习惯上将已发现的登记病人作为病人总数看待；严格讲、这样计算得到的应为登记患病率。　　以上三种率是麻风病流行病学等研究的最基本的指标，它们反映了麻风在人群中的流行强度。特别是发病率、直接反映了麻风病在人群中的感染强度，它们是评价麻风防治远期效果的重要指标。　　如将上述率按特定的人群，如:性别、年龄、接触者和职业等进行专项统计，称为专率。也可将几年合为一个阶段；如:5年为一个阶段，分子为5年间发病(或发现、患病)病例总数，分母为5年间人口总数(即各年平均人口之和)，求得的为5年阶段发病(发现或患病)率的平均水平，减少了因期间短而形成各年数字的波动，使之较平稳，从而增加了横向和纵向的可比性。医学统计学之18--基本统计方法（在医科院皮研所统计培训班编写的讲义）2008年06月05日星期四09:20　　(四)少年儿童发病率　　一定时间内0—14岁少年儿童中发生麻风新病例的频率。常以1/10万表示。某年(期)发生的0—14岁麻风新病例数少年儿童发病率＝───────────────────────────×100.000/10万　　　　　　　　同时0—14岁平均人口或受检人数这是一个反映麻风感染强度较敏感的指标。一个地区如果该指标无明显降低，说明麻风病的传染未得到有效控制。仿照发现率与患病率计算方法，可计算少年儿童麻风发现率、少年儿童麻风患病率。另外，麻风新病例中少年儿童占有的比例，也同少年儿童发病率一样，反映了麻风感染强度。　　(五)年龄—性别—型别麻风发病专率　　在一定时期内，在特定的人群中发生某麻风型别的新病例的频率，常以1/10万表示。\n例如:15—30岁男性　某年(期)15～30岁男性发生瘤型麻风的新病例数瘤型麻风发病专率＝──────────────────────────────────×100,000/10万　　同期15—30岁男性人口数或受检人数　　除此之外，还可计算特定人群、特定型别的麻风发现专率、患病专率。　　(六)家庭引入率　　在一定时期内带病入家的第一例病例数占其同等身份成员的比值。家庭内某身份成员带病入家的病例数　　　引入率＝───────────────────────────×10,000/万同等身份家庭成员数　　家庭内发生感染，往往是从外界带入的，根据不同身份成员的引入率，能研究何种成员最易将传染病带入家庭。　　(七)家庭两代发病率(续发率)　　家庭中，当原发病例出现后，受传染而发生的二代以上的病例占家庭成员的比值。　　　　　　　　　二代以上病例之和家庭二代发病率＝─────────────────────────×100％　　　　　　　　全部暴露于原发病例的家庭人口数　　分子分母中不应包括原发病例数。　　上述几个率可横向或纵向进行比较，用于估计麻风病流行强度和评价防治效果；但是当人口年龄构成不同，要对不同时期、不同地区的发病率、发现率和患病率等指标进行比较时，须经标准化处理，消除因年龄因素构成不同而造成的误差。　　(八)瘤型比　　麻风病人中瘤型或多菌型麻风病人所占麻风病人总数的比例，或多菌型麻风病例数与少菌型病例数之比。　　　　　　瘤型麻风病人数　瘤型比＝───────────────────×100％　　　　　　麻风病人总数　　　　　　　　　MB病人数　多菌型病人比＝───────────────×100％　　　　　　　　麻风病人总数　　有人认为瘤型比与麻风流行强度有关，可作为流行病学研究和麻风防治的参考。　　(九)性别比　　麻风病人中男性与女性之比。常用男∶女＝n∶1表示。　　(十)平均年龄　　可分别计算麻风发病平均年龄、发现平均年龄和现症病人平均年龄。　　　　　　　全部麻风病人年龄之和　平均年龄＝───────────────────　　　　　　　麻风病人总数　　一般认为，随着麻风发病率的下降，病人平均年龄有高龄化的倾向。　　(十一)复发比　　一定时期内发现的复发病人数占全部麻风病例发现数的百分比。　　　　　　某年(期)新发现的复发麻风病例数　复发比＝──────────────────────────×100％　　　　　　同期新发现的全部麻风病人数　　(十二)复发率　　治愈N年的麻风病人中出现复发病人的病例，常以％或‰表示。　　　　　　　　N年麻风复发人数　　N年复发率＝───────────────────×100％。\n　　　　　　　　治愈N年的麻风病人总数　　复发率的计算，为消除不同治愈时间的影响，应用寿命表法来计算累计复发率(参见第三节)，即第N年复发率。　　三、评价发现工作的指标　　尽早发现麻风病人，是关系到麻风防治效果的关键问题之一。采取何种方法将麻风病人尽可能地全部发现出来，是麻风流行病学、社会医学和防治管理所要研究的一个课题。下列指标可用于发现工作的有效性、及时性等诸方面的评价。　　1，受检率　　受检人数占应检人数的百分比。受检率可以是特定人群，如接触者受检率、某地小学生受检率、麻风病人受检率等。　　　　　　受检人数　受检率＝─────────────×100％　　　　　　应检人数　　2，新发现病人的畸残率　　新发现病人中有畸残病人的百分比。　　　　　　　　　某年(期)有畸残的新发现病人数　新病人畸残率＝───────────────────────×100％　　　　　　　　　同期新发现的病人总数　　新发现病人畸残百分比，是评价发现工作优劣的一个重要指标。因病人从发病到发生畸残，要经较长一段时间。发现得越早，病人中畸残者百分比越小，说明发现工作做得越好。　　3，单块皮损率　　新发现的麻风病人中有单块皮损的百分比。　　　　　　　　某年(期)有单块皮损的新发现病人　单块皮损率＝────────────────────────×100％　　　　　　　　同期新发现的麻风病人总数　　一般认为病人发现得越早，单块皮损率越高，可作为发现是否及时的参考。　　4，发病—发现延迟期　　病人从发病到被发现并确诊的期间，常以年或月为单位。发现延迟期＝发现日期—发病日期(年或月)　　5，某种发现方式的效率　　应用某种方式发现的病人数占全部发现病人总数的百分比。　　　　　　　　　　　　某种方式发现的病例数　某种方式的发现效率＝───────────────────×100％　　　　　　　　　　　　　发现的病人总数　　四、用于临床治疗管理的指标　　这些指标主要用于对临床治疗质量进行控制和管理，主要反映近期内的治疗质量和水平。　　1，接受治疗率　　接受某种方法治疗的病人数与应接受该方法治疗的病人总数之比。　　　　　　　　某年(期)接受治疗人数　接受治疗率＝────────────────────×100％　　　　　　　　同期应接受治疗人数　　可计算特定的麻风病人接受某一种治疗方式的接受治疗率，如:多菌型麻风病人接受MDT治疗率，少菌型麻风病人接受MDT治疗率，接受巩固治疗率。　　2，规则治疗率　　规则治疗的病人数与接受治疗的病人总数之比，如，MB病人接受MDT的规则治疗率等。　　　　　　　　规则治疗病人数　规则治疗率＝─────────────────×100％　　　　　　　　接受治疗病人总数\n　　3，完成MDT的治疗率　　完成MDT治疗的病人数与接受MDT治疗的病人数之比，可分别计算MB和PB病人的完成MDT治疗率　　　　　　　　　完成MDT治疗病人数　完成MDT治疗率＝───────────────────×100％　　　　　　　　　接受MDT治疗的病人总数医学统计学之19--基本统计方法（在医科院皮研所统计培训班编写的讲义）2008年06月07日星期六09:354，接受细菌检查率　　接受细菌学检查的病人数与应进行细菌学检查的病人数之比。　　　　　　　　　　　接受细菌学检查的人数　接受细菌学检查率＝────────────────────×100％　　　　　　　　　　　应进行细菌学检查的病人数　　5，查菌阳性率　　细菌学检查阳性的病人数与接受细菌学检查的病人总数之比。　　　　　　　　查菌阳性的病人数　查菌阳性率＝────────────────────×100％　　　　　　　　接受细菌学检查的病人总数　　6，病期　　病期可分为二种，一种是患病病期，即从发病到治愈所经历的时间，一种是治疗病期，从发现并开始治疗到治愈的时间。　　患病病期＝治愈日期—发病日期(年或月)　　治疗病期＝治愈日期—开始治疗日期(年或月)　　7，中断治疗率　　途中因各种原因中断治疗的人数与应治疗人数之比。中断治疗人数　　　中断治疗率＝───────────×100％　　应治疗人数　　8、耐药发生率　　应用某药治疗的病人中发生耐药的病例数与同期治疗的病人数之比，也可分别计算原发耐药发生率和继发耐药发生率。　　　　　　　　发生耐药的病例数耐药发生率＝────────────────×100％同期治疗的病人总数　　应用寿命表方法可计算N年耐药流行率，它是一个累计率，代表了耐药流行率的动态变化。　　N年累计耐药病例数　N年耐药流行率＝─────────────────×100％　　N年治疗的病人总数　　9、巩疗率　　巩固治疗(或防复方治疗)的病例数与应巩固治疗的病人总数之比。巩固治疗病例数　　　巩疗率＝─────────────×100％　　　　　　　应巩固治疗病人总数　　五、反映防治效果的指标　　除了发病率、发现率和患病率可作为麻风防治远期效果指标外，评价麻风防治近期效果可用以下指标。　　1、治愈率　　某年(期)治愈病人数与同期治疗病例数之比。应用寿命表方法可求得N年累计治愈率，反映治愈率的动态化。(N年)治愈病例数\n　(N年)治愈率＝─────────────×100％(N年)治疗病例总数　　另外可求近愈率、好转率、进步率等，针对不同型别、不同疗法，可计算多菌型MDT治愈率、少菌型MDT治愈率等。　　2、细菌阴转率　　某年(期)细菌阴转病例数与同期病例总数之比。应用寿命表法可求得N年累计细菌阴转率。(N年)细菌阴转病例数　　　(N年)细菌阴转率＝─────────────────×100％　(N年)受检病人总数　　3、现症病人畸残率　　某年(期)有畸残病例数与同期受检病例总数之比。这个率与病期长短有关，故可应用寿命表法求N年累计畸残率。(N年)有畸残病例数　　　　(N年)畸残率＝─────────────────×100％　(N年)受检病例总数　　4、新发生畸残率　　现症病人中某年(期)新发生畸残的病例数占同期受检病例总数的百分比。某年(期)新发生畸残病例数　　新发生畸残率＝────────────────────×100％　　　同期受检病例总数　　5、递减率(或下降幅度)　　某年(期)减少的病例数(或率)占上一年(期)病例总数(或率)的百分比。N年减少的病例数(或率)　N年递减率＝───────────────────×100％　　　　　　(N－1)年的病例总数(或率)　　或(N－1)年总数(或率)－N年病例总数(或率)　N年递减率＝────────────────────────────×100％　　(N－1)年的病例总数(或率)　　　　五、用于完成治疗后(或治愈后)监测管理的指标　　　　　　　　在完成治疗后(或治愈后)多菌型麻风病人至少随访五年，考察远期疗效，少菌型病人至少随访2年。每年检查一此。反映监测管理的指标有:　　1、临床监测率　　MB(或PB)麻风病人的实际临床监测数占应监测的病例总数的百分比。某年(期)实际临床监测病例数　MB(或PB)临床监测率＝─────────────────────×100％　　　　　　同期应监测病例总数　　2、B病人的细菌监测率　　在MB病人监测期内，每年应作细菌学检查的实际例数占应监测例数的百分比。　某年(期)作细菌学检查的例数　MB细菌监测率＝─────────────────────×100％　　同期应监测病例总例数　　第三节　麻风病的基本统计分析方法\n　　一、平均数与标准差　　平均数是分析测量资料常用的一种统计指标。它说明一组观察值的平均水平或集中趋势。在麻风病统计中常用的有算术均数、几何均数和中位数。标准差也是分析测量资料常用的统计指标，它说明一组观察值的离散程度。在应用中，常常把平均数和标准差结合运用，综合表达一组观察值的集中和离散特性。　　(一)小样本均数、标准差直接计算法　　1、公式_　∑X　X＝　────　　　　　　　　　　　(1.1)　N┌─────│　_│∑(X－X)2S＝│──────(1.2)√N－1┌────────│　(∑X)2│∑X2－──────│NS＝│────────────(1.3)√N－1_X:观察值　　　　　　　X:算术均数　N:观察值个数　　　　　S:标准差　∑X:观察值总和　∑X2:观察值平方的总和_　∑(X－X)2:观察值的离均差平方和医学统计学之20--基本统计方法（在医科院皮研所统计培训班编写的讲义）2008年06月08日星期日06:502、应用范围及注意事项　　(1).观察值必须是同质的。　　(2).观察值资料必须大体符合正态分布才能计算均数，而偏态分布的资料不宜用均数描述其集中趋势。　　(3).标准差越大，表示观察值的分布越分散、标准差越小，说明观察值分布越集中。　　(4).常以“均数±标准差”的写法综合表达一组观察值的集中和离散特征。　　3、实例　　［例1.1］　10例麻风病人空腹测定转氨酶GPT的结果为43、50、36、32、40、38、47、41、45、40单位，求GPT的平均值和标准差。　　计算步骤:\n　　∑X＝43＋50＋36＋32＋……＋40＝412∑X2＝432＋502＋362＋322＋……＋402＝17228　　代入公式(1.1)求均数得_412　　X＝───＝41.210代入公式(3.2)求标准差得┌─────────│　　4122　　　│17228－────│10S＝│───────────＝5.308√10－1　　故可用均数与标准差综合表示10名麻风病人转氨酶测定结果为:41.2±5.308。　　(二)、大样本均数、标准差的计算法　　1、公式_∑fxX＝────(1.4)∑f　　　　　┌──────────│(∑fx)2│∑fX2－──────│∑fS＝│──────────(1.5)√∑f－1_　X:均数　X:各组的组中值　　　　f:频数　　　　S:标准差　　　　　　　　　　　　2、应用范围及注意事项　　(1)样本观察值与小样本资料一样，必须同质并呈正态分布。　　(2)大样本资料应先整理成频数表后再进行计算。频数表一般以8—15个组段为宜。　　3、实例　　[例1.2］某地在1975年调查麻风发病情况，共发现640例麻风病人，其年龄分布如表1.1所示，求麻风病人发现时平均年龄。表1.1　某地麻风病人发现年龄统计(1975)───────────────────────────　年龄组　　　组中值　　　病人数───────────────────────────　0－2.535－7.51110－12.546\n15－17.59520－22.511025－27.518130－32.59035－37.56840－42.53045－47.51350－52.5855－6057.57─────────────────────合计　　640─────────────────────　　计算步骤:　　(1).首先将数据分组，整理成如表1.1所示的频数分布表。可利用函数型电子计算器的统计计算功能，方便地求得均数及其标准差。不同的计算器其操作方法有些差别，本书均以CASIOfx－180P为例，其它种类计算器请参考说明书。　　　(2).将计算器置于“SD”工作状态，即按下MODE3，液晶屏显示“SD”，然后按下INV　AC，清除内存中遗留的数字。在每次进行新的运算之前，都应进行上述操作。　　(3).输入数据:2.5×3RUN7.5×11RUN12.5×46RUN……57.5×7RUN。　　(4).取出结果:INV3，显示:9.6137(标准差SD)，INV　1，　显示:27.145(均数值)。　　(三)几何均数　　1、公式　　　　　　∑lgXG＝lg－1(────)(1.6)N∑flgXG＝lg－1(─────)(1.7)∑fG:几何均数　　　　　　　　X:观察值　　N:观察值个数　　　　　　　f:频数　　2、应用范围及注意事项　　(1).当样本观察值呈等比关系或对数正态分布而求均数时，如计算抗体平均滴度、传染病平均潜伏期等，可用几何均数。　　(2).一般采用以10或e为底的对数进行计算。　　(3).公式(1.6)适用于未分组小样本资料，公式(1.7)适用于分组的大样本资料。医学统计学之21--基本统计方法（在医科院皮研所统计培训班编写的讲义）2008年06月09日星期一07:41　　3、实例　　［例1.］　　8例麻风病人的估计潜伏期分别为2、3、5、8、9、14、20、31年，求其平均潜伏期。　　计算步骤:　　(1)　∑lgX＝lg2＋lg3＋lg5＋……＋lg31\n＝7.27307.2730(2)　G＝lg－1(───────)8＝lg－1(0.9091)＝8.1(年)(四)中位数计算法　　1、公式　　小样本未分组资料计算法:　　一组观察值按大小顺序排列，如个数为单数，则居中的一个观察值即为中位数；如个数为双数，则居中的两个观察值的平均数为中位数。　　大样本分组资料计算法:　　　　　N──－C2M＝L＋─────────(i)(1.8)fmM:中位数　　　N:总频数　　L:中位数所在组段的下限i:组距　　fm:中位数组段内的频数　　C:小于L的各组段的累计频数　　2、应用范围及注意事项　　(1).中位数适用于表示大多数观察值分布比较集中、少数极大值或极小值分布两端的样本的集中趋势。这种资料的算术均数易受极端值的影响，而对中位数则影响很小。　　　(2)大样本资料应先编制频数表再计算中位数。　　3、实例　　［例1.4］有204例麻风病人血中大单核细胞百分数资料，制成频数分布表如表1.2所示，计算其中位数。　　表1.2　204例麻风病人大单核细胞百分数中位数计算表。────────────────────分组　　频数　　累积频数────────────────────　　0－2424　　2－4064　　4－55119　　6－37　　8－27　10－1812－114－016－118－020－1\n───────────────────204───────────────────计算步骤:(1).自上而下累计各组段频数。　　(2).找中位数所在组段。本例中位数在第3组。　　(3).本例:L＝4,N＝204,i＝2,fm＝55,C＝64204─────－642M＝4＋───────────·2＝5.38％55　　二、t检验　　用计算t值进行差异显著性检验的方法称做t检验。检验适用于服从正态分布而且符合随机抽样原则的资料。t检验习惯上按下列标准判定检验结果:　　t＜t(0.05)P＞0.05无显著性差异　　t(0.05)≤t＜t(0.01)0.05≥P＞0.01有显著性差异　　t≥t(0.01)P≤0.01有高度显著性差异　　检验有显著性差异并不等于有实际意义，还需要根据专业知识判断，谨慎地下结论。　　(一)、样本均数的标准误　　1、公式　　　　　S　　　Sx＝────(2.1)　　　　　┌───√NSx:样本均数的标准误S:样本标准差　　N:样本例数　　2、应用范围及注意事项　　(1).标准误是样本均数的标准差，表示样本平均数分布的离散程度。可用于估计总体均数的可信区间和进行均数间的差异显著性检验。　　(2).表示样本均数离散情况时，可以写成“均数±标准误”的形式。但必须标明是标准误，或用符号SE表示，以便和标准差相区别。　　(二)、配对资料的t检验　　1，公式_　　　　　d　　　t＝─────　　　　　　　(2.2)Sd_　　d:差数均数　　　Sd:差数均数标准误\n医学统计学之22--基本统计方法（在医科院皮研所统计培训班编写的讲义）2008年06月13日星期五06:492、应用范围及注意事项　　(1).医学研究中常采用的自身对照和配对比较设计得到的都是配对资料。　　(2).配对资料t检验比用两个分组均数的差异显著性检验法的效率高，但事先未经配对设计的资料不能用本法检验。　　　3，实例　　[例2.1]　用DDS、RFP和B663联合用药治疗10例瘤型麻风病人，治疗前及治疗一年后的BI值如表2.1所示，试问治疗前后的BI值是否有显著性差异?　表2.1　　10例麻风病人联合化疗前后BI变化─────────────────────────────────例号　治疗前　　治疗后　　差数(d)　　　d2─────────────────────────────────1　　　5.4　4.01.41.9623.22.50.70.4932.52.6－0.10.0143.01.91.11.2154.23.30.90.8164.63.70.90.8173.42.70.70.4984.13.40.70.4993.62.80.80.64102.72.10.60.36─────────────────────────────────7.77.27─────────────────────────────────　　1、检验假设:治疗前后BI值无差异。　　2、计算步骤:　　(1).求治疗前后BI差数d和d2(见表2.1第4和第5列)，计算其总和，∑d＝7.7，∑d2＝7.27。　　　　　　　　　　　　　　　　_　　(2).把数据代入公式(1.1)和(1.3)计算差数的均数d和标准误Sd得:　　　7.7　d＝───＝0.77　　　　10　　　　　　　　┌─────────│7.72│7.27－────│10　Sd＝│────────────＝0.3860√　10—1　　　　　　　　　　　　　\n　　(3).把数据代入公式(2.1)求标准误Sd得　　　　　　　0.3860　　　　Sd＝───────＝0.1221┌───　　　　　√10　　(4)把数据代入公式(2.2)求t值得:　　　　　0.77　　　t＝───────────＝6.308　　　　　0.1221　　3、确定P值　　计算自由度(df),df＝10—1＝9,查t值表(见附表　)，t(0.01(9))＝3.250，　　　本例t＞t(0.01(9))，故P＜0.01。　　4、统计判断:　　　该组病例在治疗前与治疗一年后，BI有非常显著性差别(P＜0.01)，所以可以认为该疗法有显著降低BI的作用。　　(三)、两样本均数差别的t检验　　1，公式　　　_　_　∑(X1－X1)＋∑(X2－X2)　　　　Sc2＝───────────────────　　　N1＋N2－2　　(∑x1)2(∑x2)2　　　　∑X12－──────＋∑X12－──────　　N1N2　　＝────────────────────────────(2.3)　N1＋N2－2　　　　　　　┌─────────　　│11　Sx1－x2＝│Sc2(───＋───)(2.4)√N1N2　　_　　_　│X1－X2│t＝─────────(2.5)Sx1－x2__X1:样本I的均数X2:样本II的均数　S2c:合并方差　　　X1:样本I的观察值　X2:样本II的观察值　　N1:样本I的例数　N2:样本II的例数　　Sx1－x2:两样本均数之差的标准误　　2、应用范围及注意事项\n　　(1).两个样本均数差别的t检验，适用于按完全随机化设计的两样本均数的差异显著性检验。　　(2).两样本例数不相等也可以检验，但当两样本例数相等时，检验的效率最高。　　(3).如每组例数大于10，而两标准差的平方相差5倍以上时，不能直接用t检验，可考虑用非参数统计方法。　　3、实例　　［例2.2］　为研究正常成年男、女血液红细胞均数之差别，检查了某地25—29岁正常成年男子156名，正常女子74名，男性红细胞均数为465.13万/mm3，标准差为54.80万/mm3。问两组均数差别有无显著意义?　　1、检验假设:　两性间红细胞数无差异。　　2、计算步骤:　　将数值代入公式(2.3)、(2.4)和(2.5):(156－1）(54.80)2＋(74－1)(44.20)2Sc2＝─────────────────────────156＋74－2＝2667.05(万/mm3)　　　　　┌─────────│156＋74Sx1－x2＝│2667.05×───────＝7.29(万/mm3)√156×74465.13－422.16　　　t＝────────────＝5.897.293、确定P值:　计算自由度df＝156＋74－2＝228，　　查t值表t(0.01(120))＝2.67，n'越大则t的临界值越小，本例t＞t(0.01(120))，则必大于t(0.01(228)),　故P＜0.01。　4、统计判断　　25—29岁正常男女间红细胞数之差别有极显著意义。医学统计学之23（完）--基本统计方法（在医科院皮研所统计培训班编写的讲义）2008年06月15日星期日09:54(四)、两样本含量较大时均数差别的t检验　　1、公式　　　　　_　_　　　　　　　　　　　　　│X1－X2│u＝────────(2.6)┌─────√S2x1＋S2x2　　　　　　　　_　　　　　　　_u:u值,　　X1:样本I的均数,X2:样本II的均数　\n　　Sx1:样本I的标准误　　Sx2:样本II的标准误　　2、应用范围及注意事项　　(1)．样本量大于100时，t分布近似正态分布，可用u检验。　　(2)．按下列标准判定结果:　　u＜1.96，P＞0.05差异不显著　　1.96≤u＜2.58，0.05≥P＞0.01　差异显著　　u≥2.58，P≤0.01　　差异非常显著　　(3)．其它条件与(三)相同。　　3、实例　　［例2.3］某院测定200例银屑病人的血清铜含量均数为110.49ug％，标准差为29.13ug％；健康对照组165例，平均值为125.91ug％，标准差为17.74ug％。比较两组的血清铜值是否有差异?　　1、检验假设:两者血清铜值无差异。　　2、计算步骤:　　将数值代入公式(2.6)|110.49－125.91|u＝─────────────＝4.224│29.1317.74│(───)2＋(───)2　√　√100√65　　3、确定P值:　　u＞2.58，故P＜0.01　　4、统计判断　　本例两样本均数差别非常显著(P＜0.01)，说明银屑病人的血清铜含量比正常人偏低。　　(五)、关于t检验的说明　　1、显著性检验有双侧检验和单侧检验之分，请读者参考有关统计书。　　2、t检验只有在两个样本均数的方差没有显著差别的前提下，才可使用，否则须改用t'检验。　　3、例2.1是对配对资料BI进行t检验，BI属半定量资料，有些BI值并不服从正态分布，所以使用t检验时要慎重；但目前国内外普遍使用t检验来比较治疗前后BI均数差异，故在此举一例。

医学统计学讲义 58页