- 362.50 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
医学统计学姜长青首都医科大学附属北京安定医院\n医学统计学第一章概论第二章集中趋势与离散趋势的统计描述第三章t检验第四章方差分析第五章卡方检验第六章非参数检验第七章相关与回归8/7/20212\n第一章概论第一节医学统计学的意义第二节医学统计工作中的内容和资料类型第三节医学统计中的基本概念8/7/20213\n第一节医学统计学的意义统计分析是科研工作中的一种有力工具。它同科研的总体设计、资料采集、资料整理、资料分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。只有正确运用统计分析方法,才不致于造成不应有的缺陷或得出错误的结论。8/7/20214\n第二节医学统计工作中的内容和资料类型医学统计工作的内容资料的类型8/7/20215\n医学统计工作中的内容收集资料收集资料就是根据研究的目的,实验设计的要求,收集准确的、完整的、充满信息的原始资料。整理资料整理资料就是把收集到的原始资料,有目的地进行科学加工,使资料系统化、条理化,以便进行统计分析。分析资料分析资料就是把经过统计整理的资料,作一系列统计描述和统计推断,阐明事物的规律性。8/7/20216\n资料的类型计量资料是对每个观察对象的观察指标用定量方法测定该项指标的数值大小所得的资料,一般用度量衡单位表示。计数资料是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。等级分组资料在医学实践中,有些资料具有计数资料的特性,同时又兼有半定量的性质,被称为按等级分组资料。8/7/20217\n第三节医学统计中的基本概念变异总体和样本抽样配对设计与随机区组设计误差概率8/7/20218\n变异医学研究的对象是有机的生命体,其机能是十分复杂的。不同的个体在相同的条件下,对外界环境因素可以发生不同的反应。这种现象称只为个体差异或称为变异。由于医学统计研究的对象是有变异的事物,因此,用观察1~2例的结果来推论出一般规律是不恰当的。科学研究工作的主要任务就是要从表现为偶然的大量数据中,分析出其中必然性的规律。8/7/20219\n抽样代表性就是要求样本中的每一个个体必须符合总体的规定。随机性抽签法机械抽样法分层抽样随机数字表可靠性指对实验的结果要有可重复性,即由科研课题的样本的结果推论总体的结论有较大的可靠性。可比性如果进行两个或多个样本之间的比较,那么要求每两个样本之间应具有可比性,也称为齐性对比原则。8/7/202110\n配对设计与随机区组设计完全随机设计是将受试对象随机分配到各个处理组或对照组,或分别从不同总体中随机抽样进行研究。配对设计它是将受试对象按一定条件配成对子,称为配对样本,将它们随机分到两个组中,分别给以不同处理。随机区组设计它也称为配伍组设计,是配对设计的扩展。配对设计的每一“对子”分别随机分到两个处理中,而配伍设计中的每个“配伍组”,包含有多个受试对象,要将它们分别随机分到各处理组。8/7/202111\n误差系统误差在收集资料过程中,由于仪器初始状态未调到零、标准试剂未经效正、医生掌握疗效标准偏高或偏低等原因,可使观察结果造成倾向性的偏大或偏小,叫做系统误差。随机测量误差在收集资料过程中,由于各种偶然因素的影响而造成同一对象多次测定结果的不完全一致。这种误差往往没有固定的倾向,有时高有时低,被称为随机测量误差。抽样误差个体之间存在变异,而抽样有时只能抽去总体中的一小部分作为样本。8/7/202112\n概率概率是描述某一事件发生的可能性大小的一个量度。用A表示某一事件,P表示该事件可能发生的概率。在一定条件下,肯定发生的事件称为必然事件,概率为1;肯定不发生的事件称为不可能事件,概率为0;可能发生也可能不发生的事件称为随机事件或偶然事件,其概率介于0与1之间。在统计学上,习惯将P≤0.05或P≤0.01称为小概率事件,表示该事件发生的可能性很小。在医学研究中,常把P≤0.05作为事物差别有统计学意义,P≤0.01作为事物差别有高度统计学意义的界限.8/7/202113\n第二章集中趋势与离散趋势的统计描述第一节集中趋势的描述统计这一部分的主要内容涉及统计图表和描述平均水平和集中趋势的统计量,目的在于有效地组织、整理和表现统计资料的信息。第二节离散趋势的描述统计衡量变异程度大小的指标有多种,但大体可以分为两类:一类是按间距计算,有极差和四分位数间距;另一类则按平均差距计算,有离均差平方和、均方差、标准差和变异系数等。8/7/202114\n第一节集中趋势的描述统计频率分布平均数算术均数几何均数中位数百分位数8/7/202115\n频率分布类型频率表直方图用途作为陈述资料的形式,可以代替繁复的原始资料,便于进一步分析。便于观察数据的分布类型。便于发现资料中某些远离群体的特大或特小的可疑值。当样本含量比较大时,可用各组段的频率作为概率的估计值。8/7/202116\n算术均数直接法加权法8/7/202117\n几何均数通用式:直接法:分组法:8/7/202118\n中位数直接法当观察例数为奇数时:M=X(n+1)/2当观察例数为偶数时:M=½(Xn/2+Xn/2+1)分组法其中L、iM、fM、分别为所在组段的下限、组距和频数,fL为M所在组之前各组段的累积频数。8/7/202119\n百分位数百分位数用符号Px表示,x即百分位,所谓百分位数Px是指在一组数据中找到这样一个值,全部观察值的x%小于Px,而其余(100-x)%大于Px。其中L、ix、fx、分别为Px所在组段的下限、组距和频数,fL为Px所在组之前各组段的累积频数。8/7/202120\n第二节离散趋势的统计描述极差和四分位数间距平均偏差离均差平方方差标准差变异系数8/7/202121\n积差和四分位数间距积差也称全距,即一组观察值中最大值和最小值之差,符号为R,是变异指标中最简单的一种。四分位数间距将所有的观察值排序后,分成四个数目相等的段落,每个段落的观察值数目各占总例数的25%,去掉两端的25%,取中间50%观察值的数值范围即为四分位数间距。四分位数间距用符号Q表示,它可以通过计算百分位数P75和P25之差得到,即Q=P75-P258/7/202122\n平均偏差计算各观察值偏离平均数的平均差距,为了避免正负抵消,将每个观察值与均数之差的绝对值相加,然后取平均,称作平均偏差,它可以表示为:平均偏差是一个很直观的变异量度,但由于用了绝对值,在数学上不便于继续处理,使它在应用上受到很大限制,实际中很少使用。8/7/202123\n离均差平方和为了克服平均偏差使用绝对值不便进一步运算的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和,其公式为:它描述了每个观察值相对于集中位置“均数”的分散程度。通过计算可化为下式:8/7/202124\n方差将离均差平方和再取平均,其结果称作均方差,简称方差。需要注意的是,对于样本资料,在对离均差平方和取平均时分母用n-1代替n,于是有:式中s2为样本方差,分母n-1称为自由度。8/7/202125\n标准差在统计分析中为了方便,通常将方差取平方根,还原成与原始观察值单位相同的变异量度,即标准差,计算公式如下:也可写为:8/7/202126\n变异系数在两组数据的均数相差不大,单位也相同时,从标准差的大小就可以直接比较两个样本的变异程度。当均数相差较大或单位不同的几组观察值的变异程度进行比较时,标准差就不适宜了,在这种情况下可以使用变异系数,其计算公式为:8/7/202127\n第三章t检验第一节假设检验的意义和步骤第二节单个样本t检验第三节配对样本t检验第四节两独立样本t检验8/7/202128\n第一节检验假设的意义和步骤检验假设的基本概念检验假设是对估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设。如果拒绝,认为该样本很可能不是来自这个总体;否则,很可能来自这个总体。建立检验假设和确定检验水平假设:无效假设(H0)/被择假设(H1)检验水平:选择检验方法和统计推断分析选择检验方法和计算检验统计量确定P值和作出统计推断结论8/7/202129\n第二节单个样本t检验(1)例:根据大量调查,已知健康成年男子的脉搏均数为72次/分,某医生在某山区随机调查30名健康男子,求得脉搏均数为74.2次/分,标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?8/7/202130\n第二节单个样本t检验(2)建立检验假设,确定检验水平H0:µ=µ0H1;µµ0∝=0.05计算检验统计量确定P值,做出推断结论本例自由度v=n-1=30-1=29查附表得t0.05(29)=2.045今t0.05,无统计学意义8/7/202131\n第三节配对样本t检验(1)将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。配对设计资料主要有三种情况:两种同质受试对象分别接受两种处理;同一受试或同一样本的两个部分,分别接受两种不同处理;同一受试对象处理(实验或治疗)前后的结果比较。配对设计的检验统计量为:8/7/202132\n第三节配对样本t检验(2)例:有12名接种卡介苗的儿童,八周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,问两种结核菌素的皮肤浸润反应性有无差别?编号标准品新制品差值dd2112.010.02.04.00214.510.04.520.25315.512.53.09.00.....1210.59.51.01.00合计391958/7/202133\n第三节配对样本t检验(3)建立检验假设,确定检验水平H0:µd=0H1;µd0∝=0.05计算检验统计量确定P值,做出推断结论自由度v=n-1=12-1=11,t0.05(11)=2.201t0.01(11)=3.106本例t>t0.01(11),P<0.01,差别有统计学意义8/7/202134\n第四节两独立样本t检验感总体方差相等时的两独立样本t检验总体方差不等时的两样本t’检验8/7/202135\n总体方差相等时的两独立样本t检验(1)两总体方差相等(σ12=σ22)时,可将两方差合并,估计出两者的共同方差—合并方差Sc2。两样本t检验的检验统计量为:其中,公式2为两样本均数之差的联合标准误,公式3为联合方差。8/7/202136\n总体方差相等时的两独立样本t检验(2)例:25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后再次测空腹血糖,问两组患者血糖值是否相同?编号12345678910111213甲组8.410.512.012.013.915.316.718.018.720.721.115.2乙组5.46.46.47.57.68.111.612.013.413.514.815.618.78/7/202137\n总体方差相等时的两独立样本t检验(3)建立检验假设,确定检验水平H0:µ1=µ2H1;µ2µ2∝=0.05计算检验统计量确定P值,作出推断结论t>t0.05(23)=2.069,P<0.05,差异有统计学意义。8/7/202138\n总体方差相等时的两独立样本t检验(4)若已知S1、S2,也可用如下公式计算SC28/7/202139\n总体方差不等时的两样本t’检验(1)方差齐性检验检验统计量F值为两个样本方差之比,若仅为抽样误差的影响,它一般不会偏离1太远。求得F值后,查附表得P值,按所取的α水准做出判断结论。统计学对两样本均数比较时,是否需要进行方差齐性检验有不同的看法。有人提出当一个样本的方差是另一个样本方差3倍以上,可认为两总体方差不齐。有的认为若样本含量较大时(如n1和n2均大于50),可不必做方差齐性检验。8/7/202140\n总体方差不等时的两样本t’检验(2)t’检验检验统计量t’为:效正临界值t’α为:8/7/202141\n总体方差不等时的两样本t’检验(2)例:两组小白鼠,分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠体重增加量(g)如下,比较两组小白鼠增重均数是否不同?编号12345678910111213X1504742433951434851425043X2363837383639373533373934368/7/202142\n总体方差不等时的两样本t’检验(3)方差齐性检验建立检验假设,确定检验水准H0:σ12=σ22H1:σ12≠σ22计算检验统计量确定P值,作出统计推论υ1=n1-1=12-1=11υ2=n2-1=13-1=12F0.05(11,12)=3.34,F>F0.05(11,12),P<0.05,有统计学意义.8/7/202143\n总体方差不等时的两样本t’检验(4)t’检验建立检验假设H0:µ1=µ2H1;µ2µ2计算检验统计量确定P值,作出推断结论t’>t’0.05,P<0.05,差异有统计学意义8/7/202144\n第四章方差分析第一节完全随机设计的方差分析第二节随机区组设计的方差分析第三节多个样本均数的多重比较第四节析因设计的方差分析(略)8/7/202145\n第一节完全随机设计的方差分析(1)完全随机设计的数据结构处理分组观察值组均值样本容量1X11,X12,…X1n1x1n12X21,X22,…X2n2x2n2………….…..….cXc1,Xc2,…Xcncxcnc8/7/202146\n第一节完全随机设计的方差分析(2)完全随机设计资料的方差分析表变异来源平方和自由度均方F总变异N-1组间c-1SSTR/υTRMSTR/MSe组内N-cSSe/υe8/7/202147\n第一节完全随机设计的方差分析(3)例:为探讨一氧化碳(NO)在肾缺血再灌流过程中的作用,将36只雄性SD大鼠随机分为3组给予不同处理后,测得NO数据如下。试问各组NO水平是否相同?正常对照组肾缺血60min组肾缺血60min再灌流组合计437.98322.75284.04285.75464.51194.90...309.60288.76219.72338.83386.67143.17n12121236ΣX4106.783943.433117.011167.21ΣX21436935.8671329275.534883943.82183650155.2338/7/202148\n第一节完全随机设计的方差分析(4)建立检验假设H0:μ1=μ2=μ3H1:μi(i=1,2,3)不完全相同计算统计量方差分析表及统计推断(见下张幻灯片)8/7/202149\n第一节完全随机设计的方差分析(5)方差分析表变异来源自由度平方和均方FF0.01总变异35186083.579不同处理246925.9523462.985.5645.32误差33139157.6294216.898按ν1=2,ν2=33查附表得F0.01(2,33)=5.32本例F>F0.01(2,33),P<0.05故按α=0.05水平拒绝H0,接受H1,可以认为三组NO总体水平不同。8/7/202150\n第2节随机区组设计的方差分析(1)随机区组设计的方差分析表变异来源平方和自由度均方F总变异N-1因素Ac-1SSA/(r-1)MSA/MSe因素Br-1SSB/(r-1)MSB/MSe误差(c-1)(r-1)SSe/υe其中校正项8/7/202151\n第2节随机区组设计的方差分析(2)例:将36只雌性大白鼠按月龄相同、体重接近分为12组,经一段时间注射不同剂量雌激素后的子宫质量见下表。试问:1.不同组的大鼠间子宫质量是否相同?2.接受不同剂量注射的大鼠子宫质量是否相同?区组0.20.40.8合计1831001092922647811125336979149297.…………1262106114282合计7941092153734238/7/202152\n第2节随机区组设计的方差分析(3)建立检验假设(1)H0:μ1=μ2=μ3H1:μi(i=1,2,3)不同剂量组间不完全相同(2)H0:τ1=τ2=τ3H1:τi(i=1,2,3)不同种属间不完全相同计算统计量8/7/202153\n第2节随机区组设计的方差分析(4)方差分析表变异来源平方和自由度均方F总变异29274.7535不同剂量间23302.1667211651.083353.4769不同区组间1179.416711107.21970.4921误差4793.166722217.8712对关于剂量分组的假设,查附表,F0.05(2,22)=3.44<53.4769,P<0.05。按α=0.05水平拒绝H0,接受H1。对不同区组的假设,查附表,F0.05(11,22)=2.26>0.4921,P>0.05。按α=0.05水平不能拒绝H0。8/7/202154\n第三节多个样本均数的多重比较q检验法用于对多个样本均数每两个作比较,检验统计量为:式中为两个对比组的样本均数,Mse是方差分析中的误差均方(或组内均方),nA、nB为两对比组的样本例数,υe为方差分析中误差均方的自由度。8/7/202155\n第五章卡方检验第一节2×2表卡方检验第二节行×列表卡方检验第三节配对资料卡方检验8/7/202156\n第一节2×2表卡方检验四格表卡方检验四格表资料卡方检验的连续性校正四格表卡方检验的精确概率检验法(略)8/7/202157\n四个表卡方检验(1)使用卡方检验的基本公式卡方检验的基本公式为:这里R是Row(行)的字头,C是Column(列)的字头,ARC是位于R行C列交叉处的实际频数,TRC是位于R行C列交叉处的理论频数。nR是ARC所在的行的合计,nC是ARC所在列的合计,n是多个样本例数的合计。8/7/202158\n四个表卡方检验(2)例:某药品检验所随机抽取574名成年人,研究某抗生素的耐药性。其中179例未曾使用该抗生素,其耐药率为40.78%;而在395例曾使用过该药的人群中,耐药率为45.57%,试问两种人群的耐药率是否一样?用药史不敏感敏感合计耐药率(%)曾服该药18021539545.57未服该药7310617940.78合计25332157444.088/7/202159\n四个表卡方检验(3)建立检验假设H0:两种人群对该抗生素的耐药率相同,即л1=л2H1:两种人群对该抗生素的耐药率不相同,即л1≠л2计算检验统计量查表及统计推断χ20.05(1)=3.84,本例χ2<χ20.05(1),P>0.05在α=0.05的检验水准下,接受H0。8/7/202160\n四个表卡方检验(4)四格表资料χ2检验专用公式2×2表格式B1B2合计A1aba+bA2cdc+da+cb+dn=a+b+c+d8/7/202161\n四格表资料卡方检验的连续性校正(1)在四个表资料中,当n≥40且某一理论值1≤T<5时,须对χ2值进行连续性效正。8/7/202162\n四格表资料卡方检验的连续性校正(2)例:某医学院抽样调查大学四年级和五年级的学生近视眼患病情况,四年级学生的近视率为7.14%,五年级学生的近视率为35.71%,试问大学四年级与五年级学生的近视率是否一样?年级近视非近视合计近视率(%)四年级2(4.67)26(23.33)287.14五年级5(2.33)9(11.69)1435.71合计7354216.678/7/202163\n四格表资料卡方检验的连续性校正(2)建立检验假设H0:四年级与五年级学生的近视眼率相同,即л1=л2H1:四年级与五年级学生的近视眼率不相同,即л1≠л2计算检验统计量查表及统计推断χ20.05(1)=3.84,本例χ2<χ20.05(1),P>0.05在α=0.05的检验水准下,接受H0。8/7/202164\n四表格卡方检验的确切概率计算法在四表格的卡方检验中,若遇到总例数n<40,或有理论值T<1,即使采用效正公式计算的卡方值亦有偏差。因此,R.A.Fisher提出直接计算有利于拒绝H0的概率,以作出检验判断。具体计算方法因较烦琐,此处不做深入介绍。8/7/202165\n第二节行×列卡方检验行×列表的简化计算公式行×列表的分割多个实验组间的两两比较多个实验组与同一对照组的比较8/7/202166\n行×列表的简化计算公式行×列的计算公式如下:由于上式计算需要先计算理论值,所以显得比较繁琐。行×列表资料卡方检验还可以用其简化公式:8/7/202167\n多个实验组间的两两比较(1)例:某医院用三种治疗方案治疗急性黄疸型病毒肝炎245例,观察结果见下表,试比较三种疗法的有效率是否一样?组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75中西药结合组59157479.73合计14510025457.09本例χ2=22.28>χ20.05(2),P<0.05,拒绝H0。但究竟哪两组之间的有效率有差别,须进一步作两两组间率的比较。8/7/202168\n多个实验组间的两两比较(2)西药与中药治疗肝炎疗效比较组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75合计869418047.78查表χ20.05(1)=3.84,而χ2<χ20.05(1),则P>0.05>0.017,在0.017的水平下不拒绝H0。8/7/202169\n多个实验组间的两两比较(3)西药与中西药结合治疗肝炎疗效比较组别有效无效合计有效率(%)西药组514910051.00中西药结合59157479.73合计1106417463.22查表χ20.01(1)=6.63,而χ2>χ20.01(1),则P<0.01<0.017,在0.017的水平下拒绝H0。8/7/202170\n多个实验组间的两两比较(4)中药与中西药结合治疗肝炎疗效比较组别有效无效合计有效率(%)中药组35458043.75中西药结合59157479.73合计946015461.04查表χ20.01(1)=6.63,而χ2>χ20.01(1),则P<0.01<0.017,在0.017的水平下拒绝H0。8/7/202171\n多个实验组与同一对照组比较(1)例:现有三种药物,欲研究其治疗心绞痛的疗效。另设一组安慰剂作对照,实验结果见下表,试问各组间的心绞痛缓解率是否相同?疗效缓解未缓解合计安慰剂287098A药511263B药392059C药292958合计147131278本例χ2=47.51>χ20.05(2),P<0.05,拒绝H0。但若想进一步知道每种药物与安慰剂比较其疗效如何,须将三种药物分别与安慰剂比较。8/7/202172\n多个实验组与同一对照组比较(2)安慰剂与A药疗效的比较组别缓解未缓解合计缓解率(%)安慰剂28709828.57A药51126380.95合计798216149.07查表χ20.01(1)=6.63,而χ2>χ20.01(1),则P<0.01<0.017,在0.017的水平下拒绝H0。8/7/202173\n多个实验组与同一对照组比较(3)安慰剂与B药疗效的比较组别缓解未缓解合计缓解率(%)安慰剂28709828.57B药39205966.10合计679015742.67查表χ20.01(1)=6.63,而χ2>χ20.01(1),则P<0.01<0.017,在0.017的水平下拒绝H0。8/7/202174\n多个实验组与同一对照组比较(4)安慰剂与C药疗效的比较组别缓解未缓解合计缓解率(%)安慰剂28709828.57B药29295850.00合计577915636.54查表χ20.01(1)=6.63,而χ2>χ20.01(1),则P<0.01<0.017,在0.017的水平下拒绝H0。8/7/202175\n第三节配对资料卡方检验(1)基本公式:校正公式:当观察频数b+c<40时,需要对χ2进行校正。8/7/202176\n第三节配对资料卡方检验(2)例;在下列资料中,A培养基的阳性培养率为36.36%,B培养基的阳性培养率为34.345,试问A、B两种培养基的阳性培养率是否相同?两种培养基的培养结果A培养基B培养基合计+–+48(a)24(b)72–20(c)106(d)126681301988/7/202177\n第三节配对资料卡方检验(3)建立检验假设H0:两种培养基的阳性检出率相等H1:两种培养基的阳性检出率不等计算检验统计量查表及统计推断χ20.05(1)=3.84,本例χ2<χ20.05(1),P>0.05在α=0.05的检验水准下,接受H0。8/7/202178\n第六章非参数检验方法第一节配对资料的秩和检验第二节两样本比较的秩和检验第三节多个样本比较的秩和检验8/7/202179\n第一节配对资料的秩和检验(1)一般步骤求出各对数据的差值建立检验假设编秩次,求秩和依差值绝对值,从大到小排秩,并按差值的正负,标上正负号;编秩时,对正负号不同的差数中,若有绝对值相等时,则取其平均秩次;分别求正负秩次之和T+与T–,并以绝对值较小者为统计量T值。查表,确定P值范围当n≤25时,可查附表的T界值表,T越小,P越小。当n>25时,可按近似正态分布用u检验,其公式为:8/7/202180\n第一节配对资料的秩和检验(2)例:临床某医生研究白癜风病人的IL-6指标在白癜风部位与正常部位有无差异,调查的资料如下:病人号白斑部位正常部位d=正常-白斑秩次140.0388.5748.546291.1388.00-17.13-3380.32123.7243.404425.3239.0313.712519.6124.374.761614.5092.7578.258749.63121.5771.947844.5689.7645.205合计T+=33T–=38/7/202181\n第一节配对资料的秩和检验(3)建立检验假设H0:差值总体的中位数为0H1:差值总体的中位数不为0计算统计量首先计算每个对子的差值d,根据8个d的绝对值,由小到大排秩,并根据d的正负号给予正负号。然后分别相加正负秩次,得到T+=33,T–=3,取较小者为统计量T=T–=3。查表及结论现n=8,查T值表T0.05(8)=3~33,T=3恰好落在界点上,所以P≤0.05,按α=0.05水准拒绝H0,可认为白斑部位与正常部位的白介素有差异。8/7/202182\n第二节两样本比较的秩和检验(1)一般步骤建立检验假设编秩号,求秩和两样本观察值从小到大混合编秩;设n1与n2分别为两样本的含量,规定n1159,超出范围,P<0.05,拒绝检验假设,即两组患者的平均生存时间不同。8/7/202185\n第三节多个样本比较的秩和检验(1)一般步骤建立检验假设编秩次,求秩和将各组数据从小到大统一编秩次,对相等的数值,如分属不同组时应取平均秩次;分别计算各组的秩和Ti。计算统计量H近似服从自由度υ=k-1的χ2分布,按χ2的界值表确定P的范围。8/7/202186\n第三节多个样本比较的秩和检验(2)患自发性白患移植白血病患移植白血病正常脾血病的脾的脾(甲组)的脾(乙组)含量秩次含量秩次含量秩次含量秩次(1)(2)(3)(4)(5)(6)(7)(8)12.31810.889.319.5213.22211.61310.33.510.33.513.72612.31811.11110.5515.22812.72111.71410.5615.82913.52311.71510.5716.93013.52412.01610.9917.33114.82712.31811.01017.43212.42011.51213.625n1=8T1=216n2=7T2=134n3=9T3=123.5n4=8T4=54.58/7/202187\n第三节多个样本比较的秩和检验(5)建立检验假设H0:四组鼠脾DNA含量的总体分布相同H1:四组鼠脾DNA含量的总体分布不全相同计算统计量查表及结论k=4,υ=k-1=4-1=3,查χ2界值表χ20.05(3)=7.81,本例χ2=19.90>χ20.05(3),P<0.05,按α=0.05水准拒绝H0,接受H1,故认为四组DNA含量有差别。8/7/202188\n第七章相关与回归第一节线性相关第二节线性回归第三节线性相关与回归的区别与联系第四节等级相关8/7/202189\n第一节线性相关(1)相关系数的计算方法皮尔森(Pearson)相关法原始分数计算法8/7/202190\n第一节线性相关(2)例:从某大学生群体中随机抽取12名女大学生组成样本,分别测得每个学生得身高和体重,试计算身高与体重之间的相关系数。编号身高(cm)体重(kg)XYX2Y2115251775223104260121584672682496421163167559185278893025............12164559020268963025合计1998693115885333470404698/7/202191\n第一节线性相关(3)解:这里r为正值,表示身高与体重呈现正的相关。8/7/202192\n第一节线性相关(4)线性相关系数的检验假设直接查表法n=12,r=0.8342,自由度υ=12-2=10查附表,r0.001(10)=0.823,故P<0.001,拒绝H0。计算统计量tr查t值表,得t0.001(10)=4.587tr>t0.001(10),P<0.001,结果与查r值表一致。8/7/202193\n第二节线性回归(1)线性回归方程的计算其中:8/7/202194\n第二节线性回归(1)例:有人研究了温度对蛙的心率的影响,建立了下表所示的资料,试进行回归分析。对象温度(X)心率(Y)XYX2Y2125104252411441612136116636121......918325763241024合计901792216114043658/7/202195\n第二节线性回归(2)在本例中带入公式得:则回归方程为:8/7/202196\n第三节线性相关与回归的区别与联系区别线性相关表示两个变量之间的相互关系是双向的,回归则反映两个变量之间的单向关系。联系如果对同一资料进行相关与回归分析,则得到的相关系数r与回归方程中的b正负号是相同的;相关回归可以互相解释。8/7/202197\n第四节等级相关(1)如果观测资料是等级资料,则可用等级相关来表示两事物之间的关系。常用的等级相关方法为Spearman等级相关,其计算公式为:8/7/202198\n第四节等级相关(2)例;某医生做了一种研究,欲了解人群中氟骨症患病率与饮水之间的关系,结果见下表,试计算等级相关系数。地区编号饮水中氟含量氟骨症患病率dd2X秩次Y秩次10.48122.372-1120.64223.313-1131.00325.324-1141.47422.2913951.60535.005.5-0.50.2562.86635.005.50.50.2573.21746.0770084.71848.318008/7/202199\n第四节等级相关(3)将X、Y分别从小到大编秩,若遇到相同观测值时,则取平均秩次;计算d2和计算rs8/7/2021100