- 168.50 KB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
生物统计学教案第八章单因素方差分析教学时间:5学时教学方法:课堂板书讲授教学目的:重点掌握方差分析的方法步骤,掌握单因素和两因素的方差分析,了解多重比较的一些常用方法讲授难点:掌握单因素和两因素的方差分析8.1方差分析的基本原理8.1.1方差分析的一般概念第五章讲过两个平均数差异性的比较可用t检验,在多组数据之间作比较便需要通过方差分析来完成。在多组数据之间作比较可以在两两平均数之间比较,但会提高犯I型错误的概率。最简单的方差分析是单因素方差分析。下面举例说明。例1调查5个不同小麦品系株高,结果见下表:品系IIIIIIIVV164.664.567.871.869.2265.365.366.372.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5和326.5322.0336.5354.0343.0平均数65.364.467.370.868.6例2从每窝均有4只幼仔的初生动物中,随机选择4窝,称量每只动物的出生重,结果如下:窝别IIIIIIIV77\n134.733.227.132.9233.326.023.331.4326.228.627.825.7431.632.326.728.0和125.8120.1104.9118.0平均数31.45030.02526.22529.500这两个例子都只有一个因素,例1是“品系”,例2是“窝别”。在每个因素下,又有a个水平(或称为处理),例1有5个品系,例2有4个窝别。a个水平可以认为是a个总体,表中的数据是从a个总体中抽出的a个样本。方差分析的目的就是由这a个样本推断a个总体。因为上述实验都只有一个因素,对这样的数据所进行的方差分析称为“单因素方差分析”。单因素方差分析的典型数据见下表。X1X2X3…Xi…Xa1x11x21x31xi1xa12x12x22x32xi2xa23x13x23x33xi3xa3┇jx1jx2jx3jxijxaj┇nx1nx2nx3nxinxan平均数x1.x2.x3.xi.xa.表中的xij表示第i次处理下的第j次观测值,下标中的“.”表示求和,具体说明如下:77\n8.1.2不同处理效应与不同模型线性统计模型:模型中的xij是在i水平下的第j次观测值。μ是对所有观测值的一个参数,称为总平均数。αi是仅对第i次处理的一个参数,称为第i次处理效应。εij是随机误差成分,要求误差是服从N(0,σ2)的独立随机变量。固定因素:①因素的水平确定后,因素的效应即被确定。②因素的a个水平是人为特意选择的。③方差分析所得结论只适用于所选定的a个水平。固定效应模型:处理固定因素所使用的模型。随机因素:①因素的水平确定之后,其效应并不固定。②因素的a个水平是从水平总体中随机抽取的。③从随机因素的a个水平所得到的结论,可推广到该因素的所有水平上。随机效应模型:处理随机因素所使用的模型。8.2固定效应模型8.2.1线性统计模型其中αi是处理平均数与总平均数的离差,因这些离差的正负值相当,因此如果不存在处理效应,各αi都应当等于0,否则至少有一个αi≠0。因此,零假设为:H0:α1=α2=…=αa=0备择假设为:HA:αi≠0(至少有一个i)77\n8.2.2平方和与自由度的分解对于每个固定的xi.,因此,以SST表示总平方和,SSA表示处理平方和,SSe表示误差平方和,三者关系为:SST=SSA=SSe自由度可做同样的分割:dfT=dfA+dfedfT=an-1dfA=a-1dfe=an-a为了得出检验统计量,以处理平方和与误差平方和除以相应的自由度,得出相应的均方。MSe=SSe/dfeMSA=SSA/dfA。8.2.3均方期望与统计量F77\nMSe是σ2的无偏估计量,证明如下:用同样的方法可以得出MSA的均方期望。77\n因为E(εij)=0,故所有包含εij乘积项的数学期望都等于0于是:由以上结果可以看出,误差均方MSe是σ2的无偏估计量。对处理项来说,只有当αi=0时,MSA才是σ2的无偏估计量。用MSA和MSe比较,便可以反映出αi的大小。为此,使用统计量F作为检验统计量,做上尾单侧检验。F=MSA/MSe,具dfA,dfe77\n自由度,当FFα时拒绝零假设,处理平均数间差异显著。在中,令则处理均方可表示为这时的零假设可以记为H0:ηα2=0。备择假设记为HA:ηα2>0。将上述结果列在方差分析表中变差来源平方和自由度均方F均方期望处理间SSAa-1MSAMSA/MSeσ2+nηα2误差SSena-aMSeσ2总和SSTna-18.2.4平方和的简易计算令C称为校正项。误差平方和SSe=SST-SSA将例1中的每个数据都减去65,编码后列成下表。77\n品系IIIIIIIVV1-0.4-0.52.86.84.220.30.31.37.13.23-0.2-0.42.15.04.841.0-1.31.84.13.350.8-1.13.56.02.5总和xi.1.5-3.011.529.018.057.0xi.22.259.00132.25841.00324.001308.50Σxij21.933.4029.43174.4668.06277.28将以上结果列成方差分析表:变差来源平方和自由度均方F品系间131.74432.9442.23**误差15.58200.78总和147.3224**α=0.01F4,20,0.05=2.87,F4,20,0.01=4.43。F>F0.01。P<0.01因此,上述5个不同小麦品系株高差异极显著。习惯上以“*”表示在α=0.05水平上差异显著,以“**”表示在α=0.01水平上差异显著。8.3随机效应模型77\n8.3.1线性统计模型其中μ为总平均数,αi为服从N(0,σα2)的独立随机变量,εij为服从N(0,σ2)的独立随机变量。在随机模型中,不是检验单个处理效应的有无,而是检验αi是否存在变异性。因此接受H0表示处理间没有差异,拒绝H0意味着处理间存在差异。8.3.2均方期望及统计量F在随机模型中,因为αi是独立随机变量,因此MSA的数学期望与固定模型不同。MSA的数学期望:同理可证用检验统计量F做上尾单侧检验:F=MSA/MSe。当F>Fa-1,an-a,α时拒绝H0。MSA的期望组成除包含误差方差外,还包含处理项方差,表明不同处理间存在差异。方差分析的程序与固定模型相同,但由于获得样本的方式不同,使之所得结果也不同。随机模型适用于水平总体,而固定模型仅适用于所选定的a77\n个水平。以下是例2的计算结果,将每一数据均减去30。4.73.2-2.92.93.3-4.0-6.71.4-3.8-1.4-2.2-4.31.62.3-3.3-2.0总和xi.5.80.1-15.1-2.0-11.2xi.233.640.01228.014.00265.66Σxij249.9833.4969.0332.86185.36将上述结果列成方差分析表变差来源平方和自由度均方F窝间58.575319.5251.97误差118.945129.912总和177.62015F3,12,0.05=3.49,F0.05,接受H0。结论是不同窝别动物出生重没有显著差异。8.4多重比较8.4.1最小显著差数法(LSD)平均数差数的显著性检验公式为:77\n当n1=n2时,当差异显著时后边式子,大于号的右侧称为最小显著差数,记为LSD。8.4.2Duncan检验检验程序:①将需要比较的a个平均数依次排列好,使之:并将每一对平均数的差列成下表:②算出不同对平均数的差的临界值Rk。其中上式中的k是要比较的两个平均数之间所包含的平均数的个数。当两个平均数相邻时k=2,中间隔一个时k=3等。平均数共有a个,所以需从附表9中查出a-1个rα,得到a-1个临界值Rk。77\n③每两个平均数的差与相应的临界值比较,显著的打上一个星花“*”,极显著的打上两个星花“**”。下面对5个小麦品系株高平均数做duncan多重比较.首先将平均数按从高到低顺序排列好。品系号IVVIIIIII平均数70.868.667.365.364.4顺序号12345根据MSe=0.78,n=5,df=a(n-1)=20,k=2,3,4,5。将临界值列成表。k2345k2345r0.052.953.103.183.25r0.014.024.224.334.40Rk1.1651.2251.2561.284Rk1.5881.6671.7101.738再以α=0.05和α=0.01水平上的临界值与下表中的平均数的差做比较,差异显著的打上“*”,差异极显著的打上“**”。8.5.1方差分析应具备的条件1、可加性:各处理效应与误差效应是可加的。2、正态性:ε:NID(0,σ2)3、方差齐性:各处理的误差方差应具备齐性。77