- 187.70 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
11-多因素实验资料的方差分析11-3(1)本题为4个处理组的2×2析因涉及,因分成3天进行,若将每天的实验结果设为一个区组,先进行随机区组的方差分析:方差分析表1变异来源dfSSMSFSig.总变异11818.369区组间23.7621.881.230.801处理组间3765.529255.17631.196.000误差649.0788.180从上表可以看出,各区组间差异无统计学意义,即各天的实验结果间无差异。(3)依据完全随机设计析因试验方法进行方差分析方差齐性检验表Fdf1df2Sig.1.429380.304P值大于0.05,尚不能认为方差不齐。方差分析表2变异来源dfSSMSFSig.总变异11818.37试样处理方式(A)1716.11716.11108.420.000试样重量(B)136.4036.405.510.047资料\nAB113.0213.021.970.198误差852.846.605结局:可以认为高锰酸盐处理及试样重量均会对甘蓝叶核黄素浓度测定产生影响,尚不能认为高猛酸盐及试样重量的交互作用会对甘蓝叶核黄素浓度测量有影响。11-4假定不存在高阶交互作用,仅对A、B、C、D、E5个因素的主效应进行分析,采用正交设计的方差分析法:正交设计的方差分析变异来源dfSSMSFSig.总变异153495.366A1540.911540.91121.714.001B11743.6891743.68969.998.000C1787.223787.22331.602.000D182.03882.0383.293.100E192.40092.4003.709.083误差10249.10424.910从上表可以看出,A、B、C三个因素的主效应有统计学意义(P<0.05),即A、B、C三个参数对高频呼吸机的通气量有影响。11-5资料\n随机区组的裂区设计,一级实验单位的变异来自于A因素主效应、区组变异及个体间误差,二级实验单位的变异来自于B因素的主效应、AB的交互效应以及个体内的误差,见下表。随机区组裂区设计的方差分析变异来源dfSSMSFSig.二级单位总计19146.1375家兔间(一级单位总计)981.013注射药物(A)163.01363.01347.557.002区组412.7003.1752.396.209个体间误差45.3001.325部位间(一级单位总计)1065.125毒素浓度(B)163.01363.013252.050.000A*B1.113.113.450.521个体内误差82.0000.25从上表结果可以看出:无论是低浓度毒素还是高浓度毒素所致的皮肤损伤,抗毒素注射后的皮肤受损直接均小于对照组,全身注射抗毒素对皮肤损伤有保护作用。资料\n12-重复测量设计资料的方差分析12-2数据为重复测量资料,方差分析表如下:方差分析表变异来源SSdfMSFSig.时间主效应4500.00014500.000238.095.000时间×处理28.800128.8001.524.252个体内误差151.200818.900处理主效应45.000145.0001.837.212个体间误差196.000824.500从上表可以看出:(1)两种方法治疗前后中度甲亢患者心率测量结果有差别(P<0.05)(2)不考虑时间,两种方法心率的主效应未见差别(P>0.05)(3)测量前后与处理不存在交互作用(P>0.05),即两种方法治疗前后心率的变化幅度相同。12-5(1)进行球型检验withinsubjectseffcetMauchly'Wapprox.chi-squaredfSig.EpsilonbGreenhouse-GeisserHuynh-Feldtlower-boundt.11927.0285.000.675.847.333P<0.05,不满足球形检验,需进行校正资料\n(2)重复测量资料方差分析结果测量时间及其与药物剂型交互作用的方差分析表sourceSSdfMSFSig.tsphericityassumed26560.0538853.34974.972.000Greenhouse-Geisser26560.052.02613107.07074.972.000Huynh-Feldt26560.052.54110453.51974.972.000lower-bound26560.05126560.04674.972.000t*Gsphericityassumed16614.5335538.17746.898.000Greenhouse-Geisser16614.532.0268199.07646.898.000Huynh-Feldt16614.532.5416539.15846.898.000lower-bound16614.53116614.53246.898.000error(t)sphericityassumed4959.7642118.089Greenhouse-Geisser4959.7628.369174.827Huynh-Feldt4959.7635.571139.433lower-bound4959.7614354.268新旧剂型患者血药浓度比较的方差分析表sourceSSdfMSFSig.intercept493771.91493771.870729.972.000G59.9159.9160.089.770error9470.014676.425结论:使用不同剂型患者血药浓度没有差别;使用前后患者血药浓度存在明显差别;不同剂型使用前后血药浓度的变化幅度不同。资料\n15-多元线性回归分析(1)以低密度脂蛋白中的胆固醇(Y1)为应变量:方差分析表1变异来源平方和df均方FP回归18530.40844632.6028.0900.00025残差14316.25825572.650总计32846.66729回归参数估计及其检验结果1变量BSbb'tSig.(常量)-0.82947.773-0.0170.986载脂蛋白A10.2330.1970.1651.1810.249载脂蛋白B1.3250.2820.7144.6990.0001载脂蛋白E-0.1242.783-0.008-0.0450.965载脂蛋白C-2.3850.765-0.494-3.1190.005决定系数:R2=0.564调整的决定系数:R2=0.494按α=0.05检验水平,回归方程中X2和X4有统计学意义,即低密度脂蛋白中的胆固醇与载脂蛋白B及C之间存在线性关系。以高密度脂蛋白中的胆固醇(Y2)为应变量:方差分析表2变异来源平方和df均方FP回归4392.58141098.14522.487<0.0001残差1220.8862548.835资料\n总计5613.46729回归参数估计及其检验结果2变量BSbb'tSig.(常量)-2.132313.9511-0.15280.87975载脂蛋白A10.483310.057640.825478.385460.00000载脂蛋白B-0.05270.08235-0.0687-0.64010.52794载脂蛋白E-0.29440.81278-0.0457-0.36220.72027载脂蛋白C-0.4150.22331-0.2078-1.85830.07494决定系数:R2=0.783调整的决定系数:R2=0.748按α=0.05检验水平,回归方程中X1有统计学意义,即高密度脂蛋白中的胆固醇与载脂蛋白A1之间存在线性关系。(2)自变量筛选设定进入、剔除标准分别为α入=0.05和α出=0.10以低密度脂蛋白中的胆固醇(Y1)为应变量,向前法纳入变量为X2、X4,向后法纳入变量为X2、X4,逐步回归法纳入变量为X2、X4,三者结果无差异;以高密度脂蛋白中的胆固醇(Y2)为应变量,向前法纳入变量为X2、X4,向后法纳入变量为X1、X4,逐步回归法纳入变量为X1、X4,三者结果无差异;(3)以X1-X4为自变量,Y2/Y1为应变量,使用逐步回归法分析,设定进入、剔除标准分别为α入=0.05和α出=0.10,结果如下:方差分析表3资料\n变异来源平方和df均方FP回归0.283352730.0944546.84650.0000残差0.0524207260.00202总计0.335773429回归参数估计及其检验结果3变量BSbb'tSig.(常量)0.355430.088474.017750.0004载脂蛋白A10.002640.000360.582887.357160.0000载脂蛋白B-0.00360.00048-0.6116-7.50740.0000载脂蛋白C0.003330.001230.215862.700020.012决定系数:R2=0.844调整的决定系数:R2=0.826与前面的分析结果相比,用Y2/Y1作为应变量,与单独使用Y1或者Y2的回归方程决定系数及调整的决定系数更高,说明高、低密度脂蛋白中的胆固醇含量的比值,较单纯的低密度脂蛋白中胆固醇的含量或者单纯高密度脂蛋白中胆固醇的含量,对诊断动脉硬化lemme个更有意义。(4)残差分析资料\n由标准化残差分析图可以看出,散点分布不是十分均匀,存在先下后上的趋势,并不满足回归分析的条件,且有一个点超过了2,属于离群值。(5)分析结果血清低密度脂蛋白中的胆固醇含量与载脂蛋白B和C有关,与载脂蛋白B成正相关,载脂蛋白C成负相关;高密度脂蛋白与载脂蛋白A1成正相关,载脂蛋白C成负相关;与高、低密度脂蛋白中的胆固醇含量的比值作为综合指标衡量动脉硬化,得到的结果与载脂蛋白A1、B及C有关。资料\n16-Logistics回归二、(1)各因素赋值说明因素变量名赋值性别X1男=0,女=1年龄组X27~=1,10~=2,13~=3,16~=4胆固醇X3<5.18=0,³5.18=1甘油三酯X4<0.50=0,³0.50=1肥胖症Y有=1,无=0将年龄组转化成哑变量水平X2-1X3-1X4-11000210030104001(2)单因素分析参数估计及假设检验1变量BS.E,WalsdfSig.Exp(B)性别X1-.465.1826.5371.011.628常量-1.933.113290.5021.000.145年龄组X2(1)1.087.28514.5401.0002.965年龄组X2(2).585.3103.5591.0591.794资料\n年龄组X2(3)-.260.302.7391.390.771常量-2.494.245103.4321.000.083胆固醇X3.711.21910.5501.0012.035常量-2.256.100511.1381.000.105甘油三酯X4.793.18119.1731.0002.210常量-2.406.116430.0011.000.090从上表可以看出,四个因素对于肥胖的发生都有影响。其中,男性肥胖发生率低于女性;第二个年龄段肥胖发生率最高,而后随着年龄增加风险降低,说明性别和年龄可能对胆固醇及甘油三酯的作用产生混杂。(3)多因素分析1)模型1:认为肥胖的发生只与性别和年龄组相关logitP=β0+β1X1+β2-1X2-1+β3-1X3-1+β4-1X4-1参数估计及假设检验2变量BS.E,WalsdfSig.Exp(B)性别X1-0.4550.1856.06910.0140.635年龄组X2(1)1.0750.28614.15510.0002.930年龄组X2(2)0.5760.3113.44410.0631.780年龄组X2(3)-0.2690.3030.78710.3750.764常量-2.2890.25779.43310.0000.101-2logL1=866.6027072)模型2:认为肥胖的发生与性别、年龄组及胆固醇含量相关资料\nlogitP=β0+β1X1+β2-1X2-1+β3-1X3-1+β4-1X4-1+β3X3参数估计及假设检验3变量BS.E,WalsdfSig.Exp(B)性别X1-0.4510.1855.96410.0150.637年龄组X2(1)1.0340.29712.08410.0012.811年龄组X2(2)0.5560.3133.15410.0761.744年龄组X2(3)-0.2660.3030.77410.3790.766胆固醇X30.1230.2400.26210.6091.131常量-2.2950.25779.63810.0000.101-2logL1=866.343194对X3的回归系数进行假设检验,P>0.05,说明X3没有纳入模型的必要。3)模型3:认为肥胖的发生与性别、年龄组、胆固醇及甘油三酯含量相关logitP=β0+β1X1+β2-1X2-1+β3-1X3-1+β4-1X4-1+β4X4参数估计及假设检验3变量BS.E,WalsdfSig.Exp(B)性别X1-0.5000.1867.19010.0070.607年龄组X2(1)0.9270.29010.23510.0012.528年龄组X2(2)0.4540.3142.08810.1481.574年龄组X2(3)-0.3350.3051.20810.2720.716甘油三酯X40.7030.18714.08110.0002.020资料\n常量-2.4160.26185.72710.0000.089-2logL1=852.959317引入X4后,对其回归系数进行检验,P<0.05,说明扣除性别与年龄影响后,甘油三酯与肥胖仍存在明显关系。对模型1、2、3的似然值进行比较,模型3<模型1,说明模型3优于模型1,使用模型3拟合效果更好。资料\n20-判别分析20-1Bayes判别(1)先验概率:p=1/3(2)判别函数计算Bayes线性判别函数系数估计值1变量判别函数Y1Y2Y3X1.028.156.086X22.2853.7454.400X3.7562.301.390X42.901-.0111.063X52.1261.674-.160X6.055.137.112X7.078-.134.042(常量)-4.920-12.776-7.763Y1=0.028X1+2.285X2+0.756X3+2.901X4+2.126X5+0.055X6+0.078X7-4.920Y2=0.156X1+3.745X2+2.301X3-0.011X4+1.674X5+0.137X6-0.134X7-12.776Y3=0.086X1+4.400X2+0.390X3+1.063X4-0.160X5+0.112X6+0.042X7-7.763(3)判别效果评价:回顾性估计误判概率8/63=12.70%回顾性判别效果评价原分类判别分类合计资料\n123129033221102133111618合计31112163逐步判别(1)确定变量筛选α、b:给定α=0.05,b=0.1;(2)筛选变量第一步:X1入选,F=28.028;第二步:X5入选,F=17.519;第三步:X6入选,F=15.307;第四步:X7入选,F=13.211;(3)先验概率取等概率,建立Bayes判别函数Bayes线性判别函数系数估计值2变量判别函数Y1Y2Y3X10.0120.1190.058X53.0201.9220.792X60.0490.1270.105X70.111-0.0520.109(常量)-3.631-9.784-5.749资料\nY1=0.012X1+3.020X5+0.049X6+0.111X7-3.631Y2=0.119X1+1.922X5+0.127X6-0.052X7-9.784Y3=0.058X1+0.792X5+0.105X6+0.109X7-5.749(4)判别效果评价回顾性估计误判概率为12/63=19.05%原分类判别分类合计123127053221102133221418合计30122163资料\n21-聚类分析21-11使用系统聚类法(最大相似系数法)对变量进行聚类图21-1根据系统分类图(图21-1),若分为三类,则X6、X12、X3、X1、X10、X7、X5、X2、X8、X11为一类,X4为一类,X9为一类。2使用系统聚类法(类平均法)对样品进行聚类图21-2资料\n根据系统分类图(图21-2),若分为三类,则13、16、15、29、14、23、24、21、22、12、28、10、17、11、20为一类,1、6为一类,8、9、2、3、7、4、5为一类。3使用动态聚类法对样品进行聚类根据SPSS结果,分成以下三类。类别样品编号11、6、9210、11、12、13、14、15、16、17、28、29、20、21、22、23、2432、3、4、5、7、821-31使用系统聚类法(类平均法)对指标进行聚类图21-3资料\n根据系统分类图(图21-3),若分为三类,则可食率、果形指数、风味、色泽、TA为一类,维生素C含量、硬度、TSS、固酸比为一类,单果重为一类。2使用系统聚类法(最大相似系数法)对指标进行聚类图21-4根据系统分类图(图21-4),若分为三类,则4为一类,54为一类,其余为一类。资料\n22-主成分分析与因子分析22-1主成分分析利用SPSS进行主成分分析,得到如下结果(表22-1至表22-)表22-1简单统计量Cppicpmapsbpdbp均值0.0517-0.02730.0050-0.00600.0773标准差0.15950.23660.21820.12300.1746表22-2相关矩阵的特征值成份初始特征值贡献率累积贡献率13.16963.38563.3852.99519.90783.2923.50110.01193.3034.3256.49299.7965.010.204100.000表22-3相关矩阵的特征向量Z1Z2Z3Z4Z5Cpp.950-.239-.170-.074.077icp.248.966-.072.017.018map.771.029.635.042.000sbp.878-.064-.209.425-.033dbp.917.023-.138-.370-.053资料\n图22-1碎石图1.1主成分个数的选择从表22-2虽然只有第一个特征值大于1,但结合累积贡献率和碎石图,取前三个主成分为宜。1.2主成分表达式由表22-3根据各主成分所对应的特征向量,可得出前三个主成分为Z1=0.950CPP+0.248ICP+0.771MAP+0.878SBP+0.917DBPZ2=-0.239CPP+0.966ICP+0.029MAP-0.064SBP+0.023DBPZ3=-0.170CPP-0.072ICP+0.635MAP-0.209SBP-0.138DBP1.3因子载荷阵表22-4因子载荷矩阵Z1Z2Z3Z4Z5Cpp1.691-.425-.302-.132.137icp.247.964-.072.017.018map.545.021.450.029.000sbp.500-.036-.119.242-.019资料\ndbp.093.002-.014-.037-.005由因子载荷阵可知,第一主成分Z1与Cpp、map和sbp关系较为密切,第二主成分Z2与Cpp、icp关系较为密切,第三主成分与Cpp、map关系较为密切,dbp与三个主成分关系均一般。22-2因子分析约相关矩阵的特征值、因子载荷阵与表22-2、22-3相同。由表22-2虽然只有第一个特征值大于1,但其贡献率不足70%,故考虑提取前3个公因子。表22-5因子载荷阵因子1因子2因子3Cpp0.950-0.239-0.170icp0.2480.966-0.072map0.7710.0290.635sbp0.878-0.064-0.209dbp0.9170.023-0.138表22-6主成分因子分析后的公共度Cppicpmapsbpdbp0.9890.9990.9980.8180.861竖读表22-5发现因子1在多数原始指标上都有较大的载荷,因子2在icp上有较大的载荷,因子3在map上有较大的载荷;由表22-6可知,各共性方差均超过80%,说明3个公因子已经能够较好反应各指标包括的大部分信息。资料\n27-常用综合评价方法二、1、TOPSIS法评价某医院5年的医疗质量(1)原始数据年度X1X2X3X4X5X6X719942158476.77.31.0178.397.5219952437286.37.40.891.198219962204181.87.30.6291.197.33.219972111584.56.90.690.297.72.919982463390.36.90.2595.597.93.6(2)评价指标同趋势化X1-X7中,X1、X2、X3、X5、X6为高优指标,X4、X7为低优指标,估取其倒数,将所有指标同趋势化,数据如下:年度X1X2X3X4X5X6X719942158476.70.1370.99078.397.50.50019952437286.30.1351.25091.198.00.50019962204181.80.1371.61391.197.30.31319972111584.50.1451.66790.297.70.34519982463390.30.1454.00095.597.90.278(3)归一化处理进行归一化处理后得到如下矩阵:年度X1X2X3X4X5X6X7资料\n19940.4230.4080.4380.2020.3920.4460.56119950.4780.4590.4320.2560.4560.4490.56119960.4320.4350.4380.3300.4560.4450.35119970.4140.4500.4630.3410.4510.4470.38719980.4830.4810.4630.8180.4780.4480.312(4)确定有限方案中的最优方案及最劣方案最优方案A-=(0.483,0.481,0.463,0.818,0.478,0.449,0.561)最劣方案A+=(0.414,0.408,0.432,0.202,0.392,0.445,0.312)(5)计算评价对象各指标值与最优方案及最劣方案的距离Di+与Di-,见下表(6)计算与最优方法的接近程度Ci,见下表(7)按Ci大小将评价对象排序,见下表年度Di+Di-Ci排序结果19940.2500.6290.284319950.2750.5640.328219960.1510.5370.220519970.1760.5140.255419980.6300.2490.7161根据排序结果可以看出,该医院1998年医疗质量最高,1996年最差。2、使用秩和比法(RSR)对不同职业生殖结局进行综合评价(1)对原始数据进行编秩:见下表高优指标由小到大,低优指标由大到小,资料\n同一指标数值相同者编平均秩。X1-X4均为低优指标,故由大到小编秩。(2)计算秩和比,并由大到小进行排序,见下表。职业X1R1X2R2X3R3X4R4RSR排序112.0249.02617.79436.1170.66322.64811.44412.32736.9060.78132.8478.52717.05564.3320.663413.1629.87516.45633.4480.66357.48612.47321.20337.1350.534613.73133.79148.57189.1610.13677.51512.88221.46254.0830.385812.1832.7186.77837.2440.722(3)确定RSR分布RSRƒ∑ƒRProbit0.125111112.53.850.3751222254.330.531133337.54.670.656364,5,6562.55.320.719177787.56.150.781188897.56.96(4)计算回归方程RSR=-0.468+0.1917probit(F=20.119P=0.011)(5)分档排序资料\n若分为3档,依据各分档情况下概率单位Probit值,按照回归方程推算所对应的RSR估计值对评价对象进行分档排序。等级PxprobitRSR分档排序结果下