- 41.00 KB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第七章大田试验的统计学问题LarryNelson美国北克罗来纳州立大学统计学离休教授 为了使农户能把自己的生产实践与推荐措施作比较,有关如何进行大田试验的报道已经有很多了。那么是否有大田试验设计的新方法呢?事实上,传统的方法已经足够了,但在欠发达国家大田周围的环境规划的失误和试验过程的不精心所引起的问题是难以用传统方法所获得的数据来进行分析的。最糟糕的是,有时统计学家所面临的是根本不能反映任何问题的试验设计和操作过程。变化的小区面积、试验小区间农户管理措施不一致、较差的生产和栽培管理技术都是很平常的。在这些时候,统计学家是诚实的,他不得不告诉研究人员,这样的试验只能用于示范了。 在这次讨论中,我们并不希望涉及大田试验的各个方面,我们要做的只是研究一下其内在的规律,而不是为每种特殊情况都列出分析方案。 如果某人想对任何试验的数据进行统计学检验,就可以应用某些确定的试验设计规则,这些规则是相同的,并被广泛应用于农业和生物学中的各种形式的试验设计。SirRonald\nFisher的三个设计原则非常重要:1)随机性;2)重复性;3)区域控制(区组)。Cochran和Cox(1957)对这三个设计原则有进一步的论述。第三个原则对于大田试验是非常重要的,因为在那里经常会存在很大的变异,区组控制当然是必需的。最理想的情况是,区组应该设置在同一农户里,但在欠发达国家,农户的大小会成为限制因素。在这种情况下,人们会在几个邻近的农户里设置区组。这就产生了各个农户管理不一致(种子使用量、品种、肥料施用量等)的问题,因而许多管理因素会与处理相互作用,并由于这种交互作用而导致一个更大的区组。这就要求对试验误差的有更大估计,因此,显著性检验并不十分敏感。甚至区组与区组之间的处理也可能不一致。例如,在一次试验中,如果农户的生产管理水平存在着户与户之间的差异就会导致一系列问题,因为处理与区组发生了混淆。因而,在试验中必须统一农户的生产管理水平,在系列试验中也应该如此。在其它的任何处理中也应坚持这一点,也就是说,在每个试验中的处理都要保持一致。 在农场试验中应严格坚持随机性要求。如果在试验前有周密的计划,这一点应该不成问题。在系列试验的每个试验中都应有独立的随机性。\n 不但试验需要重复性,在每次试验的内部也需要重复性。这可以使我们能更概括地检验和说明每个试验。如果需要几个农场(一个农场设置一个区组)来布置试验,正如以上所述,设置t个试验,每个试验安排在r个农场里。这样,每个试验中的处理数经常不是很大,所以我们需要设置更多的重复以保证试验误差自由度的最小数量(10-12)。如果处理数是4就要设至少5次重复以保证最小的自由度。从我的农场试验经验来看,重复数越多越好,因为我们经常会遇到很大的变异。如果没有足够的资金或劳动力来重复试验,那最好就放弃它,把资金投入到成功的可能性比较大的项目上。 为达到目标没有必要进行上百次的系列试验,20到30次规划完善、精心实施的试验要比上百次计划不当的系列试验好得多。困为,按着统计学观点,任何试验都会有一些限制条件。大量试验只有在一种情况下是有用的,那就是当我们试图建立适当转换,并想根据一个随机试验样本来确定适当的转换方式的时候,这种转换就可以利用其它试验的数据。 应该强调的是,使用的格式应是普通系列试验的格式。分析的机制也应遵循一般的格式。经常出现问题的是那些与概念和特征而不是与机制有关的地方。例如,如果农户的生产管理方式在区组间存在着差异,我们也可以进行计算,但分析结果却不能代表农户的处理。从机理上说,分析是可以的,但它并没有任何意义,因为区组和处理都不是独立的。在总结系列试验之前,没有更好的办法用来确定会出现多少代表性方面的问题。如果没有可以用来分析的数据,那么,这个试验也只能用作示范目的了。 第7-1节.方差的适当分析\n (表:对来自各试验的数据应进行方差分析)来源d.f.重复(r-1)处理(t-1)误差(r-1)(t-1)总和rt-1 这里,处理是用误差均方来检验的,另外,应对所有试验的数据进行综合方差分析。格式如下: (表:表)来源d.f.试验(p-1)重复(试验)p(r-1)处理(t-1)试验×处理(p-1)(t-1)误差p(r-1)(t-1)总和(corr.)prt-1\n Cochran和Cox(1957)对在分析中如何确定平方和和均方的机制进行了描述。假定试验和重复是随机的而处理是固定的,处理就可以用试验×处理均方检验而试验×处理就可以用误差均方来检验。如果试验×处理在高概率水平(如0.25)上不显著,那么就可以合并试验×处理和误差均方,并用合并的误差均方来检验处理。 第7-2节.常见问题及解决办法 象以上谈到的那样,最普遍的问题是在一个独立试验中处理很易于与区组相互作用,而这却违背了方差分析中的假设条件,即处理和区组都是独立的。这会使显著性检验变得很保守,所表现的概率水平也令人怀疑。在使用Tukey的非加性效应测验时就会出现这样的问题(Snededcor和Cochran,1989)。这种方法可以用作转换方式的参考,并可以了解是否这种转换产生了附加性。实际上,在对从系列试验中随机选择的1/4个试验进行方差分析之后,利用Tukey的处理过程来确定X的主效应,如在等式Y=Xp中效应就是可加性的,这里Y是被转换的变量,X是初始变量,而是P转换的指数,通过这些步骤变可以完成上面的后两步。我们可利用这种对数据的转换来检验许多独立试验的非加性,以确定转换是否恰当。如果恰当,那么来自每个试验的数据就可以用这个转换等式来转换了。\n 上面的这种方式可以用在非加性不是十分重要的情况下。有些农场数据可能不能用来转换,这时的试验也只能用于示范目的了。关键是下一次试验一定要做好周密的计划并认真地执行以保证那些严重的问题不再发生。 第二个问题是试验之间存在的试验误差的非均质性。甚至在有良好控制条件的试验站里的试验也有这种情况存在,其原因是在位点之间存在着与处理相互作用的不同程度的环境变异。Cochran和Cox(1975)认为在综合一系列试验数据的时候,误差方差和试验间×处理间交互作用的非均质性是一个非常严重的问题。然而,我们感兴趣的是试验×处理的交互作用在这些农场试验里会不会变得很大,因此,即使测验的合并试验误差没有被精确地校正也不会有什么问题,因为我们一直在做正确的推断。 \n我们感兴趣的另一个方面是当试验间×处理间交互作用很大时,误差方差的不均等对与误差均方互相对应的处理检验影响很小。然而,在这种情况下,交互作用均方可能是异质的。处理的方法是把自由度在处理间作合理比较,然后用它的适当误差来检验。例如,如果想把农户的生产方式与处理进行对比的话,我们可以找到这种对比的平方和,然后与交互作用对照进行检验,即试验间×(农户生产方式对比处理B)。把处理和试验×处理交互作用组分对照进行检验,是很有用的解释手段。它不但可以排除数据统计上的问题,也可以使解释更加明确。我们可以利用Bartlett和Hartley的方法来检验误差方差的异质性。对系列试验的方差标准化经常要用到的转换方法是对数转换。无论怎样,我们只希望采用如上面Tukey方法那样的转换方式来完成试验间数据方差的标准化。 有非加性和方差异质性问题存在时,可以使用另一种统计学方法,即用Friedman检验来分析数据。Friedman是一个Two-wayClassification的非参数过程,除了平常的假设条件不被要求外,它与进行随机区组试验的方差分析非常相似。这种方法有一定的优势,至少它会坚持方差分析中的假设条件。 第7-3节.Friedman方法(1937) 1)在每个区组内把处理由低到高分级; 2)得到每个处理的分级总数; 3)检验虚假设:在一个区组内的群体是一致的,与至少有一个处理来自于在一个方向上处于不同位置的群体相比较。 检验标准是:Xr2=[12/bt(t+1)]ri2-3b(t+1),自由度为t-1。t是处理数,b是区组数,ri\n是第i处理的分级总和,12和3是与试验大小无关的常数。这是一种粗略的检验,在b和t较小的时候并不十分合适。对于系列试验综合方差分析来说,似乎不存在非参数等量,可能最好的办法是对每个试验都进行Friedman检验,然后把所有系列试验的显著性检测结果在一个表中表示出来。 过去,在使用参数方法过程中遇到的最严重的问题可能是缺区问题,然而,随着现代统计和计算技术的发展,这个问题已经被解决了,即把试验、重复和处理作为分级变量,然后调整它们各自的变异来源,再用回归分析程序来进行方差分析。如果缺少有效的硬件或软件,还可以使用在一些统计方法著作中讨论过的传统方法,如YatesProcedure来消除不平衡因素。 第7-4节.示范性农场试验的价值 农场试验对示范来说很重要,即使它存在着许多上面讨论过的问题,也不适合进行统计分析,但在为农户展示说明推荐方法与他们的传统生产方式相比有很大优越性的时候,这些试验就会发挥它们的作用。这些田间试验的表面现象就足以说明推荐方法的优势。应当承认,许多数据并不能为处理间的相互对比提供令人满意的数量根据,能具有示范作用的也已经很不错了。在许多时候,农户的生产方式都无法与推荐方法相比拟。即使不能进行正常的统计分析,推荐试验也能在一定程度上说明问题。 第7-5节.总结\n 从原理上看,大田试验与任何其它的试验没有什么不同,只是它们需要更多的控制和周密的规划。我们是否能得到满意的结果往往就取决于试验规划的完善程度和实施的精细程度。在开始就打算利用某种统计学方法分析一大堆数据从而想得出某种结论是完全错误的。正确的过程是,详细规划试验,使用适当的试验设计并在实施的时候尽可能地控制所有因素,最后使用标准的统计分析过程。 在这些试验中,分析机制并不是限制因素。可能产生问题的是许多生物学限制因素。我们不能机械地比较那些代表或不能代表我们思路的想法。 在许多数据并不十分混乱的例子中讨论了数据转换的问题。另一种方法是使用Friedman检验,它是一个不依赖方差分析中的一般假设条件的非参数测验。与方差等量的分析相比它不易发现差异。但至少它始终是坚持假设条件的。 我们应该保持诚实。如果试验出现设计失误或缺少适当的试验控制就不妨把它用于示范目的,在这种情况下,即使用统计方法分析了结果也会因有太大的代表性误差而没有任何意义。这些试验中的变异也很大以致于显著性的变化并不是十分明显。