更新时间:2023-03-29 20:35
在有一个或几个因子(自变量)的多水平的实验中,描述一个因子在各水平上对反应量(因变量)影响大小的度量。对有S个水平的单因子A的试验,若随机变量 yij是在第 j次试验中于第 i个水平上的观测值,则模型为E(yij)=μ+ai,(i=1,2,...,s,j=1,2,...,ni),这里E是期望, μ是总平均, ai即A因子第 i个水平的主效应。应当注意的是,由于它在平均意义上进行估算,所以即使一个主效应的值比较小,也不表明该因子不重要;同时,在交互作用显著的情况下,对主效应的直观解释可能会发生误解。在有的实验研究中,主效应并不一定比交互作用更为重要。在实验设计中,只有主效应而不考虑交互效应的模型,称为可加性模型,这在区组设计中常常使用。
在有一个或几个因子(自变量)的多水平的实验中,描述一个因子在各水平上对反应量(因变量)影响大小的度量。对有S个水平的单因子A的试验,若随机变量 是在第 次试验中于第 个水平上的观测值,则模型为
这里E是期望, 是总平均, 即A因子第 个水平的主效应。应当注意的是,由于它在平均意义上进行估算,所以即使一个主效应的值比较小,也不表明该因子不重要;同时,在交互作用显著的情况下,对主效应的直观解释可能会发生误解。在有的实验研究中,主效应并不一定比交互作用更为重要。在实验设计中,只有主效应而不考虑交互效应的模型,称为可加性模型,这在区组设计中常常使用。
因素的主效应和因素之间的交互作用是析因试验设计中的两个基本概念。考虑两个2水平因素的析因试验,设因素A的两个水平为 和 ,因素B的两个水平为 ,它们的所有可能的水平组合为 ,如表1(0)所示,称其为22析因试验。这里约定, 既代表因素水平组合或处理,又表示在这种因素水平组合或处理下的指标真值或响应值。因素主效应反映因素对指标的影响大小,常用其响应值的改变量来表示。在22析因试验中,对于因素A,当因素B取B1时,A从A1变为A2所引起的响应值的变化为 ;当因素B取B2时,A从A1变为A2所引起的响应值的变化为 。这两个响应值的改变量称为A的两个简单效应。因素的简单效应描述了其它因素固定情况下这个因素对指标的影响大小。因素A的主效应自然应定义为A的两个简单效应的平均值。它也可表示为A取A1时响应的平均值 与A取A2时响应的平均值 之差。因素A的主效应常用同一大写字母A表示,于是
类似可定义因素B的主效应为
表1(I)、(Ⅱ)是两个22析因试验的数字例子。由上述定义可知,对于(I),
对于(Ⅱ),
因素间的交互作用是指因素之间的一种搭配作用。在22析因试验中,如果因素A在两个水平上的响应值的改变量,不管因素B的水平如何都是一样的,即A对指标的影响与B取什么水平无关,那么我们就说因素A与B之间没有交互作用或A与B之间的交互作用为零,如果因素A在两个水平上的响应值的改变量随着因素B的水平不同而不一样,即A对指标的影响取决于B取什么水平,那么我们就说因素A与B之间存在交互作用,其大小通常用因素B取B2时A从A1变为A2所引起的响应值的改变量 减去因素B取B1时A从A1变为A2所引起的响应值的改变量再除以2来表示。因素A与B的交互作用记为A×B,或简记为AB。于是
即它也等于A与B都取第1水平和第2水平时的响应值的和与A或B只取第1水平或第2水平时的响应值的和之差的一半。按此定义,对于表1中的(I),有A×B=0,对于表1中的(Ⅱ),有A×B=-29,这说明表1(I)中的两个因素没有交互作用,而表1(Ⅱ)中的两个因素有交互作用。它们可分别画出如图1(a)和(b)所示的图形。从图上看出,没有交互作用画出的两条直线是平行的,有交互作用画出的两条直线是相交的。
主效应和交互作用统称为析因效应或简称效应。在分析时它们需要同时加以考虑。当因素之间的交互作用很小时,各个因素对指标的影响可以看作是相互独立的,一个因素对指标影响的大小用该因素的主效应表示。当因素之间的交互作用很大时,各个因素的主效应意义就不大了。例如,在表1(Ⅱ)的例中,前已算出因素A的主效应A=1,相对说来是比较小的,但我们不能轻易就说因素A对指标的影响不大。因为因素A与B的交互作甩A×B=-29,其绝对值相当大。这表明因素A对指标有影响,只是这种影响与因素B的水平有关。交互作用提供的信息有时比主效应的更有用。大的交互作用往往掩盖住了主效应的真实情况。表1(Ⅱ)的例子说明了这点。在交互作用比较大的场合,要对一个因素作出推断,试验者必须考察这个因素的各个水平与另一个因素的各个水平的种种搭配情况下的表现,加以比较后再作结论。
多因素析因试验较之传统的每次试验一个因素的多因素试验方法有着明显的优点。首先,多因素析因试验不仅能考察各因素的主效应,还能分析因素之间的交互作用。它不象每次一个因素的试验只能考察各个因素的单独影响,因而析因试验所得结论一般说来比每次一个因素的试验更符合实际。例如,在一项两个2水平因素的试验中,假如每次一个因素的试验显示出A1B2比A1B1好,A2B1比A1B1好, 那么一个自然的推论应是A2B2会更好。然而,当因素之间存在交互作用时,这个结论可能是完全错误的。表1(Ⅱ)的数字例子就属于这种情况。其次,由于析因试验的全部观测值能一起用来分析各个因素对指标的影响,而每次一个因素的试验只能用一个因素的试验结果单独分析这个因素的作用,所以要达到同样的分析精度,每次一个因素的试验所需要的试验次数一般比析因试验的多,即析因试验更有效。例如,在一项两个2水平因素试验中,每次一个因素进行试验,因素A的一个简单效应为A2B1-A1B1,因素B的一个简单效应为A1B2 -A1B1。因为试验存在误差,为了能用观测到的简单效应的平均值估计两个因素的效应,每种处理必须进行(比如说)两次试验。这时共需作6次试验。但若施行析因试验,则只需增加一个试验A2B2,即可求得因素A的两个效应A2B1-A1B1,A2B2-A1B2的估计以及B的两个简单效应A1B2-A1B1,A2B2-A2B1的估计,分别加以平均就可求得A与B的主效应的估计。可以证明,这样两种试验的精度是一致的。但这时的析因试验只要作4次试验。再者,由于析因试验考察一个因素时是在其它因素的不同水平上进行的,因而所得结论能用于比较广泛的试验条件。析因试验的主要缺点是,当考察的因素比较多时,所需要的试验次数太多。例如,10个2水平因素的析因试验的所有可能的水平组合有210=1024,7个3水平因素的析因试验的所有可能的水平组合有37=2181等。与此有关的是试验太多就很难保持试验环境的一致。为了克服析因试验的这些困难,统计学家已成功地研究出了一套诸如部分析因试验、混杂法和强调效率的多因素试验方法。